·
Engenharia Industrial Madeireira ·
Estatística Experimental
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
7
Exercícios Estatística Exp 2021 2
Estatística Experimental
UFES
34
Slide - Análise de Regressão - 2023-1
Estatística Experimental
UFES
82
Slide - Introdução à Análise de Regressão - 2023-1
Estatística Experimental
UFES
6
Lista - Fatorial Parcelas Subdivididas Correlação e Regressão - Estatística Experimental 2023-1
Estatística Experimental
UFES
68
Slide - Regressão Linear Múltipla - 2023-1
Estatística Experimental
UFES
3
Lista 6 - Métodos Estatísticos 1 - 2023-1
Estatística Experimental
UFES
Texto de pré-visualização
CAPÍTULO VI – TESTES DE HIPÓTESES Prof. Gilson Fernandes da Silva Departamento de Ciências Florestais e da Madeira (DCFM) Programa de Pós-graduação em Ciências Florestais (PGCF) Universidade Federal Espírito Santo (UFES) 1. OBJETIVOS DO CAPÍTULO VI - Apresentar conceitos básicos sobre a aplicação de testes de hipótese. - Apresentar a teoria e exercícios práticos de aplicação do teste Z. - Apresentar a teoria e exercícios práticos de aplicação do teste F e do teste t. - Apresentar a teoria e exercícios práticos de aplicação do teste de Qui-quadrado. 2. CONCEITOS BÁSICOS SOBRE TESTES DE HIPÓTESES TESTE ESTATÍSTICO DE HIPÓTESE: É uma regra decisória que nos permite rejeitar ou não uma hipótese estatística com base nos resultados de uma amostra. POPULAÇÃO: É o conjunto de valores da variável, associados a todos os elementos de um conjunto, que têm em comum determinada característica. AMOSTRA: É um subconjunto da população. Pode ser entendida como o conjunto de informações colhidas de parte da população, com vistas a se inferir sobre ela (população). INFERÊNCIA ESTATÍSTICA: Tem por objetivo fazer generalizações sobre uma população com base em dados de uma amostra. Se fundamenta na teoria da probabilidade, diferentemente dos métodos descritivos. PARÂMETRO: É uma medida usada para descrever uma característica da população. Em geral, é um valor desconhecido. ESTIMADOR: Um estimador de um parâmetro é qualquer função das observações da amostra aleatória X1, X2, ... , Xn. Ele representa uma dada fórmula de cálculo que fornecerá valores diferentes de acordo com a amostra selecionada. Exemplos: i) O estimador da média é 𝜇 = 𝑋 = 𝑋𝑖 𝑛 𝑖=1 𝑛 ii) O estimador da variância 2 é 𝜎2 = 𝑠2 = 𝑋𝑖−𝑋 2 𝑛 𝑖=1 𝑛−1 = 𝑋𝑖 2− 𝑋𝑖 𝑛 𝑖=1 2 𝑛 𝑛 𝑖=1 𝑛−1 Obs: Estimativa é o valor assumido pelo estimador. Hipótese estatística é a suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico, ou uma afirmação quanto à natureza da população, que será verificada por um teste de aderência. As hipóteses estatísticas devem ser formuladas de modo a minimizar os erros de decisão. Exemplos: - A média de altura dos estudantes da UFES é de 168 cm. - A distribuição de diâmetros de uma floresta é a normal. - A proporção de árvores com defeito em uma floresta é de 5%. 3. HIPÓTESE ESTATÍSTICA 3.1. Hipótese de nulidade (H0) É a hipótese a ser testada. A hipótese H0 é formulada com o “expresso propósito de ser rejeitada” e os testes são construídos sob a pressuposição de H0 ser verdadeira. O teste de hipótese consiste em verificar se a amostra observada difere significativamente do resultado esperado sob H0. Exemplos: - Uma empresa florestal acredita que a produção média em volume de seus povoamentos é de 250 m3/ha. H0 : μ = 250 . - O tempo necessário para se realizar determinada tarefa é de 382 minutos. H0 : μ = 382 . - Dois tipos diferentes de fertilizantes propiciam em média a mesma produção. H0 : μA = μB . Para os exemplos anteriores a ideia é que, enquanto não houver evidência amostral sugerindo que a informação não deve ser verdadeira, toma-se a informação como verdadeira. 3.2. Hipótese alternativa (Ha) É uma hipótese que contraria H0 . Para o caso do exemplo anterior acerca da comparação de duas médias, poderíamos ter: Ha1 = μA < μB Ha2 = μA > μB Ha3 = μA ≠ μB Ha1 e Ha2 São hipóteses unilateriais Ha3 é uma hipótese bilateral Também conhecido como teste de significância ou regra decisória, é um procedimento que, mediante informações da amostra, permite decidir aceitar ou rejeitar H0 . 4.1. Região crítica É a faixa de valores que nos levam à rejeição da hipótese H0 , isto é, caso o valor observado da estatística do teste (Z, t, χ2, F) pertença à região crítica, rejeita-se H0 , caso contrário não se rejeita H0 . 4. TESTE DE HIPÓTESE 4.2. Erro tipo I O erro tipo I é caracterizado pelo fato de rejeitarmos H0 quando esta é verdadeira. Designaremos por α a probabilidade de se cometer o erro tipo I (nível de significância do teste). 4.3. Erro tipo II O erro tipo II é caracterizado pelo fato de aceitarmos H0 quando esta é falsa. Designaremos por β a probabilidade de se cometer o erro tipo II. 4.4. Poder de um teste O poder de um teste é a probabilidade de rejeitar H0 quando esta é falsa. Poder = 1 – β Tendo em vista uma determinada hipótese, o poder de um teste é um informação que pode ser utilizada para o dimensionamento de tamanhos de amostras tendo-se em vista o controle dos dois tipos de erros. O poder de um teste depende de alguns fatores: Do nível de significância adotado. Da distância entre o valor “real” do parâmetro e o considerado verdadeiro em H0 . Da variabilidade da população. Do tamanho da amostra retirada. Para o mesmo tamanho de amostra n, tem-se: Se o valor considerado como “real” for muito próximo daquele adotado em H0 , ocorre que: • o teste terá maior dificuldade para detectar a diferença, o que implica em menor poder, menor 1 - β, maior β, mas, menor gravidade do erro. Se o valor considerado como “real” for muito distante daquele adotado em H0 , ocorre que: • o teste terá maior facilidade para detectar a diferença: maior poder, maior 1 - β, menor β, mas, maior gravidade do erro. Em resumo, tem-se que: REALIDADE DECISÃO H0 É VERDADEIRA H0 É FALSA Rejeitar H0 α 1 - β Aceitar H0 1 - α β Poder do teste 4.5. Passos para a realização de um teste de hipótese Para se realizar um teste de hipótese, obrigatoriamente deve-se se seguir os seguintes passos: 1 – Enunciar as hipóteses H0 e Ha . 2 – Fixar o nível de significância α e identificar a estatística do teste. 3 – Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4 – Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5 – Concluir pela rejeição ou não de H0 . 5. O TESTE Z 5.1. Teste de hipótese de uma média populacional (Teste Z para uma média) Vamos considerar o caso em que X é normalmente distribuída com variância conhecida. Seja uma variável aleatória X normalmente distribuída com média E(X) = μ e V(X) = 2. Pode-se demonstrar que 𝑋 , a média amostral, é normalmente distribuída com média μ e variância 𝜎2 𝑛 , isto é: 𝑋 ~𝑁 𝜇, 𝜎2 𝑛 Usando a variável normal padronizada ou reduzida Z, temos: 𝑍 = 𝑋 − 𝜇 𝜎𝑋 Mas, sabe-se que: 𝜎𝑋 = 𝑉 𝑋 = 𝜎2 𝑛 = 𝜎 𝑛 , logo: 𝑍 = 𝑋 − 𝜇 𝜎 𝑛 Exemplo 1 de aplicação do teste Z: Uma empresa florestal que trabalha com fomento da produção de madeira assume que uma produção média de 300 m3/ha é um valor razoável de se produzir pelo produtor florestal. Da mesma maneira, assume-se que é razoável que essa produção apresente um desvio padrão de 35 metros cúbicos. Para testar essa hipótese, 49 produtores florestais foram escolhidos ao acaso e a produção deles foi obtida por meio de inventário florestal. A média amostral de produção foi de 308 m3/ha. Em função do exposto, pode-se afirmar, em nível de 95% de probabilidade, que a hipótese da empresa está correta? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 300 e Ha : μ ≠ 300. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 𝑍𝑐𝑎𝑙𝑐. = 𝑋 − 𝜇 𝜎 𝑛 = 308 − 300 35 49 = 1,60 5) Concluir pela rejeição ou não de H0 . Exemplo 2 de aplicação do teste Z: Uma determinada pesquisa mostrou que o preço da madeira nas diversas regiões do Estado do Espírito Santo tem distribuição Normal, com média igual a R$ 105, 00 e desvio padrão igual a R$ 10,00. Em função do aumento dos custos de produção, suspeita-se que o preço da madeira tenha aumentado, e para checar esta hipótese, um pesquisador levantou o preço de venda em 40 diferentes regiões do Estado, encontrando um preço médio de R$ 110,00. Considerando um nível de significância de 5%, a que conclusão se pode chegar? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 105 e Ha : μ > 105. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 𝑍𝑐𝑎𝑙𝑐. = 𝑋 − 𝜇 𝜎 𝑛 = 110 − 105 10 40 = 3,16 5) Concluir pela rejeição ou não de H0 . 1,64 5.2. Teste que envolve diferença de duas médias populacionais (Teste Z para duas médias) Caso em que XA e XB são normalmente distribuídas com variâncias conhecidas. Sejam 𝑋 𝐴 e 𝑋 𝐵 as médias obtidas em duas amostras de tamanhos nA e nB, retiradas de duas populações normais PA e PB, respectivamente, com variâncias 𝜎𝐴 2 e 𝜎𝐵 2 e médias μA e μB desconhecidas. Considerando-se as variáveis aleatórias 𝑋 𝐴 e 𝑋 𝐵 independentes, tem-se que: 𝑋 𝐴 − 𝑋 𝐵 ~𝑁 𝜇𝐴 − 𝜇𝐵; 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Nosso problema é, ao nível de significância , testar: H0 : A = B ou (A - B = 0) contra Ha1: A< B ou Ha2: A > B ou Ha3: A B Para isso, é empregado a seguinte estatística: 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 − 𝜇𝐴 − 𝜇𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Sob H0, segue que : 𝑋 𝐴 − 𝑋 𝐵 ~𝑁 0; 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 e assim virá que: 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 − 0 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 ou 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Exemplo de aplicação do teste Z com duas médias: Dois métodos de colheita, A e B, estão sendo testados em uma empresa florestal. Sabe-se que os tempos (em minutos) de execução da colheita por cada método são normalmente distribuídos com variâncias 𝜎𝐴 2 = 8 e 𝜎𝐵 2 = 10. No sentido de decidir qual é o melhor método, uma amostra com 48 funcionários foi selecionada ao acaso para executar o método A de colheita e 36 foram selecionados ao acaso para executar o método B. Os tempos encontrados para a execução dos métodos foram os seguintes: 𝑋 𝐴 = 40 e 𝑋 𝐵 = 42. Admitindo = 5%, pode-se afirmar que um método foi melhor que o outro? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : A = B e Ha: A B. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 = 40 − 42 8 40 + 10 36 = −3 6. O TESTE F Sejam U e V variáveis aleatórias independentes, com distribuição de Qui-quadrado com n1 e n2 graus de liberdade, respectivamente. Denomina-se F a variável aleatória definida pelo quociente: 𝐹 = 𝑈 𝑛1 𝑉 𝑛2 1 Considerando duas amostras de tamanhos nx e ny das variáveis aleatórias normais X e Y, respectivamente, pode- se demonstrar que: 𝑈 = 𝑛𝑥−1 𝑠𝑥2 𝜎𝑥2 = 𝑛1𝑠𝑥2 𝜎𝑥2 e 𝑉 = 𝑛𝑦−1 𝑠𝑦2 𝜎𝑦2 = 𝑛2𝑠𝑦2 𝜎𝑦2 Então, sob H0: 𝜎𝑥2 = 𝜎𝑦2 = 𝜎2 𝐹 = 𝑈 𝑛1 𝑉 𝑛2 = 𝑛𝑥 − 1 𝑠𝑥2 𝑛𝑥 − 1 𝜎2 𝑛𝑦 − 1 𝑠𝑦2 𝑛𝑦 − 1 𝜎2 = 𝑠𝑥2 𝑠𝑦2 ou seja, 𝐹 = 𝑠𝑥2 𝑠𝑦2 tem distribuição F, de Fisher-Snedecor, com 𝑛1 = 𝑛𝑥 − 1 e 𝑛2 = 𝑛𝑦 − 1 para testar: H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 ou Ha2: 𝜎𝑥2 < 𝜎𝑦2 ou Ha3: 𝜎𝑥2 𝜎𝑦2 Observação: Neste curso, iremos assumir sempre colocar a maior variância no numerador, de modo a obter um Fcalc maior que 1, e, portanto, usaremos a tabela unilateral para F > 1. Neste caso, teremos: 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝑥2 𝑠𝑦2 e Ftab = F(nx – 1; ny -1) H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 Exemplo de aplicação do teste F: Na aplicação de dois métodos X e Y, obteve-se os resultados fornecidos na tabela a seguir. Testar a hipótese de igualdade das variâncias, ao nível de 5% de probabilidade. MÉTODO S2 n X 40 11 Y 16 19 Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : 𝜎𝑥2 = 𝜎𝑦2 versus Ha: 𝜎𝑥2 > 𝜎𝑦2 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. Ftab = F5%(10; 18) = 2,41 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . Fcalc > Ftab, portanto, rejeita-se H0 , isto é, as variâncias populacionais não são iguais. 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝑥2 𝑠𝑦2 = 40 16 = 2,50 7. O TESTE t DE STUDENT 7.1. Teste que envolve uma média populacional (Teste t para uma média) Vamos considerar o caso em que X é normalmente distribuída com variância desconhecida. Se selecionarmos uma amostra aleatória de tamanho n de determinada população, de sorte que X1, X2, ... , Xn sejam independentes, então: 𝑡 = 𝑋 − 𝜇 𝑠𝑋 tem distribuição de student com n – 1 graus de liberdade. Mas, 𝑠 𝑋 = 𝑉 𝑋 = 𝑠2 𝑛 = 𝑠 𝑛 então 𝑡 = 𝑋 − 𝜇 𝑠 𝑛 Deste modo, podemos testar: H0 : A = 0 contra Ha1: A< 0 ou Ha2: A > 0 ou Ha3: A 0 Decisão: a) Teste bilateral: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 b) Teste unilateral à direita: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 c) Teste unilateral à esquerda: se 𝑡𝑐𝑎𝑙𝑐 - ttab Rejeita-se H0 Obs: O valor de ttab é obtido em tabelas apropriadas: 𝑇𝑎𝑏𝑒𝑙𝑎 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 2𝛼 𝑇𝑎𝑏𝑒𝑙𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 2 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 Exemplo de aplicação do teste t com uma média: Uma empresa florestal deseja realizar um serviço de capina e em seus registros consta que a operação consome em média 25 dias para ser completamente realizada. Buscando obter um método mais rápido, a empresa avaliou um novo método e realizou um ensaio em que este método foi testado 32 vezes, com um tempo médio de 21 dias e com um desvio padrão de 3 dias. O novo método é ou não mais rápido que o método anterior? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 25 e Ha : μ < 25. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t5%(31) = 1,70 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 > ttab, portanto, rejeita-se H0 , isto é, o novo método promoveu uma redução de tempo. 𝑡 = 𝑋 − 𝜇 𝑠 𝑛 = 21 − 25 3 32 = −7,54 7.2. Teste de hipótese para o caso de duas amostras independentes (teste t para duas amostras). Quando as variâncias das populações são substituídas pelas variâncias amostrais, isto é, s2 em lugar de 2, o teste Z dá lugar ao teste t, e neste caso, em função das variâncias das populações serem iguais ou não entre si, teremos dois casos a serem considerados. Sejam X e Y normalmente distribuídas, sendo suas variâncias desconhecidas. Desejamos testar: Antes devemos testar: H0 : X = Y contra Ha1: X < Y ou Ha2: X > Y ou Ha3: X Y H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 ou Ha2: 𝜎𝑥2 < 𝜎𝑦2 ou Ha3: 𝜎𝑥2 𝜎𝑦2 Caso A: Se a hipótese H0 do teste F não for rejeitada, vamos admitir que as variâncias são iguais e que, consequentemente, os valores assumidos por 𝑠𝑥2 e 𝑠𝑦2 serão estimativas de um mesmo valor 2 que é a variância comum de ambas as populações. Sendo assim, vamos combinar 𝑠𝑥2 e 𝑠𝑦2 a fim de obter um melhor estimador para 2. Temos que: 𝑠𝑥2 = 𝑆𝑄𝐷𝑥 𝑛𝑥−1 = 𝑋𝑖 2− 𝑋𝑖 𝑛 𝑖=1 2 𝑛𝑥 𝑛 𝑖=1 𝑛𝑥−1 𝑠𝑦2 = 𝑆𝑄𝐷𝑦 𝑛𝑦−1 = 𝑌𝑖 2− 𝑌𝑖 𝑛 𝑖=1 2 𝑛𝑦 𝑛 𝑖=1 𝑛𝑦−1 e 𝑠2 = 𝑆𝑄𝐷𝑥 + 𝑆𝑄𝐷𝑦 𝑛𝑥 − 1 + 𝑛𝑦 − 1 s2 = variância comum (estimador de 2) De modo que: 𝑠2 = 𝑛𝑥 − 1 𝑠𝑥2 + 𝑛𝑦 − 1 𝑠𝑦2 𝑛𝑥 + 𝑛𝑦 − 2 A variável aleatória empregada para o teste é: Que tem distribuição t de student com (nx + ny - 2) graus de liberdade. 𝑡 = 𝑋 − 𝑌 𝑠2 1 𝑛𝑥 + 1 𝑛𝑦 Caso B: Se a hipótese H0 do teste F for rejeitada, vamos admitir que as variâncias iguais, portanto, não tem sentido combinar 𝑠𝑥2 e 𝑠𝑦2. Nest caso, utilizaremos para o teste a seguinte variável aleatória: 𝑡 = 𝑋 − 𝑌 𝑠𝑥2 𝑛𝑥 + 𝑠𝑦 2 𝑛𝑦 𝑛∗ = 𝑠𝑥2 𝑛𝑥 + 𝑠𝑦2 𝑛𝑦 2 𝑠𝑥2 𝑛𝑥 2 𝑛𝑥 − 1 + 𝑠𝑦2 𝑛𝑦 2 𝑛𝑦 − 1 Que segue, aproximadamente, a distribuição t de student com n* graus de liberdade, em que: Decisão: a) Teste bilateral: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 b) Teste unilateral à direita: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 c) Teste unilateral à esquerda: se 𝑡𝑐𝑎𝑙𝑐 - ttab Rejeita-se H0 Obs: O valor de ttab é obtido em tabelas apropriadas: 𝑇𝑎𝑏𝑒𝑙𝑎 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 2𝛼 𝑇𝑎𝑏𝑒𝑙𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 2 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 Exemplo de aplicação do teste t com duas médias: Dois métodos de colheita, A e B, estão sendo testados em uma empresa florestal. Sabe-se que os tempos (em minutos) de execução da colheita por cada método são normalmente distribuídos com variâncias 𝑠𝐴 2 = 8 e 𝑠𝐵 2 = 10. No sentido de decidir qual é o melhor método, uma amostra com 18 funcionários foi selecionada ao acaso para executar o método A de colheita e 13 foram selecionados ao acaso para executar o método B. Os tempos encontrados para a execução dos métodos foram os seguintes: 𝑋 𝐴 = 40 e 𝑋 𝐵 = 42. Admitindo = 5%, pode-se afirmar que um método foi melhor que o outro? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : A = B e Ha: A B. H0 : 𝜎𝑥2 = 𝜎𝑦2 e Ha: 𝜎𝑥2 > 𝜎𝑦2 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t5%(29) = 2,05 Ftab = t5%(12, 17) = 2,38 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 < ttab, portanto, não rejeita-se H0 , isto é, o novo método não promoveu uma redução de tempo. 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝐵 2 𝑠𝐴 2 = 10 8 = 1,25 𝑠2 = 𝑛𝑥 − 1 𝑠𝐴 2 + 𝑛𝑦 − 1 𝑠𝐵 2 𝑛𝐴 + 𝑛𝐵 − 2 = 17 ∗ 8 + 12 ∗ 10 18 + 13 − 2 = 8,82 𝑡 = 𝑋 − 𝑌 𝑠2 1 𝑛𝐴 + 1 𝑛𝐵 = 40 − 42 8,82 1 18 + 1 13 = −1,85 7.3. Teste de hipótese para o caso de dados emparelhados (teste t para dados pareados) Os resultados de duas amostras constituem dados emparelhados quando estão relacionados dois a dois segundo algum critério que introduz uma influência marcante entre os diversos pares, que supomos influir igualmente sobre os valores de cada par. Um exemplo muito comum de dados emparelhados é a obtenção de medidas sobre o mesmo indivíduo antes e depois da aplicação de um tratamento. Sejam por exemplo: • X1i = representa a altura de mudas de uma espécie florestal antes de receber certo fertilizante. • X2i = representa a altura de mudas de uma espécie florestal depois de receber o fertilizante. No caso deste exemplo, podemos definir a variável di como sendo a diferença entre as duas medidas em um mesmo indivíduo isto é, di = X2i – X1i N o X1i X2i di = X2i – X1i 1 X11 X21 d1 2 X12 X22 d2 ... ... ... ... n X1n X2n dn Com base no exemplo sugerido, pode-se montar a seguinte tabela: Nesse teste é testada a hipótese de que a diferença entre as médias das duas populações emparelhadas é igual a um certo valor , o que equivale a testar a hipótese de que a média de todas as diferenças , seja igual a . 𝑑 = 𝑑𝑖 𝑛 𝑖=1 𝑛 é um estimador de 𝐷 Por exemplo, para = 0, as hipóteses seriam: H0 : 𝐷 = 0 contra Ha1: 𝐷 < 0 ou Ha2: 𝐷 > 0 ou Ha3: 𝐷 0 A estatística do teste é: 𝑡 = 𝑑 − 𝐷 𝑠 𝑑 Em que: Admitindo que H0 : 𝐷 = 0, teremos: 𝑡 = 𝑑 𝑠 𝑑 𝑠2 𝑑 = 𝑉 𝑑 = 𝑆𝑄𝐷 𝑑 𝑛−1 = 𝑑𝑖 2− 𝑑𝑖 𝑛 𝑖=1 2 𝑛 𝑛 𝑖=1 𝑛−1 𝑉 𝑑 = 𝑉 𝑑 𝑛 = 𝑠2 𝑑 𝑛 𝑠 𝑑 = 𝑉 𝑑 = 𝑠 𝑑 𝑛 e Neste caso, a estatística do teste passa a ser: 𝑡 = 𝑑 𝑠 𝑑 𝑛 Exemplo de aplicação do teste t para dados emparelhados: Uma empresa florestal treinou uma equipe para realizar uma determinada tarefa e deseja saber se o treinamento deu resultado. O quadro a seguir mostra os tempos de execução da tarefa, em minutos, antes e depois do treinamento: Indivíduo Tempo de execução da tarefa Antes (X1i) Depois (X2i) di = X2i - X1i 1 78 70 - 8 2 76 69 - 7 3 70 65 - 5 4 81 73 - 8 5 83 72 - 11 6 78 70 - 8 7 75 68 - 7 Verificar se o treinamento produziu efeito ao nível de 1% de probabilidade. Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : 𝐷 = 0 e Ha: 𝐷 0. 2) Fixar o nível de significância α e identificar a estatística do teste. = 1%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t1%(6) = 3,15 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 > ttab, portanto, rejeita-se H0 , isto é, o treinamento promoveu uma redução de tempo de execução da tarefa. 𝑡 = 𝑑 𝑠 𝑑 𝑛 = 7,71 1,80 7 = 11,33 8. O TESTE DE QUI-QUADRADO (χ2) Uma medida de discrepância existente entre as frequências observadas e esperadas é proporcionada pela estatística de χ2, expressa por: χ2 = 𝐹𝑜1 − 𝐹𝑒1 2 𝐹𝑒1 + 𝐹𝑜2 − 𝐹𝑒2 2 𝐹𝑒2 + ⋯ + 𝐹𝑜𝑘 − 𝐹𝑒𝑘 2 𝐹𝑒𝑘 𝜒2 = 𝐹𝑜𝑖 − 𝐹𝑒𝑖 2 𝐹𝑒𝑖 ~𝜒𝑣2 𝑘 𝑖=1 tem distribuição de Qui-quadrado com v graus de liberdade. 8.1. O teste de Qui-quadrado como teste de aderência Pode ser usado para comprovar o ajustamento de uma função de frequência a dados observados. Neste caso, o número de graus de liberdade v é dado por: 1. v = k – 1, quando as frequências esperadas puderem ser calculadas sem que se façam estimativas dos parâmetros populacionais a partir das distribuições amostrais. Tem-se que k é o número de categorias em que foi dividida a amostra. 2. v = k – 1 – r, quando para a determinação das frequências esperadas, r parâmetros tiverem suas estimativas calculadas a partir das distribuições amostrais. Considere uma tabela de freqüências, com k ≥ 2 categorias de resultados: Em que Oi é a frequência observada na categoria i, i = 1,2, ... , k. Categorias Frequência observada 1 O1 2 O2 3 O3 ⋮ ⋮ k Ok Seja pi a probabilidade associada à categoria i, i=1, ... , k. O objetivo do teste de aderência é testar as hipóteses: H0: pe1 = po1 , .... , pek = pok Ha: Existe pelo menos uma diferença. sendo poi a probabilidade especificada para a categoria i, i=1,...,k, fixada por meio do modelo probabilístico de interesse. Se ei é o total de indivíduos esperados na categoria i, quando a hipótese H0 é verdadeira, então: ei = n × poi , i = 1, ..., k Regra de decisão: Se 𝜒𝑐𝑎𝑙𝑐 2 ≥ 𝜒𝑡𝑎𝑏 2 , rejeita-se H0 Obs: Este resultado é válido para n grande e para ei 5. Exemplo de aplicação do teste de aderência de Qui- quadrado: Considere que um dado foi jogado 186 vezes, obtendo-se os seguintes resultados: Existem indícios de que o dado em questão seja viciado, a 95% de probabilidade? Face Face 1 Face 2 Face 3 Face 4 Face 5 Face 6 Fe 31 31 31 31 31 31 Fo 34 29 30 32 28 33 Solução: Como o valor de Qui-quadrado obtido (0,9032) foi menor que o esperado ao acaso (11,07) admite-se que o dado seja honesto. Face Face 1 Face 2 Face 3 Face 4 Face 5 Face 6 Fe 31 31 31 31 31 31 Fo 34 29 30 32 28 33 χ2 parcial 0,2903 0,1290 0,0323 0,0323 0,2903 0,1290 𝜒𝑐𝑎𝑙𝑐 2 = 0,9032 𝜒𝑡𝑎𝑏 2 95%; 5 = 11,07 8.2. O teste de Qui-quadrado como teste de independência A classificação de observações (em geral, de variáveis qualitativas) de acordo com dois critérios é referida como tabela de contingência. Exemplo. Natureza de vacas, segundo a raça e o tipo de acasalamento Raça Tipo de acasalamento Fecundos Não-fecundos Total Charolesa 110 (120) 50 (40) 160 Gir 70 (60) 10 (20) 80 Nelore 30 (30) 10 (10) 40 Total 210 70 280 Se um critério envolve m categorias (linhas) e o outro n categorias (colunas), a tabela é referida como tabela m x n. No exemplo, a tabela é 3 x 2. Tabelas de contingência são construídas com o propósito de se testar: 1) a relação de dependência (associação) entre duas variáveis (Teste de independência). O teste de independência é baseado no esquema amostral, no qual uma única amostra aleatória de tamanho n é classificada com relação a duas características simultaneamente; 2) que as várias colunas (ou linhas) tem a mesma proporção de indivíduos nas várias categorias de uma característica, se os totais das linhas (ou colunas) são especificados antecipadamente (Teste de homogeneidade). No caso do teste de independência, cabe a seguinte hipótese H0: H0 : pij = pi. . p.j para todo c j r i , ,2,1 , ,2,1 h i k j ij ij ij Fe Fe Fo 1 1 2 2 O número de graus de liberdade é: v = (h – 1) (k – 1), se as freqüências esperadas podem ser calculadas sem necessidade de estimação de parâmetros da população. v = (h – 1) (k – 1) – r, se as freqüências esperadas só podem ser avaliadas estimando-se r parâmetros populacionais. Exemplo de aplicação do teste de independência de Qui- quadrado: A tabela a seguir exibe os resultados obtidos por estudantes em Estatística e Cálculo. Testar a hipótese de que os resultados em Estatística são independentes dos resultados em cálculo, ao nível de significância de 2,5%. Cálculo Estatística 0 < n < 5 5≤ n < 7 7 ≤ n ≤ 10 Total 0 < n < 5 75 35 13 123 5 ≤ n < 7 29 120 32 181 7 ≤ n ≤ 10 15 70 46 131 Total 119 225 91 435 Solução: A tabela a seguir exibe os resultados obtidos por estudantes em Estatística e Cálculo. Testar a hipótese de que os resultados em Estatística são independentes dos resultados em cálculo, ao nível de significância de 2,5%. Cálculo Estatística 0 < n < 5 5 ≤ n < 7 7 ≤ n ≤ 10 Total 0 < n < 5 75(33,65) 35(63,62) 13(25,73) 123 5 ≤ n < 7 29(49,51) 120(93,62) 32(37,86) 181 7 ≤ n ≤ 10 15(35,84) 70(67,76) 46(27,40) 131 Total 119 225 91 435 H0: As variáveis são independentes. Ha: As variáveis não são independentes. Portanto, rejeita-se H0. 111,64 ,40 27 27,40 46 ,65 33 33,65 75 2 2 1 1 2 2 . h i k j ij ij ij calc Fe Fe Fo ,14 11 2 5,2 %;4 8.3. O teste de Qui-quadrado como teste de homogeneidade Considerando-se o exemplo apresentado em 8.2, a hipótese nula de homogeneidade é que a proporção de cada tipo de acasalamento é a mesma para todas as raças, e pode ser formalmente estabelecida como: H0: pCh(j) = pGir(j) = pNe(j) para cada j = 1 (fecundo) e 2 (não fecundo) Ou simplesmente, : as proporções não são todas iguais. H , . p p raças ou seja, p mesma nas três a é a proporção de acasalamentos fecundos : H 1 Ne Gir Ch 0 Assim Exemplo de aplicação do teste de homogeneidade de Qui- quadrado: A título de exemplo, vamos considerar o problema apresentado em 8.2 e testar H0 a 5%. Neste caso, teremos: H0: As proporção de acasalamentos fecundos é a mesma nas três raças, isto é, PCh = PGir = PNe. Ha: As proporções não são todas iguais. Portanto, rejeita-se H0. 10,00 10 10 10 120 120 110 2 2 1 1 2 2 . h i k j ij ij ij calc Fe Fe Fo ,5 99 2 5%;2 FIM DO CAPITULO II RC RA RC Região crítica -Z α/2 Z α/2 RC RA RC Região crítica -Z α/2 Z α/2 0 Zα
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
7
Exercícios Estatística Exp 2021 2
Estatística Experimental
UFES
34
Slide - Análise de Regressão - 2023-1
Estatística Experimental
UFES
82
Slide - Introdução à Análise de Regressão - 2023-1
Estatística Experimental
UFES
6
Lista - Fatorial Parcelas Subdivididas Correlação e Regressão - Estatística Experimental 2023-1
Estatística Experimental
UFES
68
Slide - Regressão Linear Múltipla - 2023-1
Estatística Experimental
UFES
3
Lista 6 - Métodos Estatísticos 1 - 2023-1
Estatística Experimental
UFES
Texto de pré-visualização
CAPÍTULO VI – TESTES DE HIPÓTESES Prof. Gilson Fernandes da Silva Departamento de Ciências Florestais e da Madeira (DCFM) Programa de Pós-graduação em Ciências Florestais (PGCF) Universidade Federal Espírito Santo (UFES) 1. OBJETIVOS DO CAPÍTULO VI - Apresentar conceitos básicos sobre a aplicação de testes de hipótese. - Apresentar a teoria e exercícios práticos de aplicação do teste Z. - Apresentar a teoria e exercícios práticos de aplicação do teste F e do teste t. - Apresentar a teoria e exercícios práticos de aplicação do teste de Qui-quadrado. 2. CONCEITOS BÁSICOS SOBRE TESTES DE HIPÓTESES TESTE ESTATÍSTICO DE HIPÓTESE: É uma regra decisória que nos permite rejeitar ou não uma hipótese estatística com base nos resultados de uma amostra. POPULAÇÃO: É o conjunto de valores da variável, associados a todos os elementos de um conjunto, que têm em comum determinada característica. AMOSTRA: É um subconjunto da população. Pode ser entendida como o conjunto de informações colhidas de parte da população, com vistas a se inferir sobre ela (população). INFERÊNCIA ESTATÍSTICA: Tem por objetivo fazer generalizações sobre uma população com base em dados de uma amostra. Se fundamenta na teoria da probabilidade, diferentemente dos métodos descritivos. PARÂMETRO: É uma medida usada para descrever uma característica da população. Em geral, é um valor desconhecido. ESTIMADOR: Um estimador de um parâmetro é qualquer função das observações da amostra aleatória X1, X2, ... , Xn. Ele representa uma dada fórmula de cálculo que fornecerá valores diferentes de acordo com a amostra selecionada. Exemplos: i) O estimador da média é 𝜇 = 𝑋 = 𝑋𝑖 𝑛 𝑖=1 𝑛 ii) O estimador da variância 2 é 𝜎2 = 𝑠2 = 𝑋𝑖−𝑋 2 𝑛 𝑖=1 𝑛−1 = 𝑋𝑖 2− 𝑋𝑖 𝑛 𝑖=1 2 𝑛 𝑛 𝑖=1 𝑛−1 Obs: Estimativa é o valor assumido pelo estimador. Hipótese estatística é a suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico, ou uma afirmação quanto à natureza da população, que será verificada por um teste de aderência. As hipóteses estatísticas devem ser formuladas de modo a minimizar os erros de decisão. Exemplos: - A média de altura dos estudantes da UFES é de 168 cm. - A distribuição de diâmetros de uma floresta é a normal. - A proporção de árvores com defeito em uma floresta é de 5%. 3. HIPÓTESE ESTATÍSTICA 3.1. Hipótese de nulidade (H0) É a hipótese a ser testada. A hipótese H0 é formulada com o “expresso propósito de ser rejeitada” e os testes são construídos sob a pressuposição de H0 ser verdadeira. O teste de hipótese consiste em verificar se a amostra observada difere significativamente do resultado esperado sob H0. Exemplos: - Uma empresa florestal acredita que a produção média em volume de seus povoamentos é de 250 m3/ha. H0 : μ = 250 . - O tempo necessário para se realizar determinada tarefa é de 382 minutos. H0 : μ = 382 . - Dois tipos diferentes de fertilizantes propiciam em média a mesma produção. H0 : μA = μB . Para os exemplos anteriores a ideia é que, enquanto não houver evidência amostral sugerindo que a informação não deve ser verdadeira, toma-se a informação como verdadeira. 3.2. Hipótese alternativa (Ha) É uma hipótese que contraria H0 . Para o caso do exemplo anterior acerca da comparação de duas médias, poderíamos ter: Ha1 = μA < μB Ha2 = μA > μB Ha3 = μA ≠ μB Ha1 e Ha2 São hipóteses unilateriais Ha3 é uma hipótese bilateral Também conhecido como teste de significância ou regra decisória, é um procedimento que, mediante informações da amostra, permite decidir aceitar ou rejeitar H0 . 4.1. Região crítica É a faixa de valores que nos levam à rejeição da hipótese H0 , isto é, caso o valor observado da estatística do teste (Z, t, χ2, F) pertença à região crítica, rejeita-se H0 , caso contrário não se rejeita H0 . 4. TESTE DE HIPÓTESE 4.2. Erro tipo I O erro tipo I é caracterizado pelo fato de rejeitarmos H0 quando esta é verdadeira. Designaremos por α a probabilidade de se cometer o erro tipo I (nível de significância do teste). 4.3. Erro tipo II O erro tipo II é caracterizado pelo fato de aceitarmos H0 quando esta é falsa. Designaremos por β a probabilidade de se cometer o erro tipo II. 4.4. Poder de um teste O poder de um teste é a probabilidade de rejeitar H0 quando esta é falsa. Poder = 1 – β Tendo em vista uma determinada hipótese, o poder de um teste é um informação que pode ser utilizada para o dimensionamento de tamanhos de amostras tendo-se em vista o controle dos dois tipos de erros. O poder de um teste depende de alguns fatores: Do nível de significância adotado. Da distância entre o valor “real” do parâmetro e o considerado verdadeiro em H0 . Da variabilidade da população. Do tamanho da amostra retirada. Para o mesmo tamanho de amostra n, tem-se: Se o valor considerado como “real” for muito próximo daquele adotado em H0 , ocorre que: • o teste terá maior dificuldade para detectar a diferença, o que implica em menor poder, menor 1 - β, maior β, mas, menor gravidade do erro. Se o valor considerado como “real” for muito distante daquele adotado em H0 , ocorre que: • o teste terá maior facilidade para detectar a diferença: maior poder, maior 1 - β, menor β, mas, maior gravidade do erro. Em resumo, tem-se que: REALIDADE DECISÃO H0 É VERDADEIRA H0 É FALSA Rejeitar H0 α 1 - β Aceitar H0 1 - α β Poder do teste 4.5. Passos para a realização de um teste de hipótese Para se realizar um teste de hipótese, obrigatoriamente deve-se se seguir os seguintes passos: 1 – Enunciar as hipóteses H0 e Ha . 2 – Fixar o nível de significância α e identificar a estatística do teste. 3 – Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4 – Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5 – Concluir pela rejeição ou não de H0 . 5. O TESTE Z 5.1. Teste de hipótese de uma média populacional (Teste Z para uma média) Vamos considerar o caso em que X é normalmente distribuída com variância conhecida. Seja uma variável aleatória X normalmente distribuída com média E(X) = μ e V(X) = 2. Pode-se demonstrar que 𝑋 , a média amostral, é normalmente distribuída com média μ e variância 𝜎2 𝑛 , isto é: 𝑋 ~𝑁 𝜇, 𝜎2 𝑛 Usando a variável normal padronizada ou reduzida Z, temos: 𝑍 = 𝑋 − 𝜇 𝜎𝑋 Mas, sabe-se que: 𝜎𝑋 = 𝑉 𝑋 = 𝜎2 𝑛 = 𝜎 𝑛 , logo: 𝑍 = 𝑋 − 𝜇 𝜎 𝑛 Exemplo 1 de aplicação do teste Z: Uma empresa florestal que trabalha com fomento da produção de madeira assume que uma produção média de 300 m3/ha é um valor razoável de se produzir pelo produtor florestal. Da mesma maneira, assume-se que é razoável que essa produção apresente um desvio padrão de 35 metros cúbicos. Para testar essa hipótese, 49 produtores florestais foram escolhidos ao acaso e a produção deles foi obtida por meio de inventário florestal. A média amostral de produção foi de 308 m3/ha. Em função do exposto, pode-se afirmar, em nível de 95% de probabilidade, que a hipótese da empresa está correta? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 300 e Ha : μ ≠ 300. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 𝑍𝑐𝑎𝑙𝑐. = 𝑋 − 𝜇 𝜎 𝑛 = 308 − 300 35 49 = 1,60 5) Concluir pela rejeição ou não de H0 . Exemplo 2 de aplicação do teste Z: Uma determinada pesquisa mostrou que o preço da madeira nas diversas regiões do Estado do Espírito Santo tem distribuição Normal, com média igual a R$ 105, 00 e desvio padrão igual a R$ 10,00. Em função do aumento dos custos de produção, suspeita-se que o preço da madeira tenha aumentado, e para checar esta hipótese, um pesquisador levantou o preço de venda em 40 diferentes regiões do Estado, encontrando um preço médio de R$ 110,00. Considerando um nível de significância de 5%, a que conclusão se pode chegar? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 105 e Ha : μ > 105. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 𝑍𝑐𝑎𝑙𝑐. = 𝑋 − 𝜇 𝜎 𝑛 = 110 − 105 10 40 = 3,16 5) Concluir pela rejeição ou não de H0 . 1,64 5.2. Teste que envolve diferença de duas médias populacionais (Teste Z para duas médias) Caso em que XA e XB são normalmente distribuídas com variâncias conhecidas. Sejam 𝑋 𝐴 e 𝑋 𝐵 as médias obtidas em duas amostras de tamanhos nA e nB, retiradas de duas populações normais PA e PB, respectivamente, com variâncias 𝜎𝐴 2 e 𝜎𝐵 2 e médias μA e μB desconhecidas. Considerando-se as variáveis aleatórias 𝑋 𝐴 e 𝑋 𝐵 independentes, tem-se que: 𝑋 𝐴 − 𝑋 𝐵 ~𝑁 𝜇𝐴 − 𝜇𝐵; 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Nosso problema é, ao nível de significância , testar: H0 : A = B ou (A - B = 0) contra Ha1: A< B ou Ha2: A > B ou Ha3: A B Para isso, é empregado a seguinte estatística: 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 − 𝜇𝐴 − 𝜇𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Sob H0, segue que : 𝑋 𝐴 − 𝑋 𝐵 ~𝑁 0; 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 e assim virá que: 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 − 0 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 ou 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 Exemplo de aplicação do teste Z com duas médias: Dois métodos de colheita, A e B, estão sendo testados em uma empresa florestal. Sabe-se que os tempos (em minutos) de execução da colheita por cada método são normalmente distribuídos com variâncias 𝜎𝐴 2 = 8 e 𝜎𝐵 2 = 10. No sentido de decidir qual é o melhor método, uma amostra com 48 funcionários foi selecionada ao acaso para executar o método A de colheita e 36 foram selecionados ao acaso para executar o método B. Os tempos encontrados para a execução dos métodos foram os seguintes: 𝑋 𝐴 = 40 e 𝑋 𝐵 = 42. Admitindo = 5%, pode-se afirmar que um método foi melhor que o outro? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : A = B e Ha: A B. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑍 = 𝑋 𝐴 − 𝑋 𝐵 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵 2 𝑛𝐵 = 40 − 42 8 40 + 10 36 = −3 6. O TESTE F Sejam U e V variáveis aleatórias independentes, com distribuição de Qui-quadrado com n1 e n2 graus de liberdade, respectivamente. Denomina-se F a variável aleatória definida pelo quociente: 𝐹 = 𝑈 𝑛1 𝑉 𝑛2 1 Considerando duas amostras de tamanhos nx e ny das variáveis aleatórias normais X e Y, respectivamente, pode- se demonstrar que: 𝑈 = 𝑛𝑥−1 𝑠𝑥2 𝜎𝑥2 = 𝑛1𝑠𝑥2 𝜎𝑥2 e 𝑉 = 𝑛𝑦−1 𝑠𝑦2 𝜎𝑦2 = 𝑛2𝑠𝑦2 𝜎𝑦2 Então, sob H0: 𝜎𝑥2 = 𝜎𝑦2 = 𝜎2 𝐹 = 𝑈 𝑛1 𝑉 𝑛2 = 𝑛𝑥 − 1 𝑠𝑥2 𝑛𝑥 − 1 𝜎2 𝑛𝑦 − 1 𝑠𝑦2 𝑛𝑦 − 1 𝜎2 = 𝑠𝑥2 𝑠𝑦2 ou seja, 𝐹 = 𝑠𝑥2 𝑠𝑦2 tem distribuição F, de Fisher-Snedecor, com 𝑛1 = 𝑛𝑥 − 1 e 𝑛2 = 𝑛𝑦 − 1 para testar: H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 ou Ha2: 𝜎𝑥2 < 𝜎𝑦2 ou Ha3: 𝜎𝑥2 𝜎𝑦2 Observação: Neste curso, iremos assumir sempre colocar a maior variância no numerador, de modo a obter um Fcalc maior que 1, e, portanto, usaremos a tabela unilateral para F > 1. Neste caso, teremos: 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝑥2 𝑠𝑦2 e Ftab = F(nx – 1; ny -1) H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 Exemplo de aplicação do teste F: Na aplicação de dois métodos X e Y, obteve-se os resultados fornecidos na tabela a seguir. Testar a hipótese de igualdade das variâncias, ao nível de 5% de probabilidade. MÉTODO S2 n X 40 11 Y 16 19 Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : 𝜎𝑥2 = 𝜎𝑦2 versus Ha: 𝜎𝑥2 > 𝜎𝑦2 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. Ftab = F5%(10; 18) = 2,41 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . Fcalc > Ftab, portanto, rejeita-se H0 , isto é, as variâncias populacionais não são iguais. 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝑥2 𝑠𝑦2 = 40 16 = 2,50 7. O TESTE t DE STUDENT 7.1. Teste que envolve uma média populacional (Teste t para uma média) Vamos considerar o caso em que X é normalmente distribuída com variância desconhecida. Se selecionarmos uma amostra aleatória de tamanho n de determinada população, de sorte que X1, X2, ... , Xn sejam independentes, então: 𝑡 = 𝑋 − 𝜇 𝑠𝑋 tem distribuição de student com n – 1 graus de liberdade. Mas, 𝑠 𝑋 = 𝑉 𝑋 = 𝑠2 𝑛 = 𝑠 𝑛 então 𝑡 = 𝑋 − 𝜇 𝑠 𝑛 Deste modo, podemos testar: H0 : A = 0 contra Ha1: A< 0 ou Ha2: A > 0 ou Ha3: A 0 Decisão: a) Teste bilateral: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 b) Teste unilateral à direita: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 c) Teste unilateral à esquerda: se 𝑡𝑐𝑎𝑙𝑐 - ttab Rejeita-se H0 Obs: O valor de ttab é obtido em tabelas apropriadas: 𝑇𝑎𝑏𝑒𝑙𝑎 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 2𝛼 𝑇𝑎𝑏𝑒𝑙𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 2 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 Exemplo de aplicação do teste t com uma média: Uma empresa florestal deseja realizar um serviço de capina e em seus registros consta que a operação consome em média 25 dias para ser completamente realizada. Buscando obter um método mais rápido, a empresa avaliou um novo método e realizou um ensaio em que este método foi testado 32 vezes, com um tempo médio de 21 dias e com um desvio padrão de 3 dias. O novo método é ou não mais rápido que o método anterior? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : μ = 25 e Ha : μ < 25. 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t5%(31) = 1,70 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 > ttab, portanto, rejeita-se H0 , isto é, o novo método promoveu uma redução de tempo. 𝑡 = 𝑋 − 𝜇 𝑠 𝑛 = 21 − 25 3 32 = −7,54 7.2. Teste de hipótese para o caso de duas amostras independentes (teste t para duas amostras). Quando as variâncias das populações são substituídas pelas variâncias amostrais, isto é, s2 em lugar de 2, o teste Z dá lugar ao teste t, e neste caso, em função das variâncias das populações serem iguais ou não entre si, teremos dois casos a serem considerados. Sejam X e Y normalmente distribuídas, sendo suas variâncias desconhecidas. Desejamos testar: Antes devemos testar: H0 : X = Y contra Ha1: X < Y ou Ha2: X > Y ou Ha3: X Y H0 : 𝜎𝑥2 = 𝜎𝑦2 , contra Ha1: 𝜎𝑥2 > 𝜎𝑦2 ou Ha2: 𝜎𝑥2 < 𝜎𝑦2 ou Ha3: 𝜎𝑥2 𝜎𝑦2 Caso A: Se a hipótese H0 do teste F não for rejeitada, vamos admitir que as variâncias são iguais e que, consequentemente, os valores assumidos por 𝑠𝑥2 e 𝑠𝑦2 serão estimativas de um mesmo valor 2 que é a variância comum de ambas as populações. Sendo assim, vamos combinar 𝑠𝑥2 e 𝑠𝑦2 a fim de obter um melhor estimador para 2. Temos que: 𝑠𝑥2 = 𝑆𝑄𝐷𝑥 𝑛𝑥−1 = 𝑋𝑖 2− 𝑋𝑖 𝑛 𝑖=1 2 𝑛𝑥 𝑛 𝑖=1 𝑛𝑥−1 𝑠𝑦2 = 𝑆𝑄𝐷𝑦 𝑛𝑦−1 = 𝑌𝑖 2− 𝑌𝑖 𝑛 𝑖=1 2 𝑛𝑦 𝑛 𝑖=1 𝑛𝑦−1 e 𝑠2 = 𝑆𝑄𝐷𝑥 + 𝑆𝑄𝐷𝑦 𝑛𝑥 − 1 + 𝑛𝑦 − 1 s2 = variância comum (estimador de 2) De modo que: 𝑠2 = 𝑛𝑥 − 1 𝑠𝑥2 + 𝑛𝑦 − 1 𝑠𝑦2 𝑛𝑥 + 𝑛𝑦 − 2 A variável aleatória empregada para o teste é: Que tem distribuição t de student com (nx + ny - 2) graus de liberdade. 𝑡 = 𝑋 − 𝑌 𝑠2 1 𝑛𝑥 + 1 𝑛𝑦 Caso B: Se a hipótese H0 do teste F for rejeitada, vamos admitir que as variâncias iguais, portanto, não tem sentido combinar 𝑠𝑥2 e 𝑠𝑦2. Nest caso, utilizaremos para o teste a seguinte variável aleatória: 𝑡 = 𝑋 − 𝑌 𝑠𝑥2 𝑛𝑥 + 𝑠𝑦 2 𝑛𝑦 𝑛∗ = 𝑠𝑥2 𝑛𝑥 + 𝑠𝑦2 𝑛𝑦 2 𝑠𝑥2 𝑛𝑥 2 𝑛𝑥 − 1 + 𝑠𝑦2 𝑛𝑦 2 𝑛𝑦 − 1 Que segue, aproximadamente, a distribuição t de student com n* graus de liberdade, em que: Decisão: a) Teste bilateral: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 b) Teste unilateral à direita: se 𝑡𝑐𝑎𝑙𝑐 ttab Rejeita-se H0 c) Teste unilateral à esquerda: se 𝑡𝑐𝑎𝑙𝑐 - ttab Rejeita-se H0 Obs: O valor de ttab é obtido em tabelas apropriadas: 𝑇𝑎𝑏𝑒𝑙𝑎 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 2𝛼 𝑇𝑎𝑏𝑒𝑙𝑎 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 2 𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙: 𝑒𝑛𝑡𝑟𝑎𝑟 𝑐𝑜𝑚 𝛼 Exemplo de aplicação do teste t com duas médias: Dois métodos de colheita, A e B, estão sendo testados em uma empresa florestal. Sabe-se que os tempos (em minutos) de execução da colheita por cada método são normalmente distribuídos com variâncias 𝑠𝐴 2 = 8 e 𝑠𝐵 2 = 10. No sentido de decidir qual é o melhor método, uma amostra com 18 funcionários foi selecionada ao acaso para executar o método A de colheita e 13 foram selecionados ao acaso para executar o método B. Os tempos encontrados para a execução dos métodos foram os seguintes: 𝑋 𝐴 = 40 e 𝑋 𝐵 = 42. Admitindo = 5%, pode-se afirmar que um método foi melhor que o outro? Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : A = B e Ha: A B. H0 : 𝜎𝑥2 = 𝜎𝑦2 e Ha: 𝜎𝑥2 > 𝜎𝑦2 2) Fixar o nível de significância α e identificar a estatística do teste. = 5%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t5%(29) = 2,05 Ftab = t5%(12, 17) = 2,38 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 < ttab, portanto, não rejeita-se H0 , isto é, o novo método não promoveu uma redução de tempo. 𝐹𝑐𝑎𝑙𝑐 = 𝑠𝐵 2 𝑠𝐴 2 = 10 8 = 1,25 𝑠2 = 𝑛𝑥 − 1 𝑠𝐴 2 + 𝑛𝑦 − 1 𝑠𝐵 2 𝑛𝐴 + 𝑛𝐵 − 2 = 17 ∗ 8 + 12 ∗ 10 18 + 13 − 2 = 8,82 𝑡 = 𝑋 − 𝑌 𝑠2 1 𝑛𝐴 + 1 𝑛𝐵 = 40 − 42 8,82 1 18 + 1 13 = −1,85 7.3. Teste de hipótese para o caso de dados emparelhados (teste t para dados pareados) Os resultados de duas amostras constituem dados emparelhados quando estão relacionados dois a dois segundo algum critério que introduz uma influência marcante entre os diversos pares, que supomos influir igualmente sobre os valores de cada par. Um exemplo muito comum de dados emparelhados é a obtenção de medidas sobre o mesmo indivíduo antes e depois da aplicação de um tratamento. Sejam por exemplo: • X1i = representa a altura de mudas de uma espécie florestal antes de receber certo fertilizante. • X2i = representa a altura de mudas de uma espécie florestal depois de receber o fertilizante. No caso deste exemplo, podemos definir a variável di como sendo a diferença entre as duas medidas em um mesmo indivíduo isto é, di = X2i – X1i N o X1i X2i di = X2i – X1i 1 X11 X21 d1 2 X12 X22 d2 ... ... ... ... n X1n X2n dn Com base no exemplo sugerido, pode-se montar a seguinte tabela: Nesse teste é testada a hipótese de que a diferença entre as médias das duas populações emparelhadas é igual a um certo valor , o que equivale a testar a hipótese de que a média de todas as diferenças , seja igual a . 𝑑 = 𝑑𝑖 𝑛 𝑖=1 𝑛 é um estimador de 𝐷 Por exemplo, para = 0, as hipóteses seriam: H0 : 𝐷 = 0 contra Ha1: 𝐷 < 0 ou Ha2: 𝐷 > 0 ou Ha3: 𝐷 0 A estatística do teste é: 𝑡 = 𝑑 − 𝐷 𝑠 𝑑 Em que: Admitindo que H0 : 𝐷 = 0, teremos: 𝑡 = 𝑑 𝑠 𝑑 𝑠2 𝑑 = 𝑉 𝑑 = 𝑆𝑄𝐷 𝑑 𝑛−1 = 𝑑𝑖 2− 𝑑𝑖 𝑛 𝑖=1 2 𝑛 𝑛 𝑖=1 𝑛−1 𝑉 𝑑 = 𝑉 𝑑 𝑛 = 𝑠2 𝑑 𝑛 𝑠 𝑑 = 𝑉 𝑑 = 𝑠 𝑑 𝑛 e Neste caso, a estatística do teste passa a ser: 𝑡 = 𝑑 𝑠 𝑑 𝑛 Exemplo de aplicação do teste t para dados emparelhados: Uma empresa florestal treinou uma equipe para realizar uma determinada tarefa e deseja saber se o treinamento deu resultado. O quadro a seguir mostra os tempos de execução da tarefa, em minutos, antes e depois do treinamento: Indivíduo Tempo de execução da tarefa Antes (X1i) Depois (X2i) di = X2i - X1i 1 78 70 - 8 2 76 69 - 7 3 70 65 - 5 4 81 73 - 8 5 83 72 - 11 6 78 70 - 8 7 75 68 - 7 Verificar se o treinamento produziu efeito ao nível de 1% de probabilidade. Solução: 1) Enunciar as hipóteses H0 e Ha . H0 : 𝐷 = 0 e Ha: 𝐷 0. 2) Fixar o nível de significância α e identificar a estatística do teste. = 1%. 3) Determinar a região crítica e a região de aceitação em função do nível α pelas tabelas estatísticas. ttab = t1%(6) = 3,15 4) Por meio dos elementos amostrais, calcular o valor da estatística do teste. 5) Concluir pela rejeição ou não de H0 . 𝑡𝑐𝑎𝑙𝑐 > ttab, portanto, rejeita-se H0 , isto é, o treinamento promoveu uma redução de tempo de execução da tarefa. 𝑡 = 𝑑 𝑠 𝑑 𝑛 = 7,71 1,80 7 = 11,33 8. O TESTE DE QUI-QUADRADO (χ2) Uma medida de discrepância existente entre as frequências observadas e esperadas é proporcionada pela estatística de χ2, expressa por: χ2 = 𝐹𝑜1 − 𝐹𝑒1 2 𝐹𝑒1 + 𝐹𝑜2 − 𝐹𝑒2 2 𝐹𝑒2 + ⋯ + 𝐹𝑜𝑘 − 𝐹𝑒𝑘 2 𝐹𝑒𝑘 𝜒2 = 𝐹𝑜𝑖 − 𝐹𝑒𝑖 2 𝐹𝑒𝑖 ~𝜒𝑣2 𝑘 𝑖=1 tem distribuição de Qui-quadrado com v graus de liberdade. 8.1. O teste de Qui-quadrado como teste de aderência Pode ser usado para comprovar o ajustamento de uma função de frequência a dados observados. Neste caso, o número de graus de liberdade v é dado por: 1. v = k – 1, quando as frequências esperadas puderem ser calculadas sem que se façam estimativas dos parâmetros populacionais a partir das distribuições amostrais. Tem-se que k é o número de categorias em que foi dividida a amostra. 2. v = k – 1 – r, quando para a determinação das frequências esperadas, r parâmetros tiverem suas estimativas calculadas a partir das distribuições amostrais. Considere uma tabela de freqüências, com k ≥ 2 categorias de resultados: Em que Oi é a frequência observada na categoria i, i = 1,2, ... , k. Categorias Frequência observada 1 O1 2 O2 3 O3 ⋮ ⋮ k Ok Seja pi a probabilidade associada à categoria i, i=1, ... , k. O objetivo do teste de aderência é testar as hipóteses: H0: pe1 = po1 , .... , pek = pok Ha: Existe pelo menos uma diferença. sendo poi a probabilidade especificada para a categoria i, i=1,...,k, fixada por meio do modelo probabilístico de interesse. Se ei é o total de indivíduos esperados na categoria i, quando a hipótese H0 é verdadeira, então: ei = n × poi , i = 1, ..., k Regra de decisão: Se 𝜒𝑐𝑎𝑙𝑐 2 ≥ 𝜒𝑡𝑎𝑏 2 , rejeita-se H0 Obs: Este resultado é válido para n grande e para ei 5. Exemplo de aplicação do teste de aderência de Qui- quadrado: Considere que um dado foi jogado 186 vezes, obtendo-se os seguintes resultados: Existem indícios de que o dado em questão seja viciado, a 95% de probabilidade? Face Face 1 Face 2 Face 3 Face 4 Face 5 Face 6 Fe 31 31 31 31 31 31 Fo 34 29 30 32 28 33 Solução: Como o valor de Qui-quadrado obtido (0,9032) foi menor que o esperado ao acaso (11,07) admite-se que o dado seja honesto. Face Face 1 Face 2 Face 3 Face 4 Face 5 Face 6 Fe 31 31 31 31 31 31 Fo 34 29 30 32 28 33 χ2 parcial 0,2903 0,1290 0,0323 0,0323 0,2903 0,1290 𝜒𝑐𝑎𝑙𝑐 2 = 0,9032 𝜒𝑡𝑎𝑏 2 95%; 5 = 11,07 8.2. O teste de Qui-quadrado como teste de independência A classificação de observações (em geral, de variáveis qualitativas) de acordo com dois critérios é referida como tabela de contingência. Exemplo. Natureza de vacas, segundo a raça e o tipo de acasalamento Raça Tipo de acasalamento Fecundos Não-fecundos Total Charolesa 110 (120) 50 (40) 160 Gir 70 (60) 10 (20) 80 Nelore 30 (30) 10 (10) 40 Total 210 70 280 Se um critério envolve m categorias (linhas) e o outro n categorias (colunas), a tabela é referida como tabela m x n. No exemplo, a tabela é 3 x 2. Tabelas de contingência são construídas com o propósito de se testar: 1) a relação de dependência (associação) entre duas variáveis (Teste de independência). O teste de independência é baseado no esquema amostral, no qual uma única amostra aleatória de tamanho n é classificada com relação a duas características simultaneamente; 2) que as várias colunas (ou linhas) tem a mesma proporção de indivíduos nas várias categorias de uma característica, se os totais das linhas (ou colunas) são especificados antecipadamente (Teste de homogeneidade). No caso do teste de independência, cabe a seguinte hipótese H0: H0 : pij = pi. . p.j para todo c j r i , ,2,1 , ,2,1 h i k j ij ij ij Fe Fe Fo 1 1 2 2 O número de graus de liberdade é: v = (h – 1) (k – 1), se as freqüências esperadas podem ser calculadas sem necessidade de estimação de parâmetros da população. v = (h – 1) (k – 1) – r, se as freqüências esperadas só podem ser avaliadas estimando-se r parâmetros populacionais. Exemplo de aplicação do teste de independência de Qui- quadrado: A tabela a seguir exibe os resultados obtidos por estudantes em Estatística e Cálculo. Testar a hipótese de que os resultados em Estatística são independentes dos resultados em cálculo, ao nível de significância de 2,5%. Cálculo Estatística 0 < n < 5 5≤ n < 7 7 ≤ n ≤ 10 Total 0 < n < 5 75 35 13 123 5 ≤ n < 7 29 120 32 181 7 ≤ n ≤ 10 15 70 46 131 Total 119 225 91 435 Solução: A tabela a seguir exibe os resultados obtidos por estudantes em Estatística e Cálculo. Testar a hipótese de que os resultados em Estatística são independentes dos resultados em cálculo, ao nível de significância de 2,5%. Cálculo Estatística 0 < n < 5 5 ≤ n < 7 7 ≤ n ≤ 10 Total 0 < n < 5 75(33,65) 35(63,62) 13(25,73) 123 5 ≤ n < 7 29(49,51) 120(93,62) 32(37,86) 181 7 ≤ n ≤ 10 15(35,84) 70(67,76) 46(27,40) 131 Total 119 225 91 435 H0: As variáveis são independentes. Ha: As variáveis não são independentes. Portanto, rejeita-se H0. 111,64 ,40 27 27,40 46 ,65 33 33,65 75 2 2 1 1 2 2 . h i k j ij ij ij calc Fe Fe Fo ,14 11 2 5,2 %;4 8.3. O teste de Qui-quadrado como teste de homogeneidade Considerando-se o exemplo apresentado em 8.2, a hipótese nula de homogeneidade é que a proporção de cada tipo de acasalamento é a mesma para todas as raças, e pode ser formalmente estabelecida como: H0: pCh(j) = pGir(j) = pNe(j) para cada j = 1 (fecundo) e 2 (não fecundo) Ou simplesmente, : as proporções não são todas iguais. H , . p p raças ou seja, p mesma nas três a é a proporção de acasalamentos fecundos : H 1 Ne Gir Ch 0 Assim Exemplo de aplicação do teste de homogeneidade de Qui- quadrado: A título de exemplo, vamos considerar o problema apresentado em 8.2 e testar H0 a 5%. Neste caso, teremos: H0: As proporção de acasalamentos fecundos é a mesma nas três raças, isto é, PCh = PGir = PNe. Ha: As proporções não são todas iguais. Portanto, rejeita-se H0. 10,00 10 10 10 120 120 110 2 2 1 1 2 2 . h i k j ij ij ij calc Fe Fe Fo ,5 99 2 5%;2 FIM DO CAPITULO II RC RA RC Região crítica -Z α/2 Z α/2 RC RA RC Região crítica -Z α/2 Z α/2 0 Zα