·
Agronomia ·
Estatística Experimental
· 2021/2
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
2
P3 - Estatística Experimental 2021 2
Estatística Experimental
UFES
34
Slide - Análise de Regressão - 2023-1
Estatística Experimental
UFES
2
P2 - Estatística Experimental 2021-2
Estatística Experimental
UFES
6
Lista - Fatorial Parcelas Subdivididas Correlação e Regressão - Estatística Experimental 2023-1
Estatística Experimental
UFES
68
Slide - Regressão Linear Múltipla - 2023-1
Estatística Experimental
UFES
1
Exercício Estatística Experimental 2021 2
Estatística Experimental
UFES
3
Lista 6 - Métodos Estatísticos 1 - 2023-1
Estatística Experimental
UFES
2
P1 - Estatística Experimental 2021-2
Estatística Experimental
UFES
82
Slide - Introdução à Análise de Regressão - 2023-1
Estatística Experimental
UFES
80
Slide - Testes de Hipóteses - 2023-1
Estatística Experimental
UFES
Texto de pré-visualização
1 Preâmbulo Apostila elaborada pelo professor Edilson Romais Schmildt, para atender aos alunos de graduação em Agronomia do Ceunes/Ufes, na disciplina CAB06203 – Estatística Experimental, que tem a seguinte ementa: Teste de hipótese. Contrastes. Princípios básicos de experimentação. Análise de variância. Teste de significância. Procedimentos para comparações múltiplas. Delineamentos experimentais. Experimentos fatoriais. Experimentos em parcelas subdivididas. Regressão linear. Correlação. A sequência abordada contém todo o conteúdo da ementa e está exatamente como apresentado no plano de ensino (programa) da referida disciplina. Ao final de cada unidade são apresentados exercícios, no qual, para melhor contextualização com a área agrária, são explorados artigos científicos, e são exigidas análises de forma manual e nos softwares Genes e R. As abordagens de experimentos com número de parcelas diferentes ou com perda de parcelas são exceção e não a regra, visto que, o importante é compreender cada estatística envolvida e, nos casos excepcionais de perda de parcelas, os softwares referidos podem ser usados para resolver tais situações. O uso de tamanho 12 na letra é suficiente para o aluno ler o material no Leptop e, tamanho 20 da letra é usado, principalmente para tabelas e gráficos e de forma proposital já que tem por finalidade melhor visualização na apresentação virtual, visto que o período de oferta se caracteriza como Ensino aprendizagem Remoto Temporário Emergencial (Earte). A apostila poderá ser usada também por alunos da disciplina PGAT1002 – Estatística experimental que tem a seguinte ementa: Princípios básicos de experimentação. Procedimentos para comparações múltiplas. Delineamentos experimentais. Experimentos fatoriais e parcelas subdivididas. Modelos de regressão e análise de correlação. 2 SUMÁRIO Preâmbulo .......................................................................................................................................................................................................... 01 Unidade I – Teste de hipótese …....................................................................................................................................................................... 03 Unidade II – Princípios básicos de experimentação ....................................................................................................................................... 25 Unidade III – Delineamentos experimentais …............................................................................................................................................... 29 Unidade IV – Procedimentos para comparações múltiplas …....................................................................................................................... 65 Unidade V – Experimentos fatoriais …............................................................................................. ............................................................. 101 Unidade VI – Experimentos em parcelas subdivididas …..............................................................................................................................123 Unidade VII – Regressão e correlação ….........................................................................................................................................................152 Tabelas estatísticas ...........................................................................................................................................................................................225 Unidade I – TESTE DE HIPÓTESE Ao executar um experimento, o pesquisador busca comprovar alguma hipótese que estabeleceu (ZIMMERMANN, 2014, p.29). Hipóteses: Dois tipos de hipóteses são formuladas: hipóteses nula (H0), segundo qual se declara a não existência de efeito do que se está testando; hipóteses alternativa (H1), que declara a existência desse efeito e pode ser do tipo bilateral (diferente) ou unilateral (maior que, ou menor que). A hipóteses alternativa pode também ser designada por Ha. Essas duas hipóteses são formuladas segundo o tipo de pressuposição adequado à análise a que se propõe. No decorrer do curso, serão lançadas hipóteses tais como: reativas à análise de variância; relativa a testes de comparação de médias; referente aos coeficientes de equações lineares. Nesta unidade faremos algumas aplicações relativas a análises cujas amostras não caracterizam delineamentos experimentais tal como teste de t para comparação de dois tratamentos apenas. Erros tipos I e II: Quando se realiza inferência estatística, que é o caso de experimentos na área agronômica, tem que se considerar que os resultados não são precisos e que há erros embutidos, diferente da estatística descritiva que se atém apenas ao conjunto de dados em análise, e, portanto, sem erro embutido. Na aplicação de um teste estatístico qualquer, associam-se dois tipos de erros: erro tipo I; erro tipo II. O quadro seguinte resume a situação. Hipótese | Decisão Aceitar | Rejeitar H0 | Correta | Erro tipo I (a) H1 | Erro tipo II (b) | Correta (poder) O erro tipo I (a) é também chamado nível de significância do teste, e, normalmente na área agronômica se trabalha com a = 5% e a = 1%. Se for usado a = 5% quer dizer que a confiança do teste é de 95%. O erro tipo I ocorre ao rejeitar-se uma hipótese nula que é verdadeira. O erro tipo II é designado por b. O complemento da unidade, qual seja, 1 - b é chamado de poder de um teste. Se comete o erro tipo II ao se aceitar uma hipótese nula falsa. Via de regra, nos trabalhos experimentais pouco se trabalha o erro tipo II, muito embora o poder do teste seja importante. Para se determinar o tamanho ótimo de parcelas experimentais (X0), na metodologia segundo Hatheway (1961), conforme equação a seguir. X0 = \dfrac{b}{2}\sqrt{2(t1 + t2)^2CV^2/r\ d^2} Na equação, os valores do coeficiente de heterogeneidade (b) e o coeficiente de variação (CV) podem ser obtidos por simulação bootstrap, com 2000 reamostragens ou mais. Já o d é a precisão experimental que compreende a diferença entre as médias dos tratamentos detectadas como significativas a 5% de probabilidade, expressa em porcentagem da média geral do teste de uniformidade; t1 é o valor tabelado de t para testes de significância (teste bilateral a 5%), com gl graus de liberdade; t2 é o valor tabelado de t, bilateral, correspondente a um erro de 2(1-p), e p é a probabilidade de se obter resultados significativos, ou seja, o poder do teste. Os valores tabelados da distribuição de t são obtidos com gl graus de liberdade do resíduo, em função dos I tratamentos e r repetições, sendo gl = (I - 1)(r - 1) para experimentos em blocos casualizados. Para verificar a aplicação do poder de teste na metodologia de Hatheway (1961), podem ser consultados os artigos de Schimidt et al. (2016), Celanti et al. (2016) e Santos et al. (2019). gl graus de liberdade; t2 é o valor tabelado de t, bilateral, correspondente a um erro de 2(1-p), com gl graus de liberdade, sendo p = 0,80 a probabilidade de se obter resultados significativos, ou seja, o poder do teste. Os valores tabelados da distribuição de t são obtidos com gl graus de liberdade do resíduo, em função dos I tratamentos e r repetições, sendo gl = (I - 1)(r - 1) para experimentos em blocos casualizados. Para verificar a aplicação do poder de teste na metodologia de Hatheway (1961), podem ser consultados os artigos de Schimidt et al. (2016), Celanti et al. (2016) e Santos et al. (2019). São abordados, a seguir, alguns testes de hipóteses, que podem ser conferidos em Zimmermann (2014). 1) Teste de t para dados pareados tcalc = \dfrac{\overline{d} - mD}{sd/\sqrt{n}} H0: mD = 0 Ha: mD < 0 Outras hipóteses alternativas: Ha: mD > 0 ou Ha: mD ≠ 0 ttab(a;n-1 GL;unilateral) Se |tcalc| ≥ ttab, rejeitamos a hipótese de nulidade Se |tcalc| < ttab, não rejeitamos a hipótese de nulidade Para este caso, uma mesma amostra é usada para avaliação em dois momentos, como por exemplo, antes e após a aplicação de um inibidor da fotossíntese em 20 plantas de milho, como ilustrado a seguir, onde foi avaliada a taxa de crescimento. A pergunta é, o inibidor foi eficiente? 5 Planta Antes Depois Planta Antes = x1 Depois = x2 0 = 12 − 14 1 15 14 1 15 14 -1 2 14 12 2 14 12 -2 3 13 11 3 13 11 -2 4 14 13 4 14 13 -1 5 15 13 5 15 13 -2 6 13 11 6 13 11 -2 7 15 15 7 15 15 0 8 16 14 8 16 14 -2 9 12 10 9 12 10 -2 10 16 15 Cálculos necessários 10 16 15 -1 11 14 12 11 14 12 -2 12 16 15 12 16 15 -1 13 15 13 13 15 13 -2 14 14 12 14 14 12 -2 15 15 11 15 15 11 -4 16 17 12 16 17 12 -5 17 12 12 17 12 12 0 18 13 10 18 13 10 -3 19 14 10 19 14 10 -4 20 16 11 20 16 11 -5 Média = 0̅ -2,15 DP = 56 1,4244 H0: mD = 0 Ha: mD < 0 \overline{d} - mD sd/\sqrt{n} = -2,15 - 0 1,4244/\sqrt{20} = -6,75 tcalc = \dfrac{\overline{d} - mD}{sd/\sqrt{n}} ttab(a;n-1 GL;unilateral) = t(5%;19;unilateral) = -1,729 Tabela t bil | a = 10% | a = 5% | a = 2% | a = 1% uni | a = 5% | a = 2,5% | a = 1% | a = 0,5% 1 | 6.314 | 12.706 | 31.821 | 63.657 2 | 2.920 | 4.303 | 6.965 | 9.925 Gl erro 19 | 1.729 | 2.093 | 2.539 | 2.861 20 | 1.725 | 2.086 21 | 1.721 | 2.080 38 | 1.686 | 2.024 O valor de ttab pode ser obtido no R por: qt(0.05,19,lower.tail=TRUE): qt(0.05,19,lower.tail=TRUE) [1] -1.729133 Conclusão: Como |tcalc| ≥ ttab, rejeitamos a hipótese de nulidade e podemos afirmar que o inibidor é eficiente para reduzir a taxa de crescimento em plantas de milho, a 5% de probabilidade pelo teste t. Script para resolução no software R (R CORE TEAM, 2021): X<-read.table("e:\\dados\\milho t pareado.txt",header=T) # Leitura dos dados X t.test(X$Depois,X$Antes,paired=TRUE,alternative="less", var.equal=TRUE) #ordem: depois, antes. Alternative: less = unilateral à esquerda; greater = unilateral à direita; two.sided = bilateral boxplot(X$Antes,X$Depois,names=c("Antes","Depois"), ylab="Taxa de crescimento") Resultados do R: Paired t-test data: X$Depois and X$Antes t = -6.7502, df = 19, p-value = 0.0000009471 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: Inf -1.599257 sample estimates: mean of the differences -2.15 LI_{5\%} = \overline{d} - (t_{\alpha}) \Big(\frac{s_d}{\sqrt{n}} \Big) LI_{5\%} = -2,15 - (-1,729) \Big(\frac{1,4244}{\sqrt{20}} \Big) = -1,5993 2) Teste para duas variâncias Podemos fazer o teste de t para duas amostras independentes, amostra 1 e amostra 2. Para este caso, é necessário saber se as variâncias das duas amostras são homogêneas. H_{0}: \sigma^{2}_{1} = \sigma^{2}_{2} H_{a}: \sigma^{2}_{1} \neq \sigma^{2}_{2} Vejamos um exemplo com dados reais. No trabalho de dissertação de uma aluna do PPGAT, procurou-se verificar se as plantas de mamoeiro das variedades Aliança e THB apresentam alturas diferentes. Para tal foi estruturado um experimento, um ensaio em branco em que, numa mesma área foram plantadas, na mesma época, uma fileira com 100 plantas de ‘Aliança’ do lado de outra fileira de 100 plantas de ‘THB’. Para esta análise usaremos apenas 15 plantas de cada variedade, como segue, avaliadas 488 dias após o plantio. Poderiam ter sido amostras de tamanho diferente. Cálculos necessários Planta | Aliança | THB 1 | 305 | 250 2 | 302 | 260 3 | 300 | 270 4 | 280 | 298 5 | 296 | 290 6 | 305 | 260 7 | 320 | 265 8 | 312 | 242 9 | 296 | 265 10 | 290 | 275 11 | 300 | 260 12 | 282 | 290 13 | 302 | 280 14 | 310 | 263 15 | 330 | 255 Médias | 302,00 | 268,20 Variâncias | 171,2857 | 247,7429 Para testar as hipóteses procedemos da seguinte forma: a) Obtemos a razão entre as duas variâncias, o valor F de Snedecor: Fcalc = \frac{maior \ \sigma^{2}_{i}}{menor \ \sigma^{2}_{i}} b) Comparar o Fcalc com o Ftab(\alpha,GLnumerador,GLdenominador). Se Fcal \geq Ftab, rejeita-se H0 e se conclui que as variâncias são heterogêneas; Se Fcal < Ftab, não se rejeita-se H0 e se conclui que as variâncias são homogêneas. H_{0}: \sigma^{2}_{Aliança} = \sigma^{2}_{THB} H_{a}: \sigma^{2}_{Aliança} \neq \sigma^{2}_{THB} Fcalc = \frac{\sigma^{2}_{Aliança}}{\sigma^{2}_{THB}} = \frac{171,2857}{247,7429} = 0,6914 Fcalc = \frac{maior \ \sigma^{2}_{i}}{menor \ \sigma^{2}_{i}} = \frac{\sigma^{2}_{THB}}{\sigma^{2}_{Aliança}} = \frac{247,7429}{171,2857} = 1,4464 Ftab(\alpha,GLnumerador,GLdenominador) = Ftab(5\%,14,14) = 2,48 Tabela F 5\% - limites unilaterais de F ao nível de 5\% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 ... ... 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 13 Resolvendo pelo R: X<-read.table("e:\\dados\\mamoeiro t independente.txt",header=T) # Leitura dos dados X t.test(X$Aliança,X$THB, var.equal=TRUE,alternative="two.sided") boxplot(X$Aliança,X$THB,names=c("Aliança","THB"), ylab="Altura de planta (cm)") 3.2) Teste de t para duas amostras independentes, variâncias heterogêneas No caso de os dois tratamentos apresentarem variâncias amostrais heterogêneas, o teste de t fica como mostrado a seguir. tcalc = ( m̄2 - m̄1 ) / sqrt( s1^2/n1 + s2^2/n2 ) H0: m1 = m2 Ha: m1 ≠ m2 ou os unilaterais, dependendo do caso O t calculado é comparado com o ttab, bilateral no caso, ao nível de significância alfa GI como segue, conforme Satterthwaite (1946): GL = ( ( ( s1^2/n1 + s2^2/n2 )^2 ) ) / ( ( ( s1^2/n1 )^2 ) / ( n1 - 1 ) + ( ( s2^2/n2 )^2 ) / ( n2 - 1 ) ) Exemplo: Considere que um engenheiro agrônomo resolveu testar um produto para avaliar o crescimento de mudas clonais de eucalipto. Para tal, separou 25 mudas, do mesmo clone, com a mesma idade e altura uniforme e aplicou o produto, na dosagem recomendada pelo fabricante em 10 mudas e acompanhou as outras 15 mudas, sem aplicação do produto. Os dados são apresentados a seguir, para crescimento das mudas em cm, depois de 20 dias da aplicação, já digitadas para uso no R. Na Sequência, verificação da homogeneidade das variâncias. 15 X<-read.table("e:\\dados\\eucalipto mudas t independente.txt",header=T) # Leitura dos dados X var.test(X$Produto,X$Testemunha) Verificando que não há homogeneidade entre as variâncias, aplicaremos o teste t em questão (para variâncias heterogêneas). Muda Produto Testemunha 1 10 2 2 9 1.6 3 6.8 2 4 8.9 3 5 11.2 2 6 12 1 7 10.3 1.5 8 8.7 2.2 9 9 3.1 10 5.9 4.7 11 NA 2 12 NA 1.9 13 NA 3 14 NA 2.8 15 NA 2.5 Cálculos necessários Médias 9,1800 2,3533 Variâncias 3,4173 0,7841 GL = ( ( S^2_Produto/n_Produto + S^2_Testemunha/n_Testemunha )^2 ) / ( ( ( S^2_Produto/n_Produto )^2 ) / ( n_Produto - 1 ) + ( ( S^2_Testemunha/n_Testemunha )^2 ) / ( n_Testemunha - 1 ) ) = ( ( 3,4173/10 + 0,7841/15 )^2 ) / ( ( 3,4173^2/10 ) / ( 10 - 1 ) + ( 0,7841^2/15 ) / ( 15 - 1 ) ) = 11,787 H0: m_Produto = m_Testemunha Ha: m_Produto > m_Testemunha tcalc = ( m̄_Produto - m̄_Testemunha ) / sqrt( S^2_Produto/n_Produto + S^2_Testemunha/n_Testemunha ) = ( 9,1800 - 2,3533 ) / sqrt( 3,4173/10 + 0,7841/15 ) = 10,876 O valor de ttab pode ser obtido no R por: qt(0.95,12,lower.tail=TRUE) ou em tabela, como segue: Tabela t bil alfa=10% alfa=5% alfa=2% alfa=1% uni alfa=5% alfa=2,5% alfa=1% alfa=0,5% 1 6.314 12.706 31.821 63.657 2 2.920 4.303 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2.776 3.747 4.604 5 2.015 2.571 3.365 4.032 6 1.943 2.447 3.143 3.707 7 1.895 2.365 2.998 3.499 8 1.860 2.306 2.896 3.355 9 1.833 2.262 2.821 3.250 10 1.812 2.228 2.764 3.169 11 1.796 2.201 2.718 3.106 12 1.782 2.179 2.681 3.055 GL erro 20 1.725 2.086 2.528 2.845 21 1.721 2.080 2.518 2.831 22 1.717 2.074 2.508 2.819 23 1.714 2.069 2.500 2.807 24 1.711 2.064 2.492 2.797 25 1.708 2.060 2.485 2.787 26 1.706 2.056 2.479 2.779 27 1.703 2.052 2.473 2.771 28 1.701 2.048 2.467 2.763 29 1.699 2.045 2.462 2.756 30 1.697 2.042 2.457 2.750 31 1.696 2.009 2.403 2.744 39 1.685 2.023 2.426 2.708 40 1.684 2.021 2.423 2.704 41 1.683 2.020 2.421 2.701 42 1.682 2.018 2.418 2.698 43 1.681 2.017 2.416 2.695 44 1.680 2.015 2.414 2.692 45 1.679 2.014 2.412 2.690 46 1.679 2.013 2.410 2.687 47 1.678 2.012 2.408 2.685 48 1.677 2.011 2.407 2.682 49 1.677 2.010 2.405 2.680 50 1.676 2.009 2.403 2.678 18 Conclusão: o produto é eficiente no crescimento de mudas de eucalipto, sendo comprovado estatisticamente pelo teste de t a 5% de probabilidade. Resolução pelo R: X<-read.table("e:\\dados\\eucalipto mudas t independente.txt",header=T) # Leitura dos dados X t.test(X$Produto,X$Testemunha, var.equal=FALSE,alternative="greater") boxplot(X$Produto,X$Testemunha,names=c("Produto","Testemunha"), ylab="Crescimento de muda (cm)") 19 Uma vez obtido o resultado, não há necessidade de se mencionar se as variâncias foram homogêneas ou não. Vide a Tabela 2, extraída da tese do Dr. Omar Schmildt (SCHMILDT, 2010). 4) Teste de t para uma média Embora de uso menos frequente na área agronômica, por vezes tem-se a necessidade de se fazer o teste de média para o caso de uma média específica (m̄), a partir de amostra retirada de uma população com variável normalmente distribuída. O teste é para uma média, mas estão envolvidas duas médias. A outra média é a média tidas como média populacional (m). A estatística do teste é, para a qual será feito um exemplo na sequência: tcalc = (m̄ - m) / (s / √n) planta prodplanta 1 42.60 2 50.25 3 55.00 4 60.00 5 67.00 6 65.70 7 72.00 8 75.00 9 65.00 10 55.00 11 54.00 12 48.00 Cálculos necessários planta prodplanta 1 42.6 2 50.25 3 55 4 60 5 67 6 65.7 7 72 8 75 9 65 10 55 11 54 12 48 Média 59,1292 DP 9,9737 Exemplo: A média populacional de lavouras de mamoeiro THB, no primeiro ano, é de 80 t/ha, o que corresponde a 43 kg/planta. Um produtor verificou que o manejo diferenciado permitia uma produção um pouco maior que a média citada para a variedade. Para fazer a verificação, avaliou a produção de 12 plantas no primeiro ano (dados acima). Verificar se a sua média de produção por planta é superior à média populacional. H₀: m = 43 kg/planta Hₐ: m > 43 kg/planta tcalc = (m̄ - m) / (s / √n) = (59,1292 - 43) / (9,9737 / √12) = 5,6021 O valor de ttab pode ser obtido no R por: qt(0.95,11,lower.tail=TRUE) ou em tabela, como segue: > qt(0.95,11,lower.tail=TRUE) [1] 1.795885 Tabela t GL erro alpha = 10% alpha = 5% alpha = 2% alpha = 1% uni alpha = 5% alpha = 2,5% alpha = 1% alpha = 0,5% 1 6.314 12.706 31.821 63.657 2 2.920 4.303 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2.776 3.747 4.604 5 2.015 2.571 3.365 4.032 6 1.943 2.447 3.143 3.707 7 1.895 2.365 2.998 3.499 8 1.860 2.306 2.896 3.355 9 1.833 2.262 2.821 3.250 10 1.812 2.228 2.764 3.169 11 1.796 2.201 2.718 3.106 12 1.782 2.179 2.681 3.055 13 1.771 2.160 2.650 3.012 14 1.761 2.145 2.624 2.977 15 1.753 2.131 2.602 2.947 16 1.746 2.120 2.584 2.921 17 1.740 2.110 2.567 2.898 18 1.734 2.101 2.552 2.878 19 1.729 2.093 2.539 2.861 20 1.725 2.086 2.528 2.845 21 1.721 2.080 2.518 2.831 22 1.717 2.074 2.508 2.819 23 1.714 2.069 2.500 2.807 24 1.711 2.064 2.492 2.797 25 1.708 2.060 2.485 2.787 26 1.706 2.056 2.479 2.779 27 1.703 2.052 2.473 2.771 28 1.701 2.048 2.467 2.763 29 1.699 2.045 2.462 2.756 30 1.697 2.042 2.457 2.750 23 Para relembrar o boxplot, segue Figura ilustrativa. Exercícios Ia) No item 3.1 foi realizado o teste de t bilateral para a comparação de altura de plantas entre as culivares de mamoeiro Aliança e THB. Demonstre como se chega aos valores de IC apresentados pelo R, na referida análise; Ib) Ainda referente ao exemplo no item 3.1, qual a confiança estatística que se tem ao dizer que a cultivar Aliança possui maior altura de plantas do que a cultivar THB, aos 488 dias após plantio? Referências: CELANTI, H. F.; SCHMILDT, O.; ALEXANDRE, S. R.; CATTANEO, F. L.; SCHMILDT, E. R. Plot size in the evaluation of papaya seedlings ‘Baixinho de Santa Amália’ in tubes. Revista Brasileira de Fruticultura, v.38, n.3, p.e-533, 2016. https://doi.org/10.1590/0100-29452016533 HATHEWAY, W.H. Convenient plot size. Agronomy Journal, v.53, n.4, p.279-280, 1961. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. 24 SANTOS, G.P. et al. Plot size related to numbers of treatments and replications, and experimental precision in conilon coffee from clonal seedlings of LB1. Journal of Agricultural Science, v.11, n.11, p.285-294, 2019. https://doi.org/10.5539/jas.v11n11p285 SATTERTHWAITE, F.E. An approximate distribution of estimates of variance components. Biometrics Bulletin, Washington-DC, v.2, n.6, p.110-114, 1946. SCHMILDT, O. Cultivo in vitro e estaquia dos mamoeiros Golden e Uenf/Caliman 01. 2010. 119f. Tese (Doutorado em Produção Vegetal), Universidade Estadual do Norte Fluminense Darcy Ribeiro, Campos dos Goytacazes, 2010. SCHMILDT, E. R.; SCHMILDT, O.; CRUZ, C. D.; CATTANEO, L. F.; FERREGUETTI, G. A. Optimum plot size and number of replications in papaya field experiment. Revista Brasileira de Fruticultura, v.38, n.2, p.e-373, 2016. https://doi.org/10.1590/0100-29452016373 ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 25 Unidade II – PRINCÍPIOS BÁSICOS DE EXPERIMENTAÇÃO O conteúdo desta unidade é explorado, de forma mais ilustrativa, na apresentação em Power Point, disponibilizado aos alunos. Segue o conteúdo, de forma bem resumida. Para que se compreenda os princípios básicos da experimentação, há necessidade de entendermos o que é experimento, unidade experimental, repetição entre outros termos. Conceitos Básicos: I) Fator – aquilo que se aplica em um ensaio de forma não homogênea. Por exemplo: cultivar, quando se testam várias delas; adubação, ao se compararem diversas formulações; etc. II) Nível – as diferentes manifestações de um fator. por exemplo: as doses de adubação empregadas; os tipos de formulações usadas; os espaçamentos utilizados; as diferentes cultivares testadas; diferentes temperaturas de cocção; diferentes raças bovinas; etc. III) Tratamento – Cada um dos níveis de um fator ou cada uma das combinações dos níveis dos fatores quando testados mais de um fator.. IV) Testemunha – grupo que não recebe o tratamento. Também chamado de padrão, termo usado no melhoramento de plantas, quando se refere a um genótipo usual na região a ser comparado com novos genótipos.A testemunha pode ser a ausência do fator (dose zero do inseticida por exemplo). V) Experimento (ensaio) - trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos, sendo estes aplicados de forma repetida: estudo de alimentação de vacas leiteiras com diferentes rações; competição de cultivares de milho; etc. Quando mais de um fator estiver sendo estudado, o experiment é chamado de factorial. VI) Delineamento Experimental - É o desenho amostral. Os principais são: delineamento inteiramente casualizado (DIC); delineameno em blocos casualizados (DBC); delineamento em quadrado latino (DQL). Obs.: Fatorial e Parcelas Subdivididas (PSD) são esquemas experimentais e estão organizados dentro de um DIC, DBC ou DQL. Em trabalhos acadêmicos e em artigos científicos, nunca usar as siglas, coloque o nome por extenso, como … delineamento inteiramente casualizado. VII) Unidade Experimental = Parcela - Unidade para a experimentação, para a colheita dos dados que deverão refletir os efeitos dos tratamentos: uma ovelha para se verificar a produção de leite; duas fileiras de 5 metros para se avaliar a produção de milho; um vaso para se avalair o efeito de determinado adubo na produção de matéria seca; etc. Segundo Pimentel Gomes (2009, p.25) em experimentos com vegetais, a parcela também tem recebido o nome de canteiro ou talhão. VIII) Repetição - Aplicação dos tratamentos a mais de uma parcela. Em experimentação, a repetição é necessária para se determiner erro experimental. IX) Bloco – conjunto ambiental homogêneo que contém todos os tratamentos ou parte deles. No DQL, em que se apresentam dois tipos de blocos, eles recebem a denominação de colunas e linhas. X) Erro Experimental - Variação entre parcelas recebendo o mesmo tratamento. Na ANOVA é computado como QME. É o erro não controlado do experimento. XI) Casualização - É a aleatorização dos tratamentos às parcelas por meio de algum tipo de sorteio: “cumbuca”; tabela de números aleatórios; recursos da calculadora; recursos computacionais. XII) Fontes de Variação – também chamado de causas de variação. Como o nome indica, são as fontes onde existirá variabilidade, contida no modelo matemático e que entrará na análise de variância. É importante o pesquisador saber ler o modelo matemático e compor as fontes de variação. XIII) Variável (Característica, caractere) em análise - É a característica medida ou observada no experimento: produtividade; teor de óleo; altura de plantas; altura de inserção de espiga; taxa de multiplicação; porcentagem de germinação; IVG; porcentagem de estacas enraizadas; massa fresca de raízes; etc. XIV) Parâmetro – estatística da população como: media (mₐ); desvio padrão (σ); variância genética (σg²); etc. Enfatizamos que experimentos são amostras e, portanto, as estatísticas obtidas nos experimentos são estimativas dos parâmetros, representadas com assento circunflexo (Ex.: m̂ₐ). No lançamento de hipóteses, sempre sem sinal de estimativa. Exemplo, H₀: mₐ = m̂ₐ Ainda referente ao erro experimental, Zimmermann (2014) aponta que o mesmo nunca pode ser eliminado, mas pode ser amenizado por meio de um conjunto de atividades ou procedimentos, dos quais podem-se citar: uniformização das parcelas experimentais; parcela experimental de tamanho adequado; uso de bordaduras; utilização de um número adequado de repetições e de preferência igual para todos os tratamentos; manejo das parcelas de forma homogênea, no qual diz respeito a todos os fatores não envolvidos no estudo; uso do delineamento estatístico adequado para as condições de realização do experimento, de forma a obter o melhor aproveitamento dos resultados. Os delineamentos devem receber algumas ações dos pesquisadores a fim de minimizar os efeitos das variações que ocorrem no ambiente em que o experimento é conduzido. Para tal, os experimentos são estruturados Segundo alguns princípios básicos. Os princípios básicos de experimentação são três: repetição; casualização; controle local. Princípios Básicos de experimentação: Repetição: como relatado anteriormente, se refere à aplicação dos tratamentos a mais de uma parcela e, sem repetição, não tem com os fazer análise de variância em delineamentos experimentais. Quantas repetições? No mínimo duas. Segundo Pimentel Gomes (2009, p.53), um experimento deve ter no mínimo 20 parcelas e 10 GL do erro. Portanto, se um experimento tiver apenas dois tratamentos, terá que ter no mínimo 10 repetições. Casualização: Proporcionar a todos os tratamentos a mesma chance de serem designados a qualquer uma das parcelas, evitando assim que qualquer tratamento seja sistematicamente favorecido ou desfavorecido por fatores externos. Sem casualização imagine: insetos-pragas em reboleira; incidência maior de luz em um dos tratamentos; enchercamento em parte da área experimental; etc. A Casualização faz com que: as variações que contribuem para o erro experimental sejam convertidas em variações aleatórias; permite obter estimativas válidas para o erro experimental; garante o uso de testes de significância e por tornar os erros independentes. Controle Local: A finalidade é dividir um ambiente heterogêneo em sub-ambientes homogêneos e tornar o delineamento experimental mais eficiente, pela redução do erro experimental. DIC não possui controle local. DBC e DQL possuem controle local. Exemplos de uso: a) Leitões com diferentes idades; b) Solos com texturas diferentes; c) Declividades diferentes do terreno; d) fertilidade diferente do terreno. As atividades do experimentador devem ser planejadas. Imagine a instalação de um experimento de mandioca e que no momento faltam algumas manivas para completar a área experimental. É apenas um dos problemas da falta de planejamento. Planejamento Experimental: a) Projeto de pesquisa – já foi a época em que o pesquisador procurava o experimentador ou analista estatístico para fazer as análises estatísticas. Ao se dialogar com o “dono dos dados” verificava-se que o mesmo não sabia qual delineamento tinha usado, o número de parcelas experimentais era pequeno demais, não houve controle de erro experimental de forma adequada, etc, inviabilizando muitas análises. Isto é um diagnóstico da falta de um projeto adequado. b) Delineamento experimental – o projeto deve constar qual o delineamento experimental, se tem mais de um fator, qual o esquema, número de repetições, tamanho das parcelas, etc. c) Zelo pela redução do erro experimental – voltamos ao exemplo com a instalação de um experimento, a campo, com mandioca, para avaliar adubos. Deve-se usar as manivas: de mesmo cultivar; de mesmo tamanho, normalmente 20 cm; com mesmo número de gemas; mesma posição da planta (1/3 médio do ramo); 27 32 plantas/parcela. Se as padronizações não forem efetivadas incorremos em muita variabilidade dentro do mesmo tratamento, o que aumenta o erro experimental e, consequentemente a precisão do experimento medida pelo coeficiente de variação (CV). d) A unidade experimental – no exemplo da mandioca, a unidade experimental seria uma área uniforme, no espaçamento adequado, contend as 32 manivas. e) A variável em análise e a forma como será medida – no caso em questão poderia ser a prudutividade, em t/ha, estimada a partir das 32 plantas colhidas na parcela de área conhecida. A apresentação da produção por parcela não se mostra adequada na prática pois o leitor tem apenas uma noção de comparação entre os tratamentos sem no entando ter uma noção global da produtividade. É importante definer que seriam colhidas todas as raizes tuberosas de cada planta. f) Os tratamentos em comparação – no exemplo com o experimento de mandioca poderia ser quatro tipos de adubos nitrogenados: uréia; nitrato de amônio; nitocálcio; nitrato de potássio. g) Hipóteses – devem ser definidas quais as hipóteses de acordo com o problema de pesquisa e qual a metodologia para se verificar as hipótsese. h) Softwares e pacotes – citar e referenciar. i) Exigências para publicação – se a pesquisa foi realizada com a possibilidade de publicação, atentar para as exigências dos periódicos da área de publicação. Algumas destas exigências somente serão atendidas se constar no planejamento experimental, tais como número mínimo de parcelas, se terá testemunha e como que esta será avaliada em comparação com os demais tratamentos, etc. Embora os termos usados na experimentação sejam os mesmos em todas as oito grandes áreas da ciência, existem publicações específicas para determinadas áreas, sempre focando em detalhes específicos desta área. A título de exemplo, focamos aqui a experimentação na área de Cultura de Tecidos Vegetais. Detalhes mais específicos para a referida área podem ser vistos nas publicações de Mize & Chun (1988), Compton (1994), Compton & Mize (1999), Mize et al. (1999), Ibañez et al. (2003), Nas et al. (2005), Ledo & Faria (2006) e Werner et al. (2012). Exercícios II) Outros conhecimentos são importantes para o pesquisador na experimentação e não foram abordados nesta unidade e se solicita responder: IIa) O que é bordadura e efeito bordadura e como proceder para amenizar os possíveis problemas do efeito bordadura? IIb) Costumamos representar uma sigla para análise de variância, podendo ser anova ou anava, ambas corretas Explique porque esta diferença; IIc) Citar quais as quatro pressuposições da anova, explique cada uma delas por meio de um exemplo e cite testes estatísticos que podem ser usados para verificar se os dados experimentais atendem às pressuposições da anova; IId) Mencione pelo menos quatro softwares estatísticos, free, que podem ser usados para se realizar análise de experimentos na área agropecuária, citando suas referências; IIe) Para o exemplo da sua resposta no item c, fazer os testes estatísticos usando o software R, colocando os scripts (apenas para os discentes do PPGAT, não para a graduação em Agronomia). Referências: COMPTON, M. E. Statistical methods suitable for the analysis of plant tissue culture data. Plant Cell, Tissue and Organ Culture, v. 37, p. 217-242, 1994. COMPTON, M. E.; MIZE, C. Statistical consideration for in vitro research: I – Birth of on idea to collecting data. In Vitro Cellular & Developmental Biology- Plant. v. 35, n. 2, p. 115-121, 1999. IBAÑEZ, M. A.; MARTIN, C.; PÉREZ, C. Alternative statistical analyses for micropropagation: a pratical case of proliferation and rooting phases in Viburnum opulus. In Vitro Cellular & Developmental Biology-Plant. v. 39, n. 5, p. 429-436, 2003. 28 LEDO, C. A. da S.; FARIA, G. A. Experimentação em cultura de tecidos. In: SOUZA, A. da S.; JUNGHANS, T. G. Introdução à micropropagação de plantas. Cruz das Almas: Embrapa, 2006, p. 141-152. MIZE, C. W.; KOEHLER, K. J.; COMPTON, M. E. Statistical considerations for in vitro research: II: data to presentation. In Vitro Cellular & Developmental Biology-Plant. v. 35, n. 2, p. 122-126, 1999. MIZE, C. W.; CHUN, Y. M. Analyzing treatment means in plant tissue culture research. Plant Cell, Tissue and Organ Culture, v. 13, p. 201-217, 1988. NAS, M. N.; ESKRIDGE, K. M.; READ,P. E. Experimental designs suitable for testing many factors with limited number of explants in tissue culture. Plant Cell, Tissue and Organ Culture, v. 81, n.2, p. 213-220, 2005. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. WERNER, E.T.; MOTTA, L.B.; MARTINS, M.Q.; LIMA, A.B.P.; SCHMILDT, E.R. Coeficiente de variação como medida da precisão em experimentos de cultura de tecidos de plantas. Plant Cell Culture Micropropagation, Lavras, v.8, n.1-2, p.27-36, 2012. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. Unidade III - DELINEAMENTOS EXPERIMENTAIS Como apontado na Unidade II, delineamento experimental é o desenho experimental. Estudaremos alguns deles na sequência. IIIa - DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 1. INTRODUÇÃO É o tipo de delineamento mais simples que existe. A distribuição dos tratamentos às unidades experimentais é feita completamente ao acaso, ou seja, não é feita nenhuma restrição na casualização. É indicado quando as condições experimentais são homogêneas sendo mais recomendado em condições de laboratório, onde as condições ambientais podem ser melhor controladas. 2. VANTAGENS E DESVANTAGENS DO DIC VANTAGENS a) Pode-se usar qualquer número de tratamento e repetições, sendo que o número de repetição pode ser diferente de um tratamento para outro sem que isto venha dificultar a análise. b) Apresentar maior número de graus de liberdade associado ao resíduo em relação a outros delineamentos. DESVANTAGENS a) Exige homogeneidade total das condições experimentais. b) Pode conduzir a uma estimativa de variância residual bastante alta, uma vez que, não se utilizando o princípio do controle local, todas as variações exceto as devidas a tratamentos, são consideradas como variação do acaso. 3. MODELO ESTATÍSTICO Para o DIC tem-se o seguinte modelo: yi_j = m + t_i + e_ij yij = é o valor observado na repetição j do tratamento i; m = média geral; t_i = é o efeito do particular tratamento i; e_ij = é o erro aleatório. O erro se deve ao fato de não ser possível controlar todas as condições experimentais. O erro experimental se refere às variações observadas entre as repetições do mesmo tratamento. 4. ANÁLISE DE VARIÂNCIA É uma técnica de análise estatística que permite decompor a variação total, na variação devido a diferença entre os efeitos dos tratamentos e na variação devido ao acaso (também chamado de erro experimental ou resíduo). Para que esta técnica seja empregada é necessário que sejam satisfeitas as pressuposições consideradas básicas da análise de variância. O quadro de ANOVA para o DIC é: FV GL SQ QM Fcalculado Tratamento (I - 1) SQT SQT / (I − 1) QMT / QMResíduo Resíduo (I) (J - 1) SQResiduo SQResiduo / (I)(J − 1) - Total IJ − 1 SQtotal - - As hipóteses para o teste F da análise de variância para tratamentos de efeito fixo são as seguintes: H0: t1 = t2 = ... = ti ou H0: ti = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: Não H0 ou Ha: ti ≠ 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. O Ftabelado é obtido na tabela F, no nível de significância 5% ou 1% e com número de graus de liberdade de tratamentos e de resíduo. A regra decisória para o teste F é a seguinte: C A B B D C A B A C A D B B C B A B C A D B D A C D D 3 mudas/vaso Variedade B 3 mudas/vaso Variedade A Tabela 4. Peso seco da parte aérea (g/parcela) de 4 variedades de cana-de-açúcar (A, B, C e D) em um delineamento inteiramente casualizado com 6 repetições Rep. \ Trat. A B C D 1 113,83 174,94 213,39 166,76 2 133,89 168,76 86,69 131,17 3 96,15 156,35 157,17 127,88 4 101,22 144,89 177,44 121,94 5 95,16 181,57 180,37 90,94 6 127,34 178,79 192,70 144,61 Total 667.59 1005.30 1011.87 922.59 3607,35 (total geral) Média 111,27 167,55 168,65 153,77 150,31 (média geral) Correção (C) C = (3607,35)^2/24 = 542207,2509 n n = 4.6 = 24 SQT SQTotal Resolvendo: 6.1) Hipóteses: H0: tA = tB = tC = tD , ou ainda, H0: ti = 0, ou ainda H0: mA = mB = mC = mD Ha: ti ≠ 0 ou ainda Ha: não H0 6.2) Explicando o modelo estatístico: Yij = m + ti + eij Yij = é o valor observado na repetição j do tratamento i. Considere-se ao tratamento 2 (variedade B) e repetição 3. YB3 = 156,35 g/parcela m = média geral. No exemplo, 𝑚̂ = 150,31 g/parcela ti = é o efeito do particular tratamento i. t̂B = 𝑚̂B − 𝑚̂ t̂B = 167,55 − 150,31 = 17,24 g/parcela eij = é o erro aleatório. êB3 = 𝑌̂B3 − 𝑚̂B êB3 = 156,35 − 167,55 = −11,2 g/parcela Yij = m + ti + eij 156,35 = 150,31 + 17,24 − 11,2 156,35 g/parcela = 156,35 g/parcela 6.3) Fazendo a análise de variância SQtotal = ∑ y^2_ij - C SQtotal = 113,83^2 + ... + 144,61^2 - 542207,2509 SQtotal = 28333,0508 SQT = ∑ T^2_i / r_i - C SQT = (667,59^2 + ... + 922,59^2) / 6 - 542207,2509 SQT = 13019,0329 SQResíduo = SQtotal - SQT SQResíduo = 28333,0508 - 13019,0329 SQResíduo = 15314,0179 FV GL SQ QM F_calc F_tab(5%) F_tab(1%) Variedades 3 13019,0329 4339,6776 5,67** 3,10 4,94 Resíduo 20 15314,0179 765,7009 Total 23 28333,0508 Significativo a 1% de probabilidade. Forma algébrica de determinar a SQResíduo no DIC: SQDesviosA = (113,83 - 111,27)^2 + ... + (127,34 - 111,27)^2 SQDesviosA = 1365,612 SQDesviosB = (174,94 - 167,55)^2 + ... + (178,79 - 167,55)^2 SQDesviosB = 1017,89 SQDesviosC = (213,39 - 168,65)^2 + ... + (192,7 - 168,65)^2 SQDesviosC = 9788,758 SQDesviosD = (166,76 - 153,77)^2 + ... + (144,61 - 153,77)^2 SQDesviosD = 3141,758 SQResíduo = SQDesvioA + ... + SQDesvioD SQResíduo = 1365,612 + ... + 3141,758 = 15314,02 38 Resultado da análise programa Genes: Programa Genes Anova DIC Costa.doc ANÁLISE DE VARIÂNCIA DA VARIÁVEL => peso seco p. a. cana _______________________________________________________________ FV GL SQ QM F Prob. _______________________________________________________________ TRATAMENTOS 3 13019.032913 4339.677637 5.6676 .005608 RESÍDUO 20 15314.0179 765.700895 _______________________________________________________________ TOTAL 23 28333.0508 _______________________________________________________________ MÉDIA geral 150.30625 CV (%) 18.4099469763459 _______________________________________________________________ Quando o teste é feito usando algum software como o Genes, o programa libera o valor-p que é o nível de significância real do teste. No caso acima, em laranja, indica que a análise usando o F de Snedecor é significativo a 0,56%. O valor-p pode ser obtido também em softwares como o R (R CORE TEAM, 2021) com a expressão pf(valor de Fcac,GLnumerador,GLdenominador,lowere.tail=FALSE). Para o exemplo: Os valores de Ftabelado, são obtidos em tabelas como Tabela F 5% e Tabela F 1% ou no R (R CORE TEAM, 2021) com a expressão: 39 qf(1-α,GLnumerador,GLdenominador) Veja: Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GL erro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 ... 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 1539 6170 6181 6192 6201 6209 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 49.43 99.44 99.44 99.44 99.45 99.45 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 2.70 3.05 3.02 2.99 2.96 2.94 6.4) Concluindo Rejeita-se a hipótese H0. Os tratamentos diferem entre si. Há diferença estatística significativa entre as médias de peso seco da parte aérea das quatro variedades de cana-de-açúcar. Há, portanto, necessidade de aplicação de um teste de comparação de médias de tratamentos. 6.5) Análise complementar A determinação da precisão do experimento normalmente pode ser feita usando o coeficiente de variação (CV). Citamos a seguir a classificação dos valores de CV feita por Pimentel Gomes (2009, p.21) em ensaios agricolas de campo. Classificação | Faixa de CV | Precisão Baixos | < 10% | Alta Médios | 10 ≤ CV < 20% | Média Altos | 20 ≤ CV < 30% | Baixa Muito Altos | ≥ 30% | Muito Baixa Para amostras vimos que: CV = 100s / m^ Para o caso do DIC: CV = 100 √QMResíduo / m^ Para o exemplo em questão: CV = 100 √765,7009 (g/parcela)^2 / 150,31 g/parcela = 18,41% 41 Pela classificação citada, o experimento do exemplo com variedades de cana tem CV médio, caso fosse realizado a campo. Considerando que, mesmo no campo, os valores de CV são variáveis em função da cultura agrícola ou da espécie animal, e ainda em função da característica em análise, vários trabalhos científicos apontam classificação de CV para estas especificidades. Já se encontram para melão, arroz, mamoeiro, milho comum, milho pipoca, soja, feijão, cana, erva mate, citros, alface, suínos, bovinos, cultura de tecidos vegetais, entre outros. Para o caso específico de cana em campo, consultar Couto et al. (2013). Segundo estes autores, para produtividade de cana, o CV é considerado muito alto a partir de 21% e não 30% como Pimentel Gomes (2009) propôs. 7. Apresentação de Tabelas em produção científica Normalmente a análise de variância é realizada para mais de uma característica do experimento e sua apresentação final em artigos, dissertações, teses, TCCs acaba sendo simplificada, contendo, de preferência, todas as características na mesma Tabela. Normalmente se oculta a coluna de SQ e a de F. Veja o exemplo na Tabela 1 a partir do artigo publicado por Ferreira et al. (2011). 8. Acerca do tamanho da parcela No experimento em questão, o tamanho da parcela foi de três mudas por vaso, em que, no experimento obteve-se um CV = 18,41%. E se o tamanho da parcela fosse de uma muda apenas por vaso? E se fosse de duas mudas por vaso? E se fosse de cinco mudas por vaso? E se fosse de 10 mudas por vaso? Sabe-se que, quanto maior o tamanho da parcela, menor o CV experimental. Se fosse usada apenas uma muda por vaso, o valor do CV seria > 18, 41% e, se o tamanho da parcela fosse igual a cinco mudas por vaso, o tamanho da parcela seria < 18,41%. 42 Sabe-se também que não existe uma relação linear entre o valor do CV e o tamanho da parcela (STORCK et al., 2011; BARBIN, 2013; FERREIRA, 2018). Desta forma, o ideal é que se determine o tamanho ótimo da parcela (top). A título de exemplo, veja a relação entre os possíveis tamanhos de parcela e os valores de CV para um experimento com mudas de mamoeiro em tubetes, avaliando-se o número de folhas por plântula, assim como a determinação do top pelo método de Meier e Lessman (1971). Metodologia de Meier e Lessman (1971) é feita partir de ensaio em branco e pode estimar o top para qualquer modelo experimental. Artigos científicos usando a determinação do top pelo método de Meier e Lessman (1971) podem ser encontrados para diversas características em experimentos com mamoeiro (SCHMILDT et al., 2016; CELANTI et al., 2016), quiabeiro (SANTOS et al., 2019), entre outros. 9. EXERCÍCIOS Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. DIC-1) Considere os dados a seguir, a partir de um DIC, realizado a campo, na área agropecuária, com r = 4 para todos os tratamentos qualitativos, de efeito fixo: Y .1 = ,2 675 Y .2 = ,3 35 Y .3 = ,4 65 43 Y .4 = ,510 Y .5 = ,7 30 Y .6 = ,8 65 SQRes. = 2,3975 Pede-se: a) Quantas parcelas teve o experimento? b) Fazer a ANOVA e interpreta corretamente; c) Determinar o CV experimental e o classifique segundo critério de Pimentel Gomes (2009). DIC-2) Considere um experimento em DIC com seis tratamento para promover a germinação de sementes de mamoeiro da variedade THB, in vitro. Os resultados da avaliação, depois de 80 dias da instalação do experimento, são apresentados a seguir: Repetições Tratamentos A B C D E F ---------- Germinação de sementes (%) ----------- 1 30 60 100 40 85 5 2 25 40 80 50 95 10 3 20 35 90 45 90 0 4 30 30 95 50 80 5 A partir das informações fornecidas, responda: a) Quantas parcelas teve o experimento? b) Faça a anova do referido experimento, e interprete corretamente; c) Apresente o valor do CV experimental e o interprete segundo critérios de Pimentel Gomes (2009). IIIb - DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) 1. INTRODUÇÃO Este tipo de delineamento é utilizado quando as condições experimentais não são completamente homogêneas. Nessa situação devemos então subdividir a área ou o material experimental em blocos (ou grupos) de tal forma que exista homogeneidade dentro de cada um deles e que cada um contenha uma repetição de cada tratamento distribuída inteiramente ao acaso dentro de cada bloco. O DBC envolve os três princípios básicos da experimentação: repetição, casualização e controle local. Em experimentos instalados segundo o DBC, não importa que as condições experimentais de um bloco sejam diferentes das condições experimentais do outro bloco. O que importa é a homogeneidade dentro de cada bloco. 2. VANTAGENS E DESVANTAGENS DO DBC VANTAGENS a) Conduz a estimativas menos elevadas do erro experimental em relação ao DIC, pelo fato de conseguir isolar do resíduo as variações resultantes da heterogeneidade das condições experimentais. O mesmo não acontece com o DIC, pois todas as variações entre as parcelas, exceto as devidas a tratamentos, ficam embutidas no resíduo; b) Controla a heterogeneidade do material utilizado ou do ambiente onde o experimento será conduzido; c) Apresenta um número razoável de graus de liberdade para o resíduo. Ele se encontra numa faixa intermediária entre o DIC, que apresenta um maior grau de liberdade para o resíduo, e o DQL. Sabe-se quanto maior o GLResid., maior sensibilidade terá os testes de hipóteses para detectar diferenças significativas entre os tratamentos avaliados, além de proporcionar maior precisão experimental. Portanto o DBC apresenta esta vantagem em relação ao DQL. DESVANTAGENS a) Quando ocorrem parcelas perdidas, é necessário o uso de fórmulas e/ou métodos especiais para estima-las, a fim de poder efetuar a análise de variância. Quando o número de parcelas perdidas é muito alto, há necessidade de se repetir o experimento. Isso porém não acontece com o DIC, onde permite que os tratamentos tenham número de repetições diferentes e a análise de variância pode ser efetuada do mesmo modo sem parcela perdida. b) Há uma redução do GLResid. pela utilização do controle local. 3. MODELO ESTATÍSTICO O modelo estatístico para o DBC é: Y_{ij} = m + t_i + b_j + e_{ij} onde: Y_{ij} = é o valor observado para a variável em estudo referente ao tratamento i no bloco j; m = média geral; t_{i} = é o efeito do tratamento i; b_{j} = é o efeito do bloco j; e_{ij} = é o erro associado à observação Y_{ij}. 4. ANÁLISE DE VARIÂNCIA O quadro de ANOVA para o DBC é: \[ \begin{array}{cccc} \text{FV} & \text{GL} & \text{SQ} & \text{QM} & \text{F} \text{calculado} \\ \text{Tratamento} & (I - 1) & \text{SQT} & \frac{\text{SQT}}{(I - 1)} & \frac{\text{QMT}}{\text{QMResiduo}} \\ \text{Bloco} & (J - 1) & \text{SQBloco} & \frac{\text{SQBloco}}{(J - 1)} & \frac{\text{QMBloco}}{\text{QMResiduo}} \\ \text{Resíduo} & (I - 1)(J - 1) & \text{SQResiduo} & \frac{\text{SQResiduo}}{(I - 1)(J - 1)} & - \\ \text{Total} & IJ - 1 & \text{SQtotal} & - & - \\ \end{array} \] As hipóteses para o teste F da análise de variância para tratamentos de efeito fixo são as seguintes: H_{0}: t_{1} = t_{2} = ... = t_{i} ou H_{0}: t_{i} = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. H_{a}: Não H_{0} ou H_{a}: t_{i} \neq 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. 5. FÓRMULAS \text{SQtotal} = \sum Y_{ij}^{2} - C, \quad \text{onde} \quad C = \frac{\left(\sum Y_{ij}\right)^{2}}{IJ} \text{SQT} = \sum \frac{T_{i}^{2}}{J} - C SQBloco = \sum \frac{Bloco_{j}^{2}}{I} - C \text{SQRésiduos} = \text{SQtotal} - \text{SQT} - \text{SQBlocos} 6. Exemplo: Estudou-se a influência de 4 tipos de cobertura morta (1 = sorgo, 2 = crotalária, 3 = milheto e 4 = vegetação espontânea) no peso seco de brócolis, em kg/parcela. O experimento foi instalado em DBC com 5 repetições. Os dados de peso seco estão dispostos na tabela a seguir (COSTA, 2003, p.63). Fazer a ANOVA. \begin{array}{|c|c|c|c|c|} \hline \text{BL I} & 2 & 3 & 1 & 4 \\ \hline \text{BL II} & 4 & 1 & 2 & 3 \\ \hline \text{BL III} & 2 & 1 & 4 & 3 \\ \hline \text{BL IV} & 3 & 2 & 1 & 4 \\ \hline \text{BL V} & 1 & 4 & 3 & 2 \\ \hline \end{array} Tabela 6. Peso seco (kg/parcela) de brócolis em um experimento em blocos casualizados (DBC) com 5 repetições em que foi avaliada a influência de 4 tipos de cobertura morta (1: sorgo, 2: crotalária; 3: milheto e 4: vegetação espontânea) Rep. \ Trat. | 1 | 2 | 3 | 4 | Total 1 | 72,8 | 69,0 | 45,3 | 66,5 | 253,6 2 | 58,3 | 64,1 | 60,9 | 67,4 | 250,7 3 | 50,4 | 72,1 | 67,9 | 58,6 | 249,0 4 | 51,6 | 73,6 | 66,2 | 27,4 | 218,8 5 | 59,0 | 65,0 | 52,0 | 39,0 | 215,0 Total | 292,1 | 343,8 | 291,6 | 259,6 | 1187,1 Média | 58,4 | 68,8 | 58,3 | 51,9 | 59,4 Correção (C) C = (1187,1²)/20 = 70460,3205 n = 4.5 = 20 Resolvendo: 6.1) Hipóteses: H0: t1 = t2 = t3 = t4 , ou ainda, H0: ti = 0, H1: ti ≠ 0 H0: σ²blocos = 0, H1: σ²blocos ≠ 0 6.2) Fazendo a análise de variância SQtotal = Σ Y²ij - C SQtotal = 72,8² + ... + 39,0² - 70640,3205 SQtotal = 2748,7495 SQT = Σ T²i / J - C SQT = 292,1² + ... + 259,6² / 5 - 70460,3205 SQT = 728,3935 SQBloco = 253,6² + ... + 215,0² / 4 - 70460,3205 SQBloco = 355,4020 SQResíduo = SQTotal - SQT - SQBloco SQResíduo = 2748,7495 - 728,3935 - 355,4020 SQResíduo = 1664,9540 Tabela da Análise de Variância FV | GL | SQ | QM | Fcalculado | Ftab(5%) | Ftab(1%) Cobertura | 3 | 728.3935 | 242.7978 | 1,7499ns | 3,49 | 5,95 Bloco | 4 | 355,4020 | 88,8505 | 0,6404ns | 3,26 | 5,41 Resíduo | 12 | 1664,9540 | 138,7462 Total | 19 | 2748,7495 ns Não significativo a 5% de probabilidade. Resolvendo o mesmo exemplo pelo programa Genes (CRUZ, 2006) a partir da planilha DBC Costa.prn: FV | GL | SQ | QM | F | Probabilidade(%) BLOCOS | 4 | 355.402 | 88.8505 TRATAMENTOS | 3 | 728.3935 | 242.7978 | 1,7499 | 21.0107 ns RESÍDUO | 12 | 1664.954 | 138.7462 TOTAL | 19 | 2748.75 MÉDIA | 59.355 CV(%) | 19.8451 MÍNIMO | 27.4 MÁXIMO | 73.6 DMS-Tukey(1%) | 28.97265 DMS-Tukey(5%) | 22.12457 Quando o teste é feito usando algum software como o Genes, o programa libera o valor-p que é o nível de significância real do teste. No caso acima, em laranja, indica que a análise usando o F é significativo a 21,01%, o que não é aceito na área agronômica pois aceita-se 5% ou menos de erro do tipo I. 6.3) Concluindo Não se rejeita a hipóteses H0. Conclui-se que as quatro coberturas mortas tiveram influência semelhante no peso seco de brócolis. Neste caso, não há necessidade de aplicação de um teste de comparação múltipla. 6.4) O CV experimental Para o caso do DBC: CV = (100 * √QMResíduo) / m̂ Para o exemplo em questão: CV = (100 * √138,7462 (kg/parcela)²) / 59,36 kg/parcela = 19,85% 51 Tratamento Blocos Total Trat. 1 2 3 4 1 142,36 144,78 145,19 138,88 571,21 2 139,28 137,77 144,44 130,61 552,10 3 140,73 134,06 136,97 136,36 548,12 4 150,88 135,83 136,97 136,36 560,04 5 153,49 151,75 150,22 Total Bloco 726,74 715,32 692,43 Obs.: O experimento ficará com 19 parcelas para análise, mas teve 20 parcelas na implantação. De acordo com Pimentel-Gomes (2009, p. 53), em experimentação agrícola ou zootécnica, deve-se ter no mínimo 20 parcelas e 10 graus de liberdade para o resíduo. Arquivo Excel®: DBC parcela perdida.prn Resultado da análise programa Genes: Programa Genes Anova DBC parcela perdida.doc Análise de variância 1 1 142.36 1 2 144.78 1 3 145.19 1 4 138.88 2 1 139.28 2 2 137.77 2 3 144.44 2 4 130.61 3 1 140.73 3 2 134.06 3 3 136.97 3 4 136.36 4 1 150.88 4 2 135.83 4 3 136.97 4 4 136.36 5 1 153.49 5 2 -9 5 3 151.75 5 4 150.22 _____________________________________________________________________________________________ FV GL SQ QM F Prob. _____________________________________________________________________________________________ Blocos Ajustado 3 131.922225 43.974075 Genótipos Ajustado 4 417.66657 104.416643 6.4689 .006269 Resíduo 11 177.5554 16.1414 ____________________________________________________________________________________________ Total 18 772.7476 ____________________________________________________________________________________________ Média 141.417368 CV(%) 2.840978 Mínimo 130.61 Máximo 153.49 DMS-Tukey(1%) 11.992644 DMS-Tukey(5%) 9.180299 ___________________________________________________________________________________________ Código para valores perdidos 52 8. Exercícios: Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. DBC-1) A seguir são apresentados resultados de um experimento em que se desejou verificar a eficiência de quatro tratamentos de poda na formação de brotos/planta podada de mamoeiro ‘Tainung 01’ aos dois anos de idade. Cada parcela era composta de cinco plantas. Tratamento Bloco Nº brotos/planta Tratamento Bloco Nº brotos/planta 1 1 0.8 3 1 11.6 1 2 0.2 3 2 9.6 1 3 1.2 3 3 12.4 1 4 1.0 3 4 12.2 1 5 0.8 3 5 10.8 2 1 3.0 4 1 17.8 2 2 2.2 4 2 17.2 2 3 3.2 4 3 18.6 2 4 3.6 4 4 18.8 2 5 3.2 4 5 17.0 Pede-se: a) Qual o número total de plantas usadas no experimento? b) Faça a ANOVA e interprete corretamente; c) Calcule o CV experimental e o interprete de acordo com Pimentel Gomes (2009). DBC-2) Foi realizada a análise de variância para dados cujas médias são apresentadas a seguir. Foram 3 repetições para cada tratamento qualitativo de efeito fixo. O valor do grau de liberdade de erro foi 10 e o quadrado médio do erro foi 4,08. a) Qual delineamento experimental foi usado? Demonstre pelos GL das fontes de variação. b) Quantas parcelas teve o experimento? y .1 = 95 5, y .2 = 87 8, y .3 = 86 9, y .4 = 26 3, y .5 = 108 2, c) Faça a ANOVA e interprete corretamente; d) Determine o CV experimental e o interprete segundo Pimentel Gomes (2009). 53 IIIc - DELINEAMENTO EM QUADRADO LATINO (DQL) 1 – INTRODUÇÃO Este delineamento é apropriado quando podemos reconhecer duas fontes de variação (dupla heterogeneidade) entre as unidades experimentais, antes da aplicação dos tratamentos. Cada uma dessas fontes de variação deve ter o mesmo número de níveis (linhas e colunas) que o número de tratamentos. É comum se designar a presença de dupla heterogeneidade por linha e por coluna. De fato, em experimentos a campo, geograficamente, a heterogeneidade de solo pode se dar em duas direções perpendiculares (linhas numa direção e colunas na direção perpendicular), como por exemplo nos casos de fertilidade de solo, como pode ser visto na ilustração seguinte. Podemos citar alguns exemplos de DQL em que a heterogeneidade é presente, geograficamente: 1) Exemplo de Pimentel Gomes (2009, p.96-99) - competição de cinco variedades de cana-de açúcar (A, B, C, D, E) para se avaliar a produtividade em kg/parcela; 2) Exemplo de Zimmermann (2014, p.98-100) - competição de oito genótipos de arroz para se avaliar a produtividade em kg/ha; 3) Exemplo de Ferreira (2018, p.178-181) - competição de cinco cultivares de feijão (A, B, C, D, E) para se avaliar a produtividade em kg/parcela; 4) Exemplo de Dias e Barros (2009, p.247-249) – produção de frutos de cacau obtidos de cinco cultivares; 5) Exemplo de Dias e Barros (2009, p.261) – competição de cultivares de café (A, B, C, D, E) para avaliar a produtividade em sacas beneficiadas por ha; 6) Exemplo segundo Storck et al. (2011, p.63-64) - avaliação de quatro cultivares de alho (A, B, C, D) em que o bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). Para o DQL não há requerimento para a existência física das linhas e colunas. Podemos citar como exemplos: 1) Exemplo de Storck et al. (2011) - Avaliar quatro adubos (A, B, C, D) na produção de Citrus sp, sendo que cada parcela é uma árvore e as fontes de variação são quatro idades das plantas (fator A 54 de heterogeneidade) e quatro tipos de poda (fator B de heteroneidade); 2) Exemplo citado pelo professor Alcinei Azevedo, contido em https://www.youtube.com/watch?v=ESYFFmfI92o&t=633s – avaliação da digestibilidade em bovinos submetidos aos tratamentos de aplicação de cinco formulações de silagens (A, B, C, D, E) em que as fontes de heterogeneidade são as cinco vacas e os cinco meses da avaliação (cada vaca é avaliada com uma formulação num determinado mês, visto que existem apenas cinco vacas par se realizar o experimento); 3) Exemplo contido no artigo de Gonçalves et al. (2015) – avaliada a ingestão de carboidratos totais em ovinos da raça Santa Inês diante dos tratamentos que eram os níveis de substituição do milho por silagem de amido de mandioca (0%, 25%, 50%, 75%, 100%) em que as fontes de heterogeneidade são os cinco ovinos e os cinco períodos de avaliação; 4) Num experimento estudou-se o efeito da época de castração no desenvolvimento e produção de suínos. Dispunha-se para esse estudo, de 5 matrizes da mesma raça, que foram submetidas à mesma alimentação e manejo durante o período de gestação. Os tratamentos foram: (A) Castração aos 56 dias de idade; (B) Castração aos 7 dias de idade; (C) Castração aos 36 dias de idade; (D) Inteiros; (E) Castração aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variação entre leitegadas (linhas) e a variação no peso inicial dos leitões (colunas), sendo a parcela experimental constituída de um leitão. Faixas de Peso Inicial Leitegadas 1 2 3 4 5 1 A C E D B 2 C E B A D 3 B D A E C 4 D A C B E 5 E B D C A Os experimentos em quadrado latino também levam em consideração os três princípios básicos da experimentação: repetição, casualização e controle local. Contudo, o controle local é mais eficiente que no delineamento em blocos casualizados, pois controla a heterogeneidade do ambiente ou do material experimental tanto na horizontal como na vertical, ou seja, os blocos são organizados de duas maneiras diferentes, uns constituindo as linhas, outros as colunas. Desta forma a estimativa do erro experimental é menor que no DBC. Como linhas e colunas são termos gerais referentes ao critério de classificação, elas podem ser tipos de tratamentos. Quando há interação entre dois ou todos os critérios de classificação, isto é, entre linhas, colunas e tratamentos, o F computado não segue a distribuição do F tabelado, invalidando o teste de significância. Em casos onde o pesquisador não está preparado para assumir a ausência de interação, o quadrado latino não deve ser usado. Neste caso, talvez seja preferível utilizar um esquema fatorial, pois somente se as interações entre os fatores em estudo fossem não significativos, seria válido a análise por quadrados latinos. 2 – CARACTERÍSTICAS DO DQL a) Este delineamento é recomendável quando as unidades experimentais puderem ser agrupadas de acordo com os níveis de duas fontes de variação. b) A característica principal deste delineamento é que um tratamento aparece uma vez, e só uma ao acaso, em cada linha e em cada coluna. Dentro das linhas e dentro das colunas deve-se ter a maior uniformidade possível. c) O número total de unidades experimentais necessárias para esse delineamento é igual a I2, sendo I o número de tratamentos. d) O número de tratamento é igual ao número de repetições, logo, este delineamento é menos flexível que blocos ao acaso. e) Em experimento de campo, ao contrário do que ocorre nos blocos ao acaso, onde os blocos não necessitam ser contíguos, os quadrados latinos perdem suas vantagens, se as parcelas não estiverem dispostas contiguamente no campo. 55 f) Uma vez que o número de tratamentos depende das linhas e das colunas, a flexibilidade do DQL fica muito restrita, não sendo recomendável para mais de 8 tratamentos, pois o número de repetições aumentaria exageradamente, resultando num experimento muito caro, além de perder sua eficiência em razão do aumento do erro experimental (a homogeneidade dentro das linhas e colunas diminui). Por outro lado, os quadrados latinos com 3x3 e 4x4 tem um número muito reduzido de parcelas, sendo necessário a utilização de vários quadrados latinos e realizar uma análise conjunta. O tamanho ideal oscila entre 5x5 a 8x8. g) O número mínimo de tratamentos é I=3, devido GL resíduo = (I-1) (I-2) h) Apresenta um número menor de graus de liberdade para o resíduo, pois se sabe que quanto maior o número de graus de liberdade para o resíduo, maior sensibilidade terá os testes de hipóteses para detectar diferenças significativas entre os tratamentos avaliados, além de proporcionar maior precisão experimental. 3 – INSTALAÇÃO DO EXPERIMENTO Para a disposição no campo do quadrado latino a ser efetivamente utilizado, inclusive com a determinação das posições dos tratamentos dentro de cada linha e de cada coluna, deve-se obedecer a certa sequência, tal como: a) Escolhe-se um quadrado latino tirado ao acaso de uma tabela de quadrados latinos, como por exemplo, para três tramanetos (A, B, C): Coluna Linha 1 2 3 1 A C B 2 B A C 3 C B A b) A partir disto, sorteia-se a ordem das colunas, obtendo-se um quadrado latino intermediário, com a permutação das colunas na sequência sorteada. Por exemplo, ordem sorteada: 3, 1, 2. Coluna Linha 3 1 2 1 B A C 2 C B A 3 A C B 56 c) Finalmente, sorteia-se a ordem das linhas, num processo análogo ao anterior. Por exemplo, ordem sorteada: 2, 3, 1. Coluna Linha 3 1 2 2 C B A 3 A C B 1 B A C d) Designar ao acaso as identificações (A, B, C) aos tratamentos. Se o quadrado latino fosse a partir de uma casualização sistemática, ficaria: a) Escolhe-se um quadrado latino a partir de uma sistematização: Coluna Linha 1 2 3 1 A B C 2 B C A 3 C A B b) A partir disto, sorteia-se a ordem das colunas, obtendo-se um quadrado latino intermediário, com a permutação das colunas na sequência sorteada. Por exemplo, ordem sorteada: 3, 1, 2. Coluna Linha 3 1 2 1 C A B 2 A B C 3 B C A c) Finalmente, sorteia-se a ordem das linhas, num processo análogo ao anterior. Por exemplo, ordem sorteada: 2, 3, 1. Coluna Linha 3 1 2 2 A B C 3 B C A 1 C A B d) Designar ao acaso as identificações (A, B, C) aos tratamentos. 4 – MODELO ESTATÍSTICO Todo delineamento experimental possui um modelo estatístico. Este modelo visa identificar quais fatores estão influenciando a variável em estudo. No DQL o modelo estatístico é: Y(i)jk = m + ti + lj + ck + e(i)jk Onde: Y(i)jk é o valor observado na parcela que recebeu o tratamento i na linha j e na coluna k; m é a média geral do experimento; ti é o efeito do tratamento i; lj é o efeito da linha j; ck é o efeito da coluna k; e(i)jk é o efeito do erro experimental na parcela que recebeu o tratamento i na linha j e na coluna k. O quadro da anova para DQL com I tratamentos é: FV GL SQ QM Fcalculado Tratamentos (I - 1) SQT QMT (I - 1) QMResíduo QMTratamento Linhas (I – 1) SQBLinhas QMLinhas (I - 1) QMResíduo Colunas (I – 1) SQBColunas QMColunas (I - 1) QMResíduo Resíduo (I - 1) (I -2) SQResíduo - (I - 1) (I - 2) Total I² – 1 SQtotal - - Onde: SQtotal = ΣY(i)jk² - C, onde C = (ΣY(i)jk)² / I² SQT = ΣTi² / I - C SQLinhas = ΣLj² / I - C SQColunas = ΣCk² / I - C SQResíduos = SQtotal – SQT – SQLinhas - SQColunas Geralmente o que interessa na análise de um experimento, é avaliar se existe diferença entre os tratamentos, o que pode ser verificado por meio do teste F para tratamentos. O valor do F calculado no quadro de ANOVA deve ser comparado com o valor de F tabelado, o qual é obtido na tabela de distribuição da variável aleatória F, de acordo com o nível de significância do teste, dos graus de liberdade para tratamentos e dos graus de liberdade para o resíduo. As hipóteses para o teste F da análise de variância para tratamentos qualitativos de efeito fixo são as seguintes: H0: t1 = t2 = ... = ti ou H0: ti = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: Não H0 ou Ha: ti ≠ 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. O teste F para linhas ou colunas, ou seja, comparação entre linhas ou entre colunas, geralmente é desnecessária, pois ao instalar o experimento no DQL, o pesquisador utilizou as linhas e colunas para controlar uma causa de variação já conhecida. Nos casos em que a variação entre linha e/ou entre colunas é duvidosa, o pesquisador pode realizar o teste F para estas fontes de variação, para servir como orientação para a instalação de futuros experimentos. H0: σ²Linhas = 0, H1: σ²Linhas ≠ 0 H0: σ²Colunas = 0, H1: σ²Colunas ≠ 0 6 – UM EXEMPLO NUMÉRICO O objetivo de um experimento foi estudar o efeito da época de castração no desenvolvimento e produção de suínos. Dispunha-se para esse estudo, de 5 matrizes da mesma raça, que foram submetidas à mesma alimentação e manejo durante o período de gestação. Os tratamentos foram: (A) Castração aos 56 dias de idade; (B) Castração aos 7 dias de idade; (C) Castração aos 36 dias de idade; (D) Inteiros; (E) Castração aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variação entre leitegadas (linhas) e a variação no peso inicial dos leitões (colunas), sendo a parcela experimental constituída de um leitão. Os ganhos de pesos, em kg, após o período experimental (28 semanas), estão apresentados na tabela a seguir. Faixas de Peso Inicial Leitegadas 1 2 3 4 5 Totais 1 93,0(A) 115,4(C) 116,9(E) 110,2(D) 110,4(B) 545,9 2 110,6(C) 96,5(E) 108,9(B) 97,6(A) 112,0(D) 525,6 3 102,1(B) 108,6(D) 77,9(A) 102,0(E) 111,7(C) 502,3 4 115,4(D) 94,9(A) 114,0(C) 100,2(B) 118,5(E) 543,0 5 117,6(E) 114,1(B) 118,7(D) 108,8(C) 80,2(A) 539,4 Totais 538,7 529,5 536,4 518,8 532,8 2656,2 Pede-se: a. Faça a análise de variância. b. A realização da anova deste exemplo pode ser visto em https://www.youtube.com/watch?v=Ro8Yzy3XIQY. Assista ao vídeo e faça uma análise crítica sobre a representação das hipóteses lançadas e também sobre o resultado da anova. Solução: a. Faça a análise de variância. H0: mA = mB = mC = mD = mE Ha: Não H0 H0: σ²Leitegada = 0, H1: σ²Leitegada ≠ 0 H0: σ²Faixa de peso inicial = 0, H1: σ²Faixa de peso inicial ≠ 0 C = (ΣY(I)JK)² / I² C = (2656,2)² / 5² = 282215,94 ΣQtotal = ΣY²(ij)k − C SQtotal = 93,0² + ⋯ + 80,2² − 282215,94 = 2998,4824 SQLinhas = ΣL²J / I − C SQLinhas = 545,9² + ⋯ + 539,4² / 5 − 282215,94 = 257,824 SQColunas = ΣC²k / I − C SQColunas = 538,7² + ⋯ + 532,8² / 5 − 282215,94 = 48,496 SQT = ΣT²i / I − C Tratamentos Totais Médias A 443.6 88.72 B 535.7 107.14 C 560,5 112,10 D 564,9 112,98 E 551,5 110,30 63 A = 13,1 D = 13,2 B = 24,5 C = 11,3 E = 18,5 C = 10 E = 18,9 D = 14,2 B = 23,0 A = 15,0 E = 18 B = 23,2 C = 11,2 A = 14,1 D = 12,9 B = 22,3 A = 14,2 E = 18,6 D = 11,7 C = 9,9 D = 12,3 C = 8,00 = 12,7 E = 18,9 B = 21,2 Pede-se: a) Quantas parcelas teve o experimento? b) Fazer a anova e interpretar; c) Determinar o CV experimental e interpretá-lo segundo critério de Pimentel Gomes (2009). DQL-2) Os dados a seguir referem-se a rendimento, em t/ha, de 4 cultivares (A, B, C, D) de alho. O bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). L (i) C (j) iY .. 1 2 3 4 1 B = 11 D = 4 A = 7 C = 15 37 2 A = 12 C = 9 D = 7 B = 9 37 3 D = 8 B = 7 C = 12 A = 5 32 4 C = 17 A = 7 B = 12 D =10 46 . j. Y 48 27 38 39 ... Y = 152 Fonte: Storck et al. (2011, p.63-64). d) Quantas parcelas teve no experimento? e) Fazer a anova e interpretar; f) Determinar o CV experimental e interpretá-lo segundo critério de Pimentel Gomes (2009). Literatura Citada BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. CELANTI, H.F. et al. Optimal plot size in the evaluation of papaya scions: proposal and comparison of methods. Revista Ceres, v.63, n.4, p.469-476, 2016. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf 64 COUTO, M.F.; PETERNELLI, L.A.; BARBOSA, M.H.P. Classification of the coefficients of variation for sugarcane crops. Ciência Rural, v.43, p.957-961, 2013. CRUZ, C. D. Programa GENES: estatística experimental e matrizes. Viçosa (MG): Editora UFV, 2006. 285 p. CRUZ, C.D. GENES: a software package for analysis in experimental statistics and quantitative genetics. Acta Scientiarum. Agronomy. v. 35, n. 3, p. 271-276, 2013. CRUZ, C.D. Genes Software – extended and integrated with the R, Matlab and Selegen. Acta Scientiarum. Agronomy. v. 38, n. 4, p. 547-552, 2016. DIAS, L.A. dos S.; BARROS, W.S. Biometria experimental. Viçosa: Suprema, 2009. 408p. FERREIRA, J.P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v.42, n.2, p.563-566, 2011. FERREIRA, P.V. Estatística Experimental Aplicada às Ciências Agrárias. Viçosa: Editora UFV, 2018. 588p. GONÇALVES, J.A.G.; ZAMBOM, M.A.; FERNANDES, T.; TININI, R.C.R.; SCHIMIDT, E.L.; CASTAGNARA, D.D.; CANABARRO, L.O.; CRUZ, E.A. Silagem de resíduo da extração de amido da mandioca em substituição ao milho moído da ração para ovinos. Revista Brasileira de Saúde e Produção Animal, Salvador, v.16, n.4, p.839-849, 2015. https://www.scielo.br/pdf/rbspa/v16n4/1519-9940-rbspa-16-4-0839.pdf MEIER, V.D.; LESSMAN, K.J. Estimation of optimum field plot shape and size for testing yield in Crambe abyssinica Hochst. Crop Science, v.11, p.648-650, 1971. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SANTOS, K.T.H. et al. Comparison of methodologies to determine the optimum plot size for okra seedlings evaluation. Journal of Agricultural Science, v.11, n.5, p.388-394, 2019. SCHMILDT, E.R. et al. Optimum plot size and number of replications in papaya field experimente. Revista Brasileira de Fruticultura, v.38, n.2, p.e-373, 2016. STORCK, L.; LOPES, S.J.; GARCIA, D.C.; ESTEFANEL, V. Experimentação vegetal, 3. ed. Santa Maria: UFSM, 2011. 198 p. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. Nota 1: Na relação de livros de estatística experimental citadas nesta unidade, todos abordam DIC e DBC e, apenas os de Costa (2003) e de Banzatto e Kronka (2013) não abordam DQL. Nota 2: Como complemento desta unidade, em vídeo-aulas, recomendamos as postagens do professor da UFMG, Alcinei Mistico Azevedo: https://www.youtube.com/channel/UCDGyvLCJnv9RtTY1YMBMVNQ/videos Nota 3: Para referências em artigos científicos, das três referências de Cruz (2006, 2013, 2016) citadas anteriormente, dê preferência para as de 2013 e de 2016, apenas por questões do idioma. 74 Apresentaremos os resultados a seguir, usando-se letras minúsculas na frente da média, começando pela letra a. Faremos aqui a apresentação comparando com o teste de Tukey e de Duncan. Note que o teste de Tukey é o mais rigoroso. Tukey a 5% Duncan a 5% DMS-t a 5% Variedade Média Variedade Média Variedade Média C 168,65 a C 168,65 a C 168,65 a B 167,55 a B 167,55 a B 167,55 a D 153,77 ab D 153,77 a D 153,77 a A 111,27 b A 111,27 b A 111,27 b ∆ 44,74 Maior DMS 35,92 DMS-t 33,33 A resolução do exemplo com cana (um DIC), no Genes (CRUZ, 2006) pode ser feita em duas etapas (1 = anova; 2 = teste de média) a partir dos dados originais ou em uma etapa (teste de média) a partir dos resultados da anova. A resolução pelo R (R CORE TEAM, 2021) pode ser feita a partir de scripts desenvolvidos pelo usuário ou a partir de pacotes. Para a resolução de anova e teste de média num DIC (arquivo: cana.txt, semelhante ao arquivo DIC Costa.prn mostrado à página 37, acrescentando os títulos de cada coluna, sem separação para cada coluna), apresentamos a seguir o script a partir do pacote “ExpDes.pt” (FERREIRA et al., 2018): #Usando o ExpDes.pt #install.packages("ExpDes.pt") X<-read.table("e:\\dados\\cana.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dic(variedade, prod, quali = TRUE, mcomp = "lsd", nl = FALSE, hvar='bartlett', sigT = 0.05, sigF = 0.05) #variedade refere-se a tratamento (trat) na planilha “cana.txt”. Testes de agrupamento de médias sk para Scott-Knott e, ccboot para comparações múltiplas bootstrap, tukey para teste de Tukey, duncan para teste de Duncan, snk para teste Studente-Newman-Keuls, lsd para teste t-LSD, lsdb para o tsete LSD de Bonferroni, ccf para o tsete de Calinski e Corsten baseado na distribuição F. 75 Para resolução no R num DBC, apresentamos a seguir o script a partir do pacote “ExpDes.pt” (FERREIRA et al., 2018) para o caso do experimento de cana, supondo que o mesmo tenha sido em DBC (arquivo: cana dbc.txt): X<-read.table("e:\\dados\\cana dbc.txt",header=T) # Leitura dos dados X library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dbc(variedade, bloco, prod, quali = TRUE, mcomp = "lsd", nl=FALSE, hvar='oneillmathews', sigT = 0.05, sigF = 0.05) As planilhas cana.txt e cana dbc.txt são apresentados a seguir, com os respectivos resultados de análise no R (R CORE TEAM, 2021) com o pacote ExpDes.pt (FERREIRA et al., 2028) para o teste de média DMS-t: 76 A seguir colocaremos a planilha e a resolução do R de um DQL (arquivo: castra dql.txt) com aplicação do teste de média DMS-t. O modelo da planilha e o resultado da análise é apresentado a seguir: Conclusão: a castração não é eficiente no ganho de peso dos suínos e prejudicial quando feito aos 56 dias após nascimento. 77 O script para o DQL em questão é apresentado a seguir: X<-read.table("e:\\dados\\castra dql.txt",header=T) # Leitura dos dados X library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dql(castra, linha, coluna, ganhopeso, quali = TRUE, mcomp = "lsd", sigT = 0.05, sigF = 0.05) Mostraremos a seguir, mais um exemplo da aplicação dos testes de média, comparando os três métodos apresentados, destacando o rigor e o poder de cada teste. Para tal, os dados foram retirados do artigo de Ferreira et al. (2011), já citado na unidade anterior. As análises foram feitas para a característica porcentagem de enraizamento, em nível de 5% de probabilidade de erro tipo I. Os subsídios para análise no software Genes (CRUZ, 2006) são apresentados a seguir, nas Tabelas 1 e 2 (GL resíduo, QM resíduo, Médias dos tratamentos). 78 Tukey a 5% Duncan a 5% DMS-t a 5% Clones Média Clones Média Clones Média T39 93,34 a T39 93,34 a T39 93,34 a T12 70,00 ab T12 70,00 b T12 70,00 b T10 53,33 bc T10 53,33 bc T10 53,33 bc T26 46,67 bc T26 46,67 bc T26 46,67 cd T14 46,67 bc T14 46,67 bc T14 46,67 cd T01 43,33 bc T01 43,33 c T01 43,33 cd T50 40,00 bc T50 40,00 c T50 40,00 cd T05 36,67 bc T05 36,67 c T05 36,67 cd T43 33,33 bc T43 33,33 c T43 33,33 cd T35 30,00 c T35 30,00 c T35 30,00 d ∆ 36,97 Maior DMS 25,09 DMS-t 21,77 + rigor - rigor - poder + poder 4. TESTE DE DUNNETT (1955) Este teste é utilizado quando as únicas comparações que interessam ao experimentador são aquelas feitas entre um determinado tratamento padrão, geralmente a testemunha, e cada um dos demais tratamentos, não havendo interesse na comparação dos demais tratamentos entre si. Assim, um experimento com Ι tratamentos (um dos quais a testemunha ou padrão, P) permite a aplicação do teste a Ι-1 comparações. 81 Para determinar o valor de td no R, podemos usar o pacote nCDunnett (BROCH; FERREIRA, 2014). Para o exemplo em questão, com três tratamentos a serem comparados com a testemunha, o valor de td fica: #install.packages(“nCDunnett”) library(nCDunnett) rho<-c(0.5,0.5,0.5) #0.5 sempre que o mesmo n° de repetições entre tratamentos e testemunha nu<-20 #GL de resíduo delta <- c(0,0,0) #valor zero indica não centralidade n<-32 # n° padrão do pacote p<-0.95 # nível de significância acumulado, independente se é uni ou bilateral qNCDun(p, nu, rho, delta, n, two.sided=FALSE) Tabela Dunnett a 5%, unilateral GLerro I Tratamentos de experimento em DIC, DBC ou DQL, comparados com a testemunha 2 3 4 5 6 7 8 9 10 15 20 10 2.1507 2.3376 2.4657 2.5624 2.6398 2.7042 2.7591 2.8070 2.8493 3.0082 3.1173 11 2.1273 2.3100 2.4350 2.5293 2.6048 2.6675 2.7211 2.7677 2.8089 2.9636 3.0696 ... 20 2.0274 2.1923 2.3044 2.3888 2.4560 2.5118 2.5594 2.6007 2.6372 2.7739 2.8674 ... 120 1.9340 2.0827 2.1831 2.2583 2.3180 2.3674 2.4095 2.4459 2.4781 2.5982 2.6801 Determinado no R, com seis casas decimais, usando o pacote nCDunnett (BROCH; FERREIRA, 2014). 83 Arquivo Excel®: médias dunnett cana1.prn A Tabela 2, a seguir, foi retirada do artigo publicado por Pereira et al. (2012) e ilustra a opção de apresentação dos resultados segundo Cruz (2006). 84 Como ficaria a apresentação, caso fossem duas testemunhas. Vejamos, a seguir, um exemplo hipotético. Como relatado anteriormente, este tipo de solução é apresentado no software Genes (CRUZ, 2006). Híbridos de mamoeiro Produtividade (t/ha) (1) Solo x Solo 1 112 Solo x Solo 2 100a Formosa x Formosa 1 200 Formosa x Formosa 2 173b Formosa x Formosa 3 163b ‘THB’ – Testemunha 1 86a ‘Tainung 01’ – Testemunha 2 160b DMS 15 (1) Médias, de cada híbrido de mamoeiro, seguidas da letra a, não diferem da testemunha THB, e seguidas da letra b não diferem da testemunha ‘Tainung 01’ a 5% de probabilidade pelo teste de Dunnett. 85 Resolvendo no R, pacote asbio (AHO, 2020): X<-read.table("e:\\dados\\cana.txt",header=T) # Leitura dos dados #install.packages(“asbio”) require(asbio) with(X, pairw.anova(y=prod, x=variedade, control="A", conf.level = 0.95, method="dunnett")) 5. TESTE t DE STUDENT para contrastes ortogonais O teste t é um teste clássico, que pode ser utilizado para comparar de maneira ótima, um par pré-escolhido entre duas médias ou mesmo para contrastes envolvendo mais de duas médias. Porém, como requisito para a sua aplicação conscienciosa, exige-se que: 1. As comparações a serem realizadas sejam escolhidas a “priori”, ou seja, antes de serem examinados os dados. 2. Pode-se fazer, no máximo, tantas comparações quanto são os graus de liberdade para tratamentos, e os contrastes devem ser ortogonais. Considerando um contraste de médias, em sua forma geral, 86 Ci = a1m1 + a2m2 + . . . + anmn 0) ( n i 1 ia = ∑ = Do qual obtemos a estimativa por meio do estimador. n n 2 2 1 1 a mˆ . . . a mˆ a mˆ Cˆ i + + + = Que pode ser testada pelo teste t, calculando-se a estatística t, dada por: ∑ − = − = J a QMR C C C V C C t i i i i i 2 ˆ ( ˆ ) ˆ ˆ que tem distribuição t de Student com n2 graus de liberdade, sendo n2 o número de graus de liberdade do resíduo e QMR o quadrado médio residual da análise de variância. Quando aplicamos o teste t a um contaste, C, geralmente o interesse é verificar se a sua estimativa, Cˆ , difere significativamente de zero, valor que t deveria assumir se a hipótese H0: C = 0 fosse verdadeira, comparado com a hipótese alternativa Ha:C ≠ 0. O valor da estatística t deve ser comparado (em valor absoluto) com os valores críticos de t, tabelados em função do no de graus de liberdade e do nível de significância do teste ou seja tTab = tα (n2). A regra de decisão, neste caso, é a seguinte: Se t ≥ tTab ⇒ Rejeita-se H0, caso contrário, ou seja, se t < tTab ⇒ não se rejeita H0. Exemplo: Num experimento foram avaliados quatro tratamentos de controle do mato numa determinada cultura e obtidas as seguintes produtividades, em t/ha (adaptado de STORCK et al., 2011, p. 68 – 72). O experimento foi DIC com seis repetições e o QMR = 90. Tratamento Produt. Média (t/ha) T1 = sem controle do mato 45 T2 = capina manual 55 T3 = herbicida A 70 T4 = herbicida B 60 Pede-se: a) Existe a possibilidade de fazer quantos contrastes? R.: 3 contrastes (veja a seguir). 87 T1 = Sem manejo (testemunha) 4 3 2 1 1 - 1 mˆ 1mˆ - 1 mˆ 3 ˆ Cˆ − = m T2 = Capina manual T3 = Herbicida A T4 = Herbicida B T1 = Sem manejo (testemunha) T2 = Capina manual 4 3 2 2 - 1 mˆ 1mˆ 2 mˆ Cˆ − = T3 = Herbicida A T4 = Herbicida B T1 = Sem manejo (testemunha) T2 = Capina manual T3 = Herbicida A 4 3 3 - 1 mˆ 1mˆ Cˆ = T4 = Herbicida B b) Verifique a ortogonalidade para os contrastes previamente estabelecidos. A ortogonalidade é verificada quando a covariância entre os contrastes é igual a zero. Verificação: i mˆ Coeficientes do contraste i Cˆ : Covariâncias 1ˆC 2ˆC 3ˆC a1i a2i a3i a1i a2i a1i a3i a2i a3i 1ˆm + 3 0 0 0 0 0 2ˆm - 1 + 2 0 - 2 0 0 3ˆm - 1 - 1 + 1 + 1 - 1 - 1 4ˆm - 1 - 1 - 1 + 1 + 1 + 1 ∑ 0 0 0 0 0 0 contrastes Contrastes ortogonais 88 R.: Os contrastes estabelecidos são ortogonais. Caso os contrastes não fossem ortogonais, a análise deveria ser por Scheffé. Desta forma, fica claro que, quando os grupos de médias são estabelecidos pré-instalação do experimento e com contrastes ortogonais, usa-se o teste de t. Quando os grupos de médias não exigem ortogonalidade mas são definidas pelo pesquisador, usa-se teste de Scheffé. No entanto, caso os grupos de médias sejam formadas a partir da análise, pode-se usar o teste de Scott-Knott. Este teste é um teste de agrupamento de médias e não deve ser chamado de teste de média. c) Analise os contrastes pelo teste t. Tratamento imˆ (t/ha) a1i a2i a3i a1i imˆ a2i imˆ a3i imˆ T1 = s/ controle 45 +3 0 0 135 0 0 T2 = cap. manual 55 -1 2 0 -55 110 0 T3 = herbicida A 70 -1 -1 +1 -70 -70 70 T4 = herbicida B 60 -1 -1 -1 -60 -60 -60 0 0 0 -50 -20 10 1ˆC 2ˆC 3ˆC 0 : 1 0 C = H 0 : C1 ≠ Ha 3,73 180 50 6 12 90 50 ˆ ( ˆ ) ˆ ˆ 2 1 1 = − − = − = = − = ∑ J a QMR C C V C C t i i i ( ) ,2086 %;20 . 5 gl = ttab Como o tcalc > ttab, rejeita-se H0. Há diferença na produtividade quando se controla ou não o mato. 93 Sugestão de apresentação em trabalhos científicos é apresentado na tabela seguinte. Sugerimos consultar o artigo de Andrade Junior et al. (2013) para verificar a apresentação quando envolver mais de uma característica. Contraste S© Decisão(1) 1ˆC = sem capina x capina -50 40,91 Ha 2ˆC = capina manual x capina química -20 28,93 H0 3ˆC = herbicida A x herbicida B 10 16,70 H0 (1) H«: C = 0 -5 H®: C ≠ 0 ao nível de 5% pelo teste de Scheffé. Verifica-se que, a capina permite aumento da produtividade e que, no entanto, não há diferença estatística comprovada na produtividade quando se faz capina manual ou química e nem entre os herbicidas usados. Notar que, pelo teste de t, houve diferença significativa na produtividade quanto à capina manual ou química, mostrando que o teste de Scheffé é mais rigoroso que o teste de t. COMPARAÇÃO ENTRE OS TESTES DE COMPARAÇÕES de Médias Sempre que os contrastes de interesse forem escolhidos antes da obtenção dos dados experimentais e forem ortogonais entre si, devemos utilizar o teste t de Student. O motivo dessa escolha é que os intervalos de confiança obtidos por este teste tem amplitude menor que os fornecidos pelos outros testes de comparação de médias. Se não forem ortogonais entre si, devemos escolher entre Dunnett, Tukey, Duncan, DMS-t ou Scheffé. Se interessarem apenas as comparações da testemunha com cada um dos outros tratamento, usar o teste de Dunnett. Se interessarem todas as possíveis comparações de médias, de tratamentos, duas a duas, usar DMS-t, Duncan ou Tukey (melhor). O método de scheffé deve ser adotado quando temos interesse em vários contrastes, com pelo menos um deles envolvendo mais de duas médias, não necessitando obedecer ortogonalidade entre os contrastes. Se os contrastes de interesse forem determinados após a realização do experimento (após a obtenção dos dados), o teste t de Student não deve ser utilizado, devendo-se usar Scheffé. 94 Resumindo: Ortogonais Previamente escolhidos - Teste t Sugeridos pelos dados - Não usar t Mais de duas médias - Scheffé Contrastes Comparar somente com a testemunha - Dunnett Não ortogonais Tukey Duas médias entre si Duncan DMS-t Exercícios teste de média Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. Usar nível de significância de 5 e 1% para a anova e α = 5% para o teste de média. Média-1) Considere um experimento em DIC com seis tratamento para promover a germinação de sementes de mamoeiro da variedade THB, in vitro. Os resultados da avaliação, depois de 80 dias da instalação do experimento, são apresentados a seguir: Repetições Tratamentos A B C D E F ---------- Germinação de sementes (%) ----------- 1 30 60 100 40 85 5 2 25 40 80 50 95 10 3 20 35 90 45 90 0 4 30 30 95 50 80 5 Pede-se: a) Faça a anova do referido experimento, apresente o valor do CV experimental e o interprete segundo critérios de Pimentel Gomes (2009); b) Teste de média usando os métodos de Tukey, Duncan e DMS-t, comparando os três métodos no que se refere ao rigor e poder; c) Fazer o teste de Dunnett de forma mais adequada, considerando o tratamento F como testemunha. 95 Média-2) O artigo publicado por Ribeiro et al. (1991) refere-se ao comportamento de cultivares de batata em Celina, distrito de Alegre-ES. O experimento foi em DBC com cinco repetições. Para a característica produção comercial, em t/ha, ao final do experimento, após análise de dados obteve-se: Diamant = 17,604; Frisa = 15,269; Monalisa = 13,413; Mondial = 21,120. Ainda, CV = 6,5%. Pede-se faça os testes de média de Tukey, Duncan e DMS-t. Média-3) A tabela a seguir refere-se à produção de borracha natural seca, obtida de 14 clones de seringueira, média de oito anos de sangria, delineado em DBC com quatro repetições, conforme Alem et al. (2015). De acordo com os resultados estatísticos apresentados na tabela, qual clone de seringueira é recomendado para o plantio? Para sua resposta consulte as considerações feitas por Storck et al. (2011) sobre comparações com testemunha. Clones Média de produção (kg/ha/ano) (1) % em relação à testemunha IAC 15 1868,59 bc 102,71 IAC 35 1728,01 cd 94,95 IAC 41 1855,44 bc 101,68 IAC 44 1691,48 cd 92,44 IAC 113 1497,58 de 82,82 IAC 111 2268,93 a 124,82 PB 28/59 1802,84 bc 100,20 PB 235 2045,39 ab 113,76 PB 252 1126,72 f 61,76 PB 260 1327,49 ef 72,77 PB 330 1177,69 ef 65,05 RRIM 606 758,63 g 41,69 RIM 725 1137,35 f 63,16 RRIM 600 - testemunha 1808,95 bc 100,00 (1) Médias com letras diferentes diferem estatisticamente entre si no teste de diferença mínima significativa pelo método de Tukey a 5% de probabilidade. Média-4) Os dados a seguir referem-se a rendimento, em t/ha, de quatro cultivares (A, B, C, D) de alho, num DQL. O bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). L (i) C (j) iY .. 1 2 3 4 1 B = 11 D = 4 A = 7 C = 15 37 2 A = 12 C = 9 D = 7 B = 9 37 3 D = 8 B = 7 C = 12 A = 5 32 4 C = 17 A = 7 B = 12 D =10 46 . j. Y 48 27 38 39 ... Y = 152 Fonte: Storck et al. (2011). 96 a) Fazer a anova e interpretar; b) Fazer teste de média de Tukey, Duncan e DMS-t. Média-5) O artigo publicado por Nascimento et al. (2018) refere-se à avaliação de 16 características comerciais em 11 híbridos de mamoeiro em Linhares-ES, sendo 10 novos híbridos e a testemunha UENF/Caliman 01. A comparação entre as médias foi feita pelo teste de agrupamento de Scott-Knott. Faça, para a característica produtividade, as seguintes análises, e devida conclusão: a) Teste de média usando os métodos de Tukey, Duncan e DMS-t, comparando os três métodos no que se refere ao rigor e poder; b) Fazer o teste de Dunnett de forma adequada. Média-6) Um treinador de corrida rústica, objetivando melhorar o desempenho de seus atletas, testou três novas técnicas de preparação. Para tanto trabalhou com um grupo de 15 atletas completamente homogêneos para as características essenciais. A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso e de tal forma que o número de atletas avaliados em cada uma das técnicas fosse o mesmo. Os resultados foram: REPETIÇÃO TÉCNICAS DE PREPARAÇÃO 1 2 3 1 130 125 127 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Pede-se: a) Quais foram os Princípios Básicos da Experimentação utilizados pelo Pesquisador neste Experimento? b) Qual foi a unidade experimental nesta pesquisa? c) É possível concluir que existe diferença entre as técnicas de preparação?; d) Se existir diferença entre as técnicas, aplicar os testes de Tukey, de Duncan e DMS-t e informar qual a técnica recomendada para cada método usado. Média-7) Com o objetivo de diminuir o consumo dos motores à gasolina, uma determinada indústria petroquímica testou quatro novas formulações de gasolina, as quais se diferenciavam pelo tipo de aditivo que era acrescentado a mesma durante o seu processo de fabricação. Para efetuar o teste, a indústria petroquímica utilizou carros completamente homogêneos para todas as características. A designação das formulações aos carros foi feita inteiramente ao acaso. Após os testes de rodagem, os resultados obtidos foram (km/L): Aditivo a base de: Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 14,81 6,56 10,06 10,09 No de carros 10 10 10 10 97 SQresíduo = 6,0264 Com base nos resultados acima, pede-se: a) Existe diferença estatística significativa entre os quatro tipos de formulações? b) Estabeleça um contraste entre o grupo à base de formulação ácida contra o grupo à base de formulação básica. Obtenha a estimativa para este contraste (C1). c) Estabeleça um contraste para comparar aditivos de formulação ácida. Obtenha a estimativa deste contraste (C2). d) Estabeleça um contraste para comparar aditivos de formulação básica. Obtenha a estimativa deste contraste (C3). e) Faça teste t para os contrastes estabelecidos. f) Prove que SQT = SQC1 + SQC2 + SQC3. g) Faça o teste de Scheffé para os contrastes estabelecidos e compare com o teste de t realizado no item e. h) Faça uma análise crítica do experimento. Média-8) Em um experimento com cinco variedades de forrageiras (A,B,C,D,E), em DBC, as produções em ton/ha foram: Bloco Variedades A B C D E 1 12 21 22 15 12 2 13 27 29 11 18 3 11 26 24 10 18 4 9 25 25 12 17 Pede-se: a) O quadro da ANOVA b) Aplicar o teste de Tukey. Média-9) A seguir são apresentados resultados de um experimento em que se desejou verificar a eficiência de quatro tratamentos de poda na formação de brotos/planta podada de mamoeiro ‘Tainung 01’ aos dois anos de idade. Cada parcela era composta de cinco plantas. Tratamento Bloco Nº brotos/planta Tratamento Bloco Nº brotos/planta 1 1 0.8 3 1 11.6 1 2 0.2 3 2 9.6 1 3 1.2 3 3 12.4 1 4 1.0 3 4 12.2 1 5 0.8 3 5 10.8 2 1 3.0 4 1 17.8 2 2 2.2 4 2 17.2 2 3 3.2 4 3 18.6 2 4 3.6 4 4 18.8 98 2 5 3.2 4 5 17.0 A partir das informações fornecidas, faça ao teste de média de Tukey, Duncan e DMS-t, comparando os três métodos quanto ao poder e rigor e informar quais tratamentos seriam indicados. Média-10) Considere o experimento em DQL dado por Dias e Barros (2009, p.261) – competição de cultivares de café (A, B, C, D, E) para avaliar a produtividade em sacas beneficiadas por ha. A = 13,1 D = 13,2 B = 24,5 C = 11,3 E = 18,5 C = 10 E = 18,9 D = 14,2 B = 23,0 A = 15,0 E = 18 B = 23,2 C = 11,2 A = 14,1 D = 12,9 B = 22,3 A = 14,2 E = 18,6 D = 11,7 C = 9,9 D = 12,3 C = 8,00 A = 12,7 E = 18,9 B = 21,2 A partir das informações fornecidas, faça ao teste de média de Tukey, Duncan e DMS-t, comparando os três métodos quanto ao poder e rigor e informar quais tratamentos seriam indicados. Média-11) O resumo da análise de variância de um experimento instalado segundo o DBC, para verificar se existe diferença entre 5 tipos de levedura na produção de cerveja, é fornecido abaixo: FV GL SQ QM F Bloco 3 Tratamento Resíduo 4,895 Total Totais de tratamento: T1 = 12,0 T3 = 24,0 T5 = 45,6 T2 = 35,2 T4 = 22,0 Pede-se: a) Existe diferença entre os 5 tipos de levedura, na produção de cerveja? b) Aplicar o teste de Tukey. 99 Referências: AHO, Ken. (2020) Package ‘asbio’. https://cran.r-project.org/web/packages/asbio/asbio.pdf ANDRADE JUNIOR, S. et al. Comparison between grafting and cutting as vegetative propagation methods for conilon coffee plants. Acta Scientiarum. Agronomy, Maringá, v.35, n.4, p.461-469, 2013. ALEM, H.M. et al. Avaliação de clones de seringueira para a região noroeste do Estado de São Paulo. Revista Ceres, v.62, n.5, p.430-437, 2015. http://dx.doi.org/10.1590/0034-737X201562050002 BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. BROCH, S.C.; FERREIRA, D.F. Pacote nCDunnett do software R para o cálculo das distribuições do teste de Dunnett não-central. Sigmae, Alfenas, v.3, n.1, p. 7-14. 2014. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf CRUZ, C. D. Programa Genes: estatística experimental e matrizes, Viçosa: Editora UFV, 2006, 285 p. DIAS, L.A. dos S.; BARROS, W.S. Biometria experimental. Viçosa: Suprema, 2009. 408p. DUNCAN, David B. Multiple range and multiple F tests. Biometrics, v.11, p.1-42, 1955. DUNNETT, C.W. A multiple comparison procedure for comparing several treatments with a control. Journal of the American Statistical Association, New York, v.50, n.272, p.1096-1121, 1955. FERREIRA, J.P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v.42, n.2, p.563-566, 2011. FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. FERREIRA, P.V. Estatística Experimental Aplicada às Ciências Agrárias. Viçosa: Editora UFV, 2018. 588p. NASCIMENTO, A.L. et al. Obtaining and evaluating new hybrids of papaya tree. Journal of Agricultural Science, v.10, n.7, p.146-155, 2018. https://doi.org/10.5539/jas.v10n7p146 PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. PIMENTEL GOMES, F.; GARCIA, C. H. Estatística aplicada a experimentos agronômicos e florestais: exposição com exemplos e orientações para uso de aplicativos. Piracicaba: Fealq, 2002. 309p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. RESENDE, M. D. V. Genética biométrica e estatística no melhoramento de plantas perenes. Brasília: Embrapa Informação Tecnológica, 2002. 975 p. 100 RIBEIRO, L.G.; RODRIGUES, C.; SCHMILDT, E.R. Comportamento de cultivares de batata (Solanum tuberosum L.) na região serrana de Alegre-ES. Boletim Agronômico, v.3, n.1, p.5-11, 1991. SCHEFFÉ, Henry. The analysis of variance. New York: J. Wiley, 1959. 461p. STORCK, L.; GARCIA, D. C.; LOPES, S. J.; ESTEFANEL, V. Experimentação vegetal. 3.ed. Santa Maria: UFSM, 2011. 198 p. TUKEY, JOHN, W. Comparing individual means in the analysis of variance. Biometrics, v.5, p.99-114, 1949. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 101 Unidade V – Experimentos Fatoriais INTERAÇÃO ENTRE FATORES EXPERIMENTAIS (ESQUEMAS FATORIAIS, IMPLICAÇÕES E INTERPRETAÇÃO) 1 – INTRODUÇÃO Experimentos fatoriais são aqueles em que se estudam simultaneamente dois ou mais fatores, cada um deles com dois ou mais níveis. O fatorial é um tipo de esquema, ou seja, uma das maneiras de organizar os tratamentos e não um tipo de delineamento, que representa a maneira pela qual os tratamentos são distribuídos às unidades experimentais. Na verdade, os experimentos fatoriais são instalados segundo um tipo de delineamento experimental, como por exemplo, o DIC e o DBC. Os tratamentos são obtidos pelas combinações dos níveis dos fatores. Num experimento fatorial completo, cada nível de um fator combina com todos os níveis dos outros fatores. Os experimentos fatoriais são aplicáveis a todos os campos da ciência. Sua principal aplicação é quando se quer saber sobre o efeito de diversos fatores que influenciam na variável em estudo e o relacionamento entre eles. A simbologia comumente utilizada, para experimentos fatoriais é indicar os níveis dos fatores em teste. Por exemplo, um experimento fatorial 2x4x6. O produto 2x4x6 informa que no experimento foram testados simultaneamente 3 fatores. O primeiro possui 2 níveis, o segundo, 4 níveis e o terceiro, 6 níveis. Quando o número de níveis é igual para todos os fatores, pode-se utilizar a simbologia: nF, em que: F – no de fatores; n = no de níveis de cada fator. Por exemplo, experimento fatorial 43. A potência 43 informa que o experimento tem 3 fatores com 4 níveis cada um, totalizando 12 tratamentos. Nesta unidade estudaremos a anova e desdobramentos apenas experimentos com dois fatores, embora representaremos a distribuição de GL para três fatores. 2 – VANTAGENS E DESVANTAGENS DE UM EXPERIMENTO FATORIAL i) Vantagens a) Permite o estudo dos efeitos principais e o efeito da interação entre os fatores; b) O número de graus de liberdade associado ao resíduo é alto quando comparado com os experimentos simples dos mesmos fatores, o que contribui para diminuir a variação residual, aumentando a precisão do experimento. Veja: Um pesquisador necessita estudar, num trabalho de cultura de tecidos vegetais, a influência de sacarose e também de sais de MS na multiplicação in vitro de determinada espécie. É necessário estudar sais de MS completo e meia força e sacarose nos níveis 0; 10; 20; 30 e 40 g/L. Veja como ficariam os GL para os estudos isolados e no estudo fatorial, num DIC com cinco repetições. 104 A B 0 1 0 10 15 1 20 20 Interação negativa, pois 10 < 15 A B 0 1 0 10 15 1 20 25 Interação nula, pois 15 = 15 O efeito da interação pode ser mais facilmente compreendido por meio de gráficos: 1- Quando não há interação Quando não há interação a diferença entre os resultados dos níveis de um fator são iguais para todos os níveis do outro fator. 105 Quando não há interação, ocorre um paralelismo entre as retas. 2- Quando há interação Quando há interação as diferenças entre os níveis de um fator dependem dos níveis do outro fator. No caso a existe uma interação devida à diferença na grandeza da resposta. No caso b existe uma interação devida a diferença na direção da resposta. 5– ANÁLISE DE VARIÂNCIA A análise de variância de um experimento fatorial é feita desdobrando-se a soma de quadrados de tratamentos nas partes devido aos efeitos principais de cada fator e na parte devido à interação entre os fatores. As hipóteses estatísticas, para o teste F da análise de variância, devem ser lançadas para cada um dos efeitos principais e também para a interação. As hipóteses são do seguinte tipo, considerando um fatorial simples, com os fatores A e B: - EFEITO PRINCIPAL H0: mA1 = mA2 = ..... = mAi ou seja, todos os possíveis contrastes entre médias de níveis do fator, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0, ou seja, existe pelo menos um contraste entre médias de níveis do fator, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. Para o fator B, de forma semelhante. - INTERAÇÃO H0: Os fatores atuam independentemente. Ha: Os fatores não atuam independentemente. 108 6 – QUADRO AUXILIAR Pode-se montar um quadro auxiliar, denominado Quadro de Interação, composto pelos totais de tratamentos, cujos valores são obtidos pela soma de todas as repetições para o tratamento em questão. Este quadro facilita o cálculo das somas de quadrados da análise de variância. B1 B2 . . . Bj Totais de Ai A1 (AB)11 (AB)12 . . . (AB)1j A1 A2 (AB)11 (AB)22 . . . (AB)2j A2 : : : : : : AI (AB)I1 (AB)I2 . . . (AB)Ij AI Totais de Bj B1 B2 . . . Bj G Para os fatores A e B qualitativos, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Estuda-se um fator dentro dos níveis de outro fator por teste de média Compara médias de A e médias de B Compara médias de A Compara médias de B Termina análise (teste protegido) 109 Para o misto, fator A qualitativo e o fator B quantitativo, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Estuda-se as médias de A dentro dos níveis (doses) do fator B (opcional) e a regressão de B dentro dos níveis de A Compara médias de A e faz regressão Compara médias de A Faz-se regressão de B Termina análise (teste protegido) Para os dois fatores quantitativos, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 Blocos A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Superfície de resposta Regressão de A e regressão de B Regressão de A Faz-se regressão de B Termina análise (teste protegido) 110 Para os casos de se fazer a regressão, na mioria dad vezes se busca a máxima eficiência técinica, assunto a ser visto no capítulo sobre análise de regressão. 7 - EXEMPLOS 7.1) Caso em que a interação não dará significativa. Seja um experimento com dois fatores A (três cultivares de cana) e B (quatro sistemas de manejo), constituindo 12 tratamentos, dispostos no DIC com 3 repetições. Os totais de tratamentos, referindo-se médias de um corte de cana, em t/ha, constam da tabela a seguir, e SQTotal = 1498,67. Variedades Sistemas de manejo Totais 1 2 3 4 1 120 132 150 162 564 2 126 141 162 171 600 3 144 150 171 186 651 Totais 390 423 483 519 1815 HIPÓTESES: - EFEITO PRINCIPAL para Variedades H0: mA1 = mA2 = ..... = mAi ou seja, todos os possíveis contrastes entre médias de variedades, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0 ou seja, existe pelo menos um contrates entre médias de variedades, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. - EFEITO PRINCIPAL para Sistemas de manejo H0: mB1 = mB2 = ..... = mBk ou seja, todos os possíveis contrastes entre médias de sistemas de manejo, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0 ou seja, existe pelo menos um contrates entre médias de sistemas de manejo, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. - INTERAÇÃO H0: Os fatores atuam independentemente. Ha: Os fatores não atuam independentemente. 114 Tratamentos Blocos Totais 1 2 3 P1D1 11,82 12,03 12,55 36,4 P1D2 12,34 14,08 12,13 38,55 P1D3 13,41 12,98 13,35 39,74 P2D1 6,97 10,26 9,02 26,25 P2D2 8,96 9,02 9,84 27,82 P2D3 8,48 9,66 8,5 26,64 P3D1 7,53 7,67 7,81 23,01 P3D2 6,71 7,87 9,49 24,07 P3D3 7,82 9,44 9,37 26,63 Totais 84,04 93,01 92,06 269,11 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\amendoim fatorial dbc.txt", header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais fat2.dbc(Peneira,Densidade,bloco,Produção,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("Peneira", "Densidade"), sigT = 0.05, sigF = 0.05) 115 7.3) Caso em que a interação dará significativa Vamos considerar os dados de um experimento, inteiramente casualizado, com quatro repetições, no esquema fatorial 3x2, para testar o efeito de 3 Recipientes (R1, R2, R3) para a produção de mudas e 2 espécies de eucaliptos (E1 e E2), quanto ao desenvolvimento das mudas (adaptado de BANZATTO; KRONKA, 2013, p.106-112). Os Recipientes e as Espécies estudados foram: R1 = saco plásticos pequenos R2 = saco plásticos grande R3 = Laminado E1 = Eucalyptus citriodora E2 = Eucalyptus grandis 116 Tratamentos Repetições 1 2 3 4 R1E1 26,2 26,0 25,0 25,4 R1E2 24,8 24,6 26,7 25,2 R2E1 25,7 26,3 25,1 26,4 R2E2 19,6 21,1 19,0 18,6 R3E1 22,8 19,4 18,8 19,2 R3E2 19,8 21,4 22,8 21,3 Solução: Recipiente Espécie Total de Recipientes E1 E2 R1 102,6 101,3 203,9 R2 103,5 78,3 181,8 R3 80,2 85,3 165,5 Total Espécies 286,3 264,9 551,2 120 Resolução no R: Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\eucalipto fatorial.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais fat2.dic(Recipiente,Espécie,Altura,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("Recipiente", "Espécie"), sigT = 0.05, sigF = 0.05) Parte dos resultados do R: 121 Exercícios FAT-1) Quais são os tratamentos no exemplo 7.1 da página 110 da apostila? FAT-2) Resolver o exemplo 7.2 da página 113 da apostila, de forma manual; FAT-3) Represente o quadro da anova (somente FV e GL) para o caso de um experimento em esquema fatorial em DBC com J = 3 repetições. Foram três leguminosas semeadas em três tipos de solo e sementes protegidas ou não com fungicida. FAT-4) Realize as análises necessárias e interprete o seguinte experimento, de acordo com o que se fornece na sequência. Trata-se de um experimento em esquema fatorial 2 x 3 retirado de Costa (2003, p.67-73). Foram avaliadas duas variedades de cana de açúcar e três tipos de inoculante, num DBC e os dados referem-se à produção em t/ha. Realize a análise manual e usando o software R (R CORE TEAM, 2021). 122 Literatura Citada BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. STORCK, L.; LOPES, S.J.; GARCIA, D.C.; ESTEFANEL, V. Experimentação vegetal, 3. ed. Santa Maria: UFSM, 2011. 198 p. 123 UNIDADE VI – EXPERIMENTO EM PARCELAS SUBDIVIDIDAS 1 – INTRODUÇÃO Nos experimentos com esquema em parcelas subdivididas (PSD) existem dois tipos de tratamentos em comparação: os principais e os secundários. É um tipo especial de experimento fatorial, em inglês denominado “Split plot”. Designam-se os tratamentos às parcelas sem qualquer restrição (DIC) ou no caso do DBC, organizam-se os blocos e sorteiam-se os tratamentos dentro de cada bloco. Para obter as subparcelas, subdivide-se cada parcela em tantas subparcelas quantos sejam os tratamentos secundários. As parcelas podem ser subdivididas no espaço e no tempo e são comuns na área agrícola. Exemplos: 1) Pesquisadores da UNEMAT tem trabalhado com melhoramento de estrelícia (Strelitzia reginae). A produção das flores pode ser feita sob telado e a pleno sol. Um dos trabalhos, em cuja equipe participa o professor Willian Krause (engenheiro agrônomo formado na Ufes), é avaliar os vários genótipos nos dois sistemas citados. Os experimentos são realizados em PSD em que os dois sistemas (1 = sob telado; 2 = a pleno sol) constituem-se nas parcelas e, os genótipos avaliados nestes dois sistemas constituem as subparcelas. Para este caso tem-se PSD no espaço. 2) No exemplo anterior, os pesquisadores podem ainda avaliar características fisiológicas ou produtivas ao longo do tempo, por exemplo, a cada dois meses. Neste caso tem-se uma sub-subparcela e esta é dividida no tempo, e o experimento é chamado de parcela sub-subdividida (PSSD). Note que as subparcelas foram subdivididas no tempo, também chamado de análise de medidas repetidas no tempo. 3) Comparar 3 variedades de uma hortaliça em 2 níveis de irrigação: - Os canteiros são as parcelas; - Os tratamentos principais são os níveis de irrigação (I1 e I2); - Os tratamentos secundários são as variedades (V1, V2 e V3). I2 I2 V1 V2 V3 V2 V1 V3 I2 I1 V2 V1 V3 V1 V3 V2 I1 I2 V2 V3 V1 V3 V1 V2 I1 I1 V1 V2 V3 V2 V3 V1 Esquema de um DIC com parcelas subdivididas. 124 Ou em DBC: I1 I2 Bloco I V2 V1 V3 V2 V1 V3 I2 I1 Bloco II V1 V3 V2 V2 V1 V3 I2 I1 Bloco III V3 V1 V2 V1 V2 V3 I1 I2 Bloco IV V1 V2 V3 V2 V3 V1 Esquema de um DBC com parcelas subdivididas. Importante: Às vezes o pesquisador pode optar por um experimento em parcelas subdivididas ou por um experimento fatorial. No exemplo em questão, se fosse experimento fatorial, os tratamentos seriam: I1V1; I1V2; I2V3; I2V1; I1V2 e I2V3, que poderia ser assim representado num DBC: Bloco I I2V2 I1V1 I2V3 I1V2 I2V1 I1V3 Bloco II I2V1 I2V3 I1V2 I2V2 I1V1 I1V3 Bloco III I1V3 I1V1 I2V2 I2V1 I1V2 I2V3 Bloco IV I1V1 I2V2 I1V3 I1V2 I2V3 I2V1 Esquema de um DBC com 2 fatores. Qual critério para optar por parcelas subdivididas ou por fatorial? Deve ser feito em parcelas subdivididas toda vez que: a) A parcela for “unidade física”, como vaso, animal, uma pessoa, que pode receber vários tratamentos secundários; 125 b) O tratamento principal exige “grandes parcelas”, como é o caso de irrigação; c) O pesquisador deseja comparar tratamentos secundários com maior precisão; d) Na prática fica complicado instalar um fatorial como no caso de experimento com irrigação; e) A possibilidade de efeito bordadura seja evidente, como nos casos de deriva de irrigação, sombreamento devido porte diferente de plantas de cultivares diferentes. 4) Experimento realizado pelo doutor Omar Schmildt na Uenf (SCHMILDT, 2010), como parte de seu doutoramento trabalhando com cultura de tecidos vegetais, sob orientação do professor Eliemar campostrini e coorientação do professor Edilson Romais Schmildt. O delineamento experimental foi inteiramente casualizado com quatro repetições, segundo um esquema de parcelas sub subdivididas, tendo nas parcelas dois tipos de luz (lâmpadas fluorescentes brancas e lâmpadas vermelhas tipo Growlux, ambas com 90 μmol m-2 s-1), nas subparcelas, dois tipos de sistemas de ventilação (fechado e ventilado) e nas subsubparcelas, quatro concentrações de sacarose (10; 20; 30 e 40 g L-1). 5) Considere o experimento realizado por Souza et al. (2005) no qual foi avaliada a produção de biogás. O experimento foi em PSSD 4x3x2 num DBC com 20 repetições. As parcelas foram constituídas por 4 tempos de retenção hidráulica (TRH = 10; 15; 25 35 dias), 3 temperaturas (T = 25; 35; 40 °C) e agitação (Ag = sem agitação; com agitação). Este é um bom exemplo para se verificar como fica o desdobramento da anova quando a interação tripla se apresenta estatisticamente significativa. 6) Experimento com nabo forrageiro, conduzido pelo Eng. Agrônomo Antonio Renan Berchol da Silva, dentro do projeto Biodiesel. Descrição: - Cultivares CATI AL 1000 e IPR 116; - Delineamento Experimental: Blocos casualizados com parcelas sub-subdivididas com quatro repetições; - Parcelas: manejo de irrigação (com e sem irrigação); - Sub-parcelas: espaçamento entre linhas (15, 30 e 45cm); - Subsub-parcelas: cultivares CATI AL-1000 e IPR-116. Obs: população fixa de 12 kg/ha de sementes. Avaliações após a instalação: Velocidade de emergência (até 50%); População inicial; Altura de plantas a cada semana até florescimento; Início do florescimento (“uniformidade”); Área foliar no florescimento pleno; Ocorrência de pragas e doenças. Avaliações de final de ciclo: População final; Massa da parte aérea; Altura de plantas; Número total de síliquoas; Número de síliquoas por planta; Número de síliquoas chochas; Comprimento de síliquoas; Número de ´grãos por síliquoas; Massa de grãos (“produtividade”); Massa de 1000 grãos e Teor de óleo dos grãos. Vide esquema dos tratamentos no experimento, apenas para enxergar onde estão as parcelas, subparcelas e subsubparcelas; Falta ainda aleatorizar. 126 Parcelas B3 B2 B4 B1 131 Solução: Trata-se de DIC num esquema em PSD, com J = 10 repetições Nas parcelas estão os Sistemas de Plantio (Sulcos simples; Sulcos duplos) Nas Subparcelas estão os Cortes (Cana-Planta; Cana-Soca) Sistema de plantio Corte Total de parcelas Sistema de plantio Corte Total de parcelas Cana- planta Cana- soca Cana- planta Cana- soca Sulcos simples 92,9 84,5 177,4 Sulcos simples 92,9 84,5 177,4 128,6 86,5 215,1 128,6 86,5 215,1 121,7 84,5 206,2 121,7 84,5 206,2 122,8 77,0 199,8 122,8 77,0 199,8 118,1 88,1 206,2 118,1 88,1 206,2 115,7 82,4 198,1 115,7 82,4 198,1 121,4 84,0 205,4 121,4 84,0 205,4 126,9 88,8 215,7 126,9 88,8 215,7 118,1 85,7 203,8 118,1 85,7 203,8 122,4 78,8 201,2 122,4 78,8 201,2 1188,6 840,3 2028,9 1188,6 840,3 2028,9 Sulcos simples 122,5 84,5 207,0 Sulcos simples 122,5 84,5 207,0 110,0 85,0 195,0 110,0 85,0 195,0 115,0 85,5 200,5 115,0 85,5 200,5 125,0 88,0 213,0 125,0 88,0 213,0 105,0 86,7 191,7 105,0 86,7 191,7 110,0 80,7 190,7 110,0 80,7 190,7 115,0 88,3 203,3 115,0 88,3 203,3 105,0 89,3 194,3 105,0 89,3 194,3 108,5 94,3 202,8 108,5 94,3 202,8 118,3 90,0 208,3 118,3 90,0 208,3 Total 1134,3 872,3 Total 1134,3 872,3 2006,6 ¸ = 2028,9 + 2006,6 = 4035,5 136 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\psd cana SP Corte.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais psub2.dic(SistemaPlantio,Corte,repet,Prod,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("SistemaPlantio", "Corte"), sigT = 0.05, sigF = 0.05) 143 qtukey(1-α,ntratamentos,glresíduo) qtukey(0.95,8,38) Caso 4: DMS×ÚÛÓÍÜÊÎÚÊ = 4,53M(2 − 1)38,3238 + 80,0635 2x4 = 17,43 Realização pelo R: 144 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\adubo verde psd dbc.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais psub2.dbc(AduboVerde,Ano,bloco,Prod,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("AduboVerde", "Ano"), sigT = 0.05, sigF = 0.05) 148 10 - EXERCÍCIOS PSD1) O experimento a seguir foi citado por Steel; Torrie; Dickey (1997, p. 405 - 414), no qual foram comparadas 4 variedades de aveia e 4 tipos de tratamentos de sementes. Utilizou-se o modelo em parcelas subdivididas. As 4 variedades constituíram as parcelas, dispostas no delineamento em blocos casualizados com 4 repetições e os 4 tipos de tratamentos de sementes constituíram as subparcelas. Os dados constam da tabela a seguir, e referem-se à produtividade de aveia, em bushels/acre: Var. Trat (sem.) Blocos Totais (A) (B) 1 2 3 4 A1 B1 42,9 41,6 28,9 30,8 144,2 B2 53,8 58,5 43,9 46,3 202,5 B3 49,5 53,8 40,7 39,4 183,4 B4 44,4 41,8 28,3 34,7 149,2 190,6 195,7 141,8 151,2 679,3 A2 B1 53,3 69,6 45,4 35,1 203,4 B2 57,6 69,6 42,4 51,9 221,5 B3 59,8 65,8 41,4 45,4 212,4 B4 64,1 57,4 44,1 51,6 217,2 234,8 262,4 173,3 184,0 854,5 A3 B1 62,3 58,5 44,6 50,3 215,7 B2 63,4 50,4 45,0 46,7 205,5 B3 64,5 46,1 62,6 50,3 223,5 B4 63,6 56,1 52,7 51,8 224,2 253,8 211,1 204,9 199,1 868,9 A4 B1 75,4 65,6 54,0 52,7 247,7 B2 70,3 67,3 57,6 58,5 253,7 B3 68,8 65,3 45,6 51,0 230,7 B4 71,6 69,4 56,6 47,4 245,0 286,1 267,6 213,8 209,6 977,1 Totais 965,3 936,8 733,8 743,9 3379,8 Pede-se para fazer, de forma manual e no R: a) Análise de variância; b) Aplicar teste de Tukey a 5% de acordo com resultado da análise de variância. 149 PSD2) Supor um experimento com três rações A, B e C em seis blocos casualizados, sendo cada parcela constituída de dois bovinos de corte. Em uma determinada fase do experimento, os bovinos dentro de cada parcela, passaram a receber, por sorteio, um dos dois tipos de suplementos minerais M e P, conforme esquema a seguir: Os ganhos individuais no final do experimento foram: Pede-se, faça-se as análises apropriadas (anova, teste Tukey, CV) para concluir a respeito do experimento. Fazer de forma manual e usando o R. A seguir são apresentados os resultados para conferência: 150 CV (parcela) = 7,59% CV (subparcela) = 7,03% 10 - LITERATURA CITADA: FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SATTERTHWAITE, F.E. An approximate distribution of estimates of variance components. Biometrics Bulletin, Washington-DC, v.2, n.6, p.110-114, 1946. 151 SCHMILDT, O. Cultivo in vitro e estaquia dos mamoeiros Golden e Uenf/Caliman 01. 2010. 119f. Tese (Doutorado em Produção Vegetal), Universidade Estadual do Norte Fluminense Darcy Ribeiro, Campos dos Goytacazes, 2010. SOUZA, C.F. et al. potencial de dejetos de suínos como substrato na biodigestão anaeróbia sob efeito de diferentes temperaturas e tempos de retenção hidráulica. Revista Ceres, Viçosa, v.52, n.300, p.255-265, 2005. STEEL, R.G.D.; TORRIE, J.H.; DICKEY, D.A. Principles and procedures of statistics: a biometrical approach. 3 ed. New York: MacGraw-Hill Book Companies. 1997. 666p. ISBN: 0070610282. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 152 Unidade VI - REGRESSÃO E CORRELAÇÃO - ASSOCIAÇÃO DE RESPOSTAS QUANTITATIVAS 1. INTRODUÇÃO Variáveis quantitativas são aquelas variáveis que correspondem a números resultantes de contagens (discreta) ou de medidas (contínuas), ao contrário das variáveis qualitativas que correspondem a atributos, categorias (estas são nominais quando não são passíveis de ordenação, ou ordinal quando são passíveis de ordenação). Quando a associação entre variáveis quantitativas se manifesta sem que seja possível estabelecer efeito causativo de uma delas sobre a outra, denominamos a ligação entre elas de correlação. A variação de uma delas acompanha a da outra sem que se possa caracterizar uma dependência entre elas. Exemplos para correlação: a) Notas de alunos no secundário e no universitário. Note que são os mesmos alunos. Número Estudante Classificação Secundário (%) Universidade 1 Jim C. 80 1,0 2 Ed 82 1,0 3 Karen 84 2,1 4 Márcia 85 1,4 5 Peter 87 2,1 6 Bevely 88 1,7 7 Tom 88 2,0 8 Marc 89 3,5 9 Sid 90 3,1 10 Jim L. 91 2,4 11 Linda 91 2,7 12 Al 92 3,0 13 John 94 3,9 14 Susan 96 3,6 15 Ann Marie 98 4,0 Fonte: adaptado a partir de Stevenson (2001, p. 370). b) Porcentagem de enraizamento (ENR) e crescimento de ramos (CR) para 10 clones de mamoeiro ‘Tainung 01’ F2 cultivados in vitro (FERREIRA et al., 2011). 153 Clone Média ENR (%) CR (cm) T39 93,34 a 6,12 a T12 70,00 ab 4,17 b T10 53,33 ab 1,87 cd T26 46,67 b 2,50 c T14 46,67 b 0,97 cd T01 43,33 b 1,37 cd T50 40,00 b 0,60 d T05 36,67 b 1,60 cd T43 33,33 b 0,53 d T35 30,00 b 0,87 d DMS 44,94 1,56 Médias seguidas da mesma letra, na vertical, não diferem entre si pelo teste de Tukey a 1% de probabilidade. c) Altura na cernelha de um animal e o comprimento do pescoço do mesmo animal. Analisa-se dados para vários animais; A associação, entretanto, pode se manifestar por uma dependência clara de uma variável em relação à outra. Neste caso, quando a variação de uma variável ocasiona, pela própria ação, uma variação flagrante na outra variável, dizemos que a segunda depende da primeira. Aqui o efeito causativo da primeira, chamada de variável independente (X), atua sobre a variação da segunda, a variável dependente (Y). Para estes casos, trabalha-se com análises de regressão. Exemplos para regressão: a) Um experimento envolvendo 3 drogas (DA, DB e DC) foi conduzido para estudar cada efeito de droga no batimento cardíaco (bpm) dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos (T1 = 5; T2 = 10; T3 = 15; T4 = 20). Veja: 154 Os dados representam um experimento em DIC num esquema em parcelas subdivididas no tempo. As parcelas eram constituídas das drogas e as subparcelas eram os tempos para medir o batimento cardíaco. Os tratamentos drogas são qualitativos e os tratamentos tempo são quantitativos. Caso apenas a fonte de variação tempo dê significativa pelo teste F, procede-se a avaliação desta variável por análise de regressão, em que batimento cardíaco (Y) depende do tempo (X) de aplicação das drogas. Caso a interação dê significativa, há necessidade de se estudar o tempo dentro de cada droga. b) Índice de área foliar (IAF) e idade das plantas, em dias, em feijão ‘Jalo Precoce’ (ZIMMERMANN, 2004, p. 272): Idade (X) IAF (Y) 16 0,16115 23 0,38815 30 0,71196 36 1,16696 43 2,06033 57 2,20084 64 1,96282 71 1,87116 155 c) Número de brotações/explante e nível de floroglucinol durante multiplicação in vitro de internódios de laranja pêra (SCHMILDT et al., 2000). d) Porcentagem de brotações enraizadas e nível de floroglucinol durante enraizamento in vitro de ramos de laranja pêra (SCHMILDT et al., 2000). 2. CORRELAÇÃO A correlação entre duas variáveis poderá ser calculada quando se deseja saber se a variação de uma delas acompanha proporcional ou inversamente a variação da outra. O termo correlação significa associação entre duas variáveis aleatórias. Na análise de correlação, se procura determinar o grau de associação entre duas v. a. ou seja, se procura medir a covariabilidade entre elas. A correlação pode ser positiva, negativa ou aproximadamente nula e estará sempre dentro do intervalo –1 ≤ r ≤ 1. Outras características de r: 1) Um relacionamento positivo (r é +) entre duas variáveis indica que os valores altos (baixos) de uma das variáveis correspondem valores altos (baixos) da outra; 2) Um relacionamento negativo (r é -) entre duas variáveis indica que os valores altos (baixos) de uma das variáveis correspondem valores baixos (altos) da outra; 156 3) Um relacionamento zero (r≈0) indica que alguns valores altos estão em correspondência com valores baixos e outros estão em correspondência com valores altos; 4) O sinal de r é sempre o mesmo sinal de b1, o coeficiente angular de uma reta imaginária ajustada aos dados, que será visto em regressão. Vimos que o seu valor varia de –1,00 a +1,00. Pode-se classificar a correlação, conforme segue: Valor de r Interpretação - 1,00 Correlação negativa perfeita - 0,95 até < - 1,00 Correlação negativa forte - 0,50 até < - 0,95 Correlação negativa moderada - 0,10 até < - 0,50 Correlação negativa fraca > - 0,10 até < + 0,10 Ausência de Correlação + 0,10 até < + 0,50 Correlação positiva fraca + 0,50 até < + 0,95 Correlação positiva moderada + 0,95 até < + 1,00 Correlação positiva forte + 1,00 Correlação positiva perfeita Fonte: Adaptado de Levin (1987). Na prática é quase impossível encontrar correlação perfeita positiva, perfeita negativa ou correlação exatamente igual a zero. No entanto, para efeitos didáticos, apresentamos a seguir valores que nos levarão a encontrá-las, quando calculados pela correlação de Pearson. -1 0 +1 Perfeita Negativa Não Correlação Perfeita Positiva Xi Yi Xi Yi Xi Yi 1 7 1 2 1 3 2 6 2 4 2 4 3 5 3 3 3 5 4 4 4 4 4 6 5 3 5 2 5 7 157 Coeficiente r de Pearson (1894) Nome em homenagem ao matemático que a desenvolveu, Karl Pearson. Tanto as variáveis X quanto Y devem ser contínuas e apresentarem distribuição normal. Em correlações mede-se a associação entre duas variáveis, pela análise de suas medidas. Como não existe causa ou efeito, qualquer das duas variáveis pode ser designada de X. Uma vez que uma das variáveis se identifica como X, a outra passa a ser variável Y. Para cálculo de forma mais prática, a correlação de Pearson é dada por: Vˆ (X) Vˆ (Y) rX,Y Coˆ v (X,Y) = , onde: Obs.: Para correlação de Spearman, vide anexo T. 1 n n Y) X)( ( XY Coˆv(X,Y) − ∑ ∑ ∑ − = 1 n n Xi)2 ( X2i Vˆ (X) − ∑ − ∑ = , 1 n n Yi)2 ( Y2i Vˆ (Y) − ∑ − ∑ = Assim, ( ) ( ) − − ∑ ∑ ∑ − = ∑ ∑ ∑ ∑ n . n n Y) X)( ( XY 2 2 2 2 , Y Y X X r X Y , avaliado com n-2 graus de liberdade. ou ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = − − − = n 1 i n 1 i 2 i 2 i n 1 i 2 n i 1 i 2 i n 1 i n i 1 i i i i P Y ) ( Y n X ) ( X n Y ) X )( ( X Y n r 159 No R: X<-c(1, 2, 3, 4, 5) Y<-c(7, 6, 5, 4, 3) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação Para o exemplo da correlação perfeita positiva: Xi Yi Xi Yi Xi2 Yi2 1 3 3 1 9 2 4 8 4 16 3 5 15 9 25 4 6 24 16 36 5 7 35 25 49 Σ 15 25 85 55 135 160 ,100 50 50 50 (5 135) (25) 55) (15) (5 85) 15(25) (5 Y ) ( Y n X ) ( X n Y ) X )( ( X Y n r 2 2 n 1 i n 1 i 2 i 2 i n 1 i 2 n i 1 i 2 i n 1 i n i 1 i i i i = = − − − = − − − = ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = No R: X<-c(1, 2, 3, 4, 5) Y<-c(3, 4, 5, 6, 7) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação Para o exemplo da correlação igual a zero: Xi Yi Xi Yi Xi2 Yi2 1 2 3 1 9 2 4 8 4 16 3 3 15 9 25 4 4 24 16 36 5 2 35 25 49 Σ 15 25 85 55 135 161 No R: X<-c(1, 2, 3, 4, 5) Y<-c(2, 4, 3, 4, 2) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação No exemplo à p. 152, sobre notas de alunos no secundário e universitário, a r = 0,90. A solução é apresentada a seguir: Ho: ρ = 0 contra Ha: ρ ≠ 0 No R: Secundário<-c(80, 82, 84, 85, 87, 88, 88, 89, 90, 91, 91, 92, 94, 96, 98) Universitário<-c(1, 1, 2.1, 1.4, 2.1, 1.7, 2, 3.5, 3.1, 2.4, 2.7, 3, 3.9, 3.6, 4) 162 correlação<-cor.test(Secundário, Universitário, conf.level = 0.95, method="pearson") correlação O valor da correlação de Pearson entre duas variáveis torna-se insuficiente para tomada de decisões. Um valor de correlação associado a 10 pares de dados possui interpretação diferente de um valor de correlação associado a outro tamanho de amostra. Como a correlação é amostral, é preciso saber se a associação obtida na amostra entre X e Y existe de fato na população, e não resulta meramente de erro amostral. Para tal é necessário que o valor da correlação seja submetido a teste de significância. Teste de significância para o coeficiente de correlação de Pearson (1894) Usado para verificar se o valor do r obtido difere estatisticamente de zero, valor que deveria assumir, teoricamente, na ausência de correlação. Para fazer inferência estatística a respeito de ρ, partindo do coeficiente de correlação r da amostra, pressupomos que as variáveis X e Y apresentam uma distribuição normal bidimensional (bivariada). Para testar a hipótese de nulidade Ho: ρ = 0 contra Ha: ρ ≠ 0 utilizamos a estatística F, dada por: r 1 2) r (n F 2 2 − − = , com 1 e n-2 graus de liberdade Pode ser verificado que o valor do F obtido por essa fórmula, é igual ao valor de F da análise de variância de regressão. Portanto, testar Ho: ρ xy = 0 eqüivale a testar β1 = 0, ou seja, testar a significância de regressão linear simples. Podemos, também, testar Ho: ρ X,Y = 0 pelo teste t, onde: 163 Hipóteses H0: ρ = 0 2 1 2 r n r t − − = com n-2 graus de liberdade Ha: ρ ≠ 0 Pode-se notar que no caso de regressão linear simples, onde p = 1, t2 = F, o que pode ser visto para o exemplo das notas de secundário e universitário, onde r = 0,90 com n = 15: 55,42 ,0 90 1 90 (13) ,0 r 1 2) r (n F 2 2 2 2 = − = − − = ,7 44453 ,0 90 1 90 13 ,0 r 1 2 r n t 2 2 = − = − − = 55,42 ,7 44453 t 2 2 = = F ∴ Abaixo estão alguns diagramas de dispersão e seus respectivos coeficientes de correlação. A) r = -1 B) -1< r <0 C) r ≅ 0 D) 0 <r < 1 E) r = 1 Se X e Y forem correlacionados positiva e perfeitamente, r = 1, os pontos estarão alinhados em uma mesma direção ascendente (Fig. E). O mesmo acontece na Fig A, correlação negativa e r = -1, pontos em direção descendente. Se X e Y forem levemente correlacionados, por ex. r = 0,30, a dispersão dos pontos não é tão abrangente no quadrante nem tão estreita em torno de uma linha (Fig. D). Se duas variáveis X e Y não estão correlacionadas, r = 0, os valores de X variam independentemente de Y e vice-versa. Graficamente, se cada eixo representar uma variável, os pontos se encontrarão dispersos por todo o quadrante (Fig. C). Uma correlação alta e negativa (r = - 0,95) mostrará uma dispersão inversa entre X e Y, os maiores valores de X correspondendo aos menores de Y, concentrados em torno de uma diagonal fictícia (Fig. B). O valor de t calculado é comparado com o t tabelado, com graus de liberdade igual a n – 2. Vide parte da tabela de t, a seguir. A Tabela comleta é apresentada ao final da apostila. 164 Tabela – Valores críticos de t, bilateral, para nível de significância de 5% e 1% g.l. α = 0,05 α = 0,01 1 12,706 63,657 2 4,303 9,925 11 2,201 3,106 12 2,179 3,055 13 2,160 3,012 14 2,145 2,977 ... ... ... 28 2,048 2,763 29 2,045 2,756 30 2,042 2,750 40 2,021 2,704 60 2,000 2,660 120 1,980 2,617 ∞ 1,960 2,576 Para o exemplo das notas dos estudantes (p. 152), com 15 pares de dados e tendo as hipóteses H0: ρ = 0; Ha: ρ ≠ 0 : 7,444 (0,90) 1 2 ,90 15 0 1 2 2 2 = − − = − − = r n r t Considerando que t calculado é maior que t tabelado, rejeita-se a hipótese de nulidade (α < 0,01) e conclui-se que alunos que tiram as maiores notas no secundário também tiram as maiores notas no universitário. A tabela seguinte é outra maneira de apresentar a significância do valor da correlação. Observa-se que ao nível de significância de 1% com 15 pares de dados, a correlação só não será significativa se for menor que 0,641. 165 Tabela – Valores críticos de correlação de Pearson para nível de significância de 5% e 1%, baseado no teste t n α = 0,05 α = 0,01 4 0,950 0,999 5 0,878 0,959 6 0,811 0,917 7 0,754 0,875 8 0,707 0,834 9 0,666 0,798 10 0,632 0,765 11 0,602 0,735 12 0,576 0,708 13 0,553 0,684 14 0,532 0,661 15 0,514 0,641 16 0,497 0,623 17 0,482 0,606 18 0,468 0,590 19 0,456 0,575 20 0,444 0,561 25 0,396 0,505 30 0,361 0,463 35 0,335 0,430 40 0,312 0,402 45 0,294 0,378 50 0,279 0,361 60 0,254 0,330 70 0,236 0,305 80 0,220 0,286 90 0,207 0,269 100 0,196 0,256 H0: ρ = 0; Ha: ρ ≠ 0; n = nº de pares de dados. Como se chegou ao valor crítico para r** = 0,641 na Tabela de valores críticos? Veja: 167 A Equação simplificada para rS é dada por: ãä = 1 − 6 ∑ 02 å ¨á4 æ(æ2 − 1) rs = coeficiente de correlação de postos; d = diferença entre postos (relativa ao mesmo sujeito em ambas as variáveis); n = nº de pares de dados. Abordando exemplos para responder à pergunta anterior de quando usar a correlação de Spearman. 1) Quando os dados se referem a variável qualitativa ordinal Exemplos: a) Corrida em duas modalidades Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1,0 )1 5(5 6(22) 1 2 = − − − = 200 m 500 m João 3º 1º 2 4 Marcos 1º 3º -2 4 Pedro 4º 2º 2 4 Valdir 2º 5º -3 9 Paulo 5º 4º 1 1 ∑ 2 d 22 b) Corrida em duas modalidades/ correlação perfeita positiva Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1 1 0 )1 5(5 6(0) 1 2 = = − − = − 200 m 500 m João 3º 3º 0 0 Marcos 1º 1º 0 0 Pedro 4º 4º 0 0 Valdir 2º 2º 0 0 Paulo 5º 5º 0 0 ∑ 2 d 0 168 c) Corrida em duas modalidades/ correlação perfeita negativa. Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1 1 2 )1 5(5 6(40) 1 2 = − = − − = − 200 m 500 m João 3º 3º 0 0 Marcos 1º 5º -4 16 Pedro 4º 2º 2 4 Valdir 2º 4º -2 4 Paulo 5º 1º 4 16 ∑ 2 d 40 2) Porque optei por usar, independente de pressuposições estatísticas Aqui, no entanto, convém lembrar que, se estão satisfeitas as exigências para uso da correlação de Pearson, esta é mais eficiente que a correlação de Spearman. Portanto, dá-se preferência ao uso da correlação de Pearson. A taxa de eficiência da correlação de Spearman é de 0,91 em relação à correlação de Pearson (ZAR, 2010, p.400; TRIOLA et al.,2018, p.563 e 595). Ex.: Notas de alunos em duas matérias, Biologia e Química Aluno João Maria José Pedro Alex Marta Erli Matéria Biologia 7,0 3,0 10,0 7,7 4,5 2,2 9,0 Química 8,0 4,0 9,5 8,2 5,2 5,7 9,2 R.: ,0 8929 sr = A correlação de Spearman é a correlação de Pearson aplicada aos postos. A equação apresentada anteriormente para a correlação de Spearman somente é utilizável quando não há empate nos postos. Veja que a utilização das duas equações nos permite chegar ao mesmo valor. Para ilustrar, tomemos o exemplo das notas de alunos em biologia e em química, como segue. 170 Conclusão: Alunos que tiram as melhores notas em Biologia, também tiram as melhores notas em química. Quando há empate em postos, como proceder? A solução é o uso do ponto médio entre os postos empatados. Neste caso, no entanto, terá que ser usada a equação de Pearson a partir dos postos. Vejamos um exemplo a seguir, das notas de cálculo e estatística dos mesmos alunos mostrados anteriormente. Aluno Nota Posto – cálculo (Xi) Posto – estatística (Yi) Postos Cálculo Estatística Xi2 Yi2 Xi Yi João 10,0 9,4 7 7 49 49 49 Maria 8,0 9,1 5 6 25 36 30 José 7,0 7,3 3,5 3 12,25 9 10,5 Pedro 7,0 7,5 3,5 4 12,25 16 14,0 Alex 5,0 4,0 1 1 1 1 1 Marta 6,0 6,4 2 2 4 4 4 Erli 8,5 9,0 6 5 36 25 30 Total 28 28 139,5 140 138,5 172 3) Quando pelo menos uma das duas variáveis não apresenta distribuição normal No genes, o exemplo da correlação entre ENR e CR de mamão, citado à página 153 desta apostila (FERREIRA et al., 2011): No R (R CORE TEAM, 2021), para o mesmo caso de ENR e CR, pela correlação de Spearman: ENR<-c(93.34, 70, 53.33, 46.67, 46.67, 43.33, 40, 36.67, 33.33, 30) CR<-c(6.12, 4.17, 1.87, 2.5, 0.97, 1.37, 0.6, 1.6, 0.53, 0.87) H0: ρS = 0; Ha: ρS ≠ 0 correlação<-cor.test(ENR, CR, method="spearman") correlação 173 Conclusão: Há correlação estatística significativa entre entre o crescimento e o enraizamento de ramos de mamoeiro. Exemplo retirado de Triola et al. (2018, p.598): H0: ρS = 0; Ha: ρS ≠ 0 Cigarretes<-c(60,10,4,15,10,1,20,8,7,10,10,20) Nicotina<-c(179,283,75.6,174,209,9.51,350,1.85,43.4,25.1,408,344) 174 correlação<-cor.test(Cigarretes, Nicotina, conf.level = 0.95, method="spearman") correlação Conclusão: Há correlação válida significativa a 5% de probabilidade pelo coeficiente de Spearman, mostrando que há correlação entre o número de cigarretes fumados e o nível de Nicotina no corpo humano. 4) Quando não há relação linear entre os dados e no entanto a relação é monotônica Vejamos um exemplo segundo Triola et al. (2018, p.595), referente ao crescimento de população de bactérias ao longo do tempo: H0: ρS = 0; Ha: ρS ≠ 0 Tempo<-c(6, 107, 109, 125, 126, 128, 133, 143, 177, 606) Tamanho<-c(2, 3, 4, 10, 16, 29, 35, 38, 41, 45) par(mar=c(6,6,4,2)) plot(Tamanho~Tempo, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 175 Verifica-se pelo gráfico que não há relação linear, no entanto há relação monotônica e pode-se aplicar a correlação de Spearman. Confira a seguir a partir do ranqueamento. Veja: 176 rankTempo<-c(1,2,3,4,5,6,7,8,9,10) rankTamanho<-c(1,2,3,4,5,6,7,8,9,10) par(mar=c(6,6,4,2)) plot(rankTamanho~rankTempo, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") correlação<-cor.test(Tempo, Tamanho, conf.level = 0.95, method="spearman") correlação Conclusão: Há correlação estatística significativa pelo teste de Spearman entre população de bactérias e o tempo. 178 Tabela 3 – Valores críticos para o coeficiente de correlação de Spearman (H0: ρ = 0; Ha: ρ ≠ 0) 179 Para o exemplo das notas em duas matérias, biologia e química, com n = 7 pares de dados e r calculado = 0,8929 (r tabelado = 0,786 a 5%), existe diferença estatística significativa entre as médias das notas em biologia e química. Relembrando que as hipóteses para teste de significância de r de Spearman são dadas por: Hipóteses H0: ρS = 0 Ha: ρS ≠ 0 Erros a se evitar na interpretação de correlação 1) Na relação a seguir não existe correlação linear de Pearson significativa e isto não quer dizer que não existe associação entre as variáveis. Percebe-se nitidamente que existe relação, apenas não é linear. Percebe-se também que há uma relação de dependência e nesse caso, o estudo é feito por regressão. Provavelmente a relação será bem ajustada por uma equação de regressão de segundo grau onde se determinaria o ponto de máxima eficiência técnica. 2) A significância estatística está em função do tamanho da amostra. Consideremos a correlação de Perason e a Tabela da página 162 (valores críticos para significância estatística pela correlação de Pearson), verifica-se que a 5% de probabilidade com uma amostra de tamanho 10 a correlação será significativa se ã ≥ 0,632. No entanto, se sua amostra tiver tamanho 100, para ser significativo, ã ≥ 0,196. Aqui temos um problema pois deu significativo a 5% mas se elevarmos ao quadrado, r2 = 0,0384, ou seja, a variável X estaria explicando a variável Y na RLS em apenas 3,84%. Desta forma, além de olhar a significância estatística, alguns autores consideram uma correlação ideal de ã ≥ 0,7, pois nesse caso o coeficiente de determinação daria em torno de 50% ou mais, o que seria uma explicação razoável. 180 3) Um terceiro erro comum e que deve ser evitado é que não existe relação causa-efeito na correlação. Veja um exemplo, muito apropriado, mostrado em vídeo (https://www.youtube.com/watch?v=x0Qi2EFAtL4) pelo professor Alcinei Mestico Azevedo e adaptado a seguir. Cidade Habitantes (N°) Policiais (N°) Furtos mensais (N°/mês) A 30000 350 30 B 65000 800 45 C 90000 1100 86 D 120000 1650 120 Um gráfico pode ser gerado para a relação entre policiais e furtos. Policiais<-c(350, 800, 1100, 1650) Furtos<-c(30, 45, 86, 120) plot(Policiais, Furtos, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 181 Se fizermos a correlação de Pearson, r = 0,9768. No entanto, está errado. Pense. O gráfico e a correlação mostram que ao aumentarmos o número de policiais por cidade, aumenta também o número de furtos, mas a causa do aumento não é o número de policiais. Existe uma outra variável que está acarretando este aumento e que não apareceu até agora. O aumento dos furtos está em função do número de habitantes por cidade, com r = 0,9730. Veja: Habitantes<-c(30000, 65000, 90000, 120000) Furtos<-c(30, 45, 86, 120) plot(Habitantes, Furtos, cex=2, lwd=2, cex.lab=1.5, cex.axis=1.5, col="blue") Como relatado, nem sempre que uma coisa que acontece ao mesmo tempo que outra forma uma relação de causa e consequência. É isso que nos ensina o estudo das chamadas correlações espúrias. Correlação espúria é o nome que se dá para a existência de relação estatística entre duas ou mais variáveis, mas sem significado teórico. O pesquisador precisa saber a natureza das variáveis em estudo para saber que tipo de correlação usar e como interpretar. Pode ser necessário estudar análise de trilha por exemplo. 182 Exercícios: 1- Calcular e analisar o coeficiente de correlação de Pearson da amostra abaixo, de forma manual e usando o R: X 0 2 4 6 8 r = 0,9608** Y 2 3 14 15 26 2- Interpretar as correlações de Pearson abaixo, considerando a análise de 10 plantas, colocando um ou dois asteriscos na frente do valor da correlação. Altura de Planta Nº de vagens Nº de sementes Rendimento Altura de Planta 1,00 0,30 -0,50 0,00 Nº de vagens 1,00 0,95 0,30 Nº de sementes 1,00 0,80 Rendimento 1,00 3 – Apresenta-se ao lado os dados de comprimento e largura das oito folhas de uma muda de eucalipto do clone CO1407. Faça a correlação adequada, de forma manual e usando o R. Comprimento Largura Comprimento<-c(3.5, 6.9, 7, 4.6, 7, 5.3, 6.5, 6) Largura<-c(0.7, 2.9, 2.3, 1.7, 2.5, 1.8, 2.5, 2.4) 3.5 0.7 6.9 2.9 7.0 2.3 4.6 1.7 7.0 2.5 5.3 1.8 6.5 2.5 6.0 2.4 4 – Faça buscas na literatura, encontre e apresente pelo menos uma análise na área agronômica que usou a correlação de Pearson. 5 – Faça buscas na literatura, encontre e apresente pelo menos uma análise na área agronômica que usou a correlação de Spearman. 6 – Consulte o artigo publicado por Nascimento et al. (2018) com mamoeiro e faça a análise de correlação apropriada (Pearson ou Spearman) entre as características altura de plantas (PH) e produtividade (PROD) das cultivares. Responda de forma prática se a produtividade em cultivares de mamoeiro está relacionada ao porte das plantas. 183 3. REGRESSÃO LINEAR SIMPLES (RLS) 3.1 - INTRODUÇÃO A análise de regressão consiste na realização de uma análise estatística com o objetivo de verificar a existência de uma relação funcional entre uma variável dependente com uma ou mais variáveis independentes. Em outras palavras, consiste na obtenção de uma equação que tenta explicar a variação da variável dependente pela variação dos níveis das variáveis independente. As variáveis independentes são classificadas como quantitativas, cujos níveis representam diferentes quantidades de um mesmo fator. 3.2 - ESCOLHA DO MODELO PARA EQUACIONAR O FENÔMENO EM ESTUDO Para tentar estabelecer uma equação que representa o fenômeno em estudo, pode-se plotar um diagrama de dispersão para verificar como se comporta os valores da variável dependente (Y) em função da variação da variável independente (X). Vejamos o exemplo citado por Zimmermann (2014), citado à página 154 desta apostila. Adaptamos usando apenas duas casas decimais. Idade<-c(16, 23, 30, 36, 43, 57, 64, 71) IAF<-c(0.16, 0.39, 0.71, 1.17, 2.06, 2.2, 1.96, 1.87) par(mar=c(6,6,4,2)) plot(IAF~Idade, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 184 Pode-se observar, neste caso, que X explica grande parte da variação em Y, provavelmente por um modelo quadrático. A parte da variação de Y não explicado é atribuída ao acaso e constitui a variação residual. Isto acontece, devido ao fato do fenômeno em estudo, não ser um fenômeno matemático e sim um fenômeno que está sujeito a influências que acontecem ao acaso. Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos valores observados de Y em função da variação dos níveis da variável X. Vejamos outro exemplo, sobre mudas de eucalipto clone CO147. Considere as nove folhas de uma muda, conforme segue: Folha Comprimento x Largura = CL Área foliar Observada (AFO, em cm2) 1 1.74 1.92 2 2.24 1.90 3 5.04 3.96 4 15.93 11.77 5 19.5 13.89 6 23.45 16.76 7 15.6 11.15 8 19.17 14.06 9 17.75 13.70 CL<-c(1.74, 2.24, 5.04, 15.93, 19.5, 23.45, 15.6, 19.17, 17.75) AFO<-c(1.92, 1.9, 3.96, 11.77, 13.89, 16.76, 11.15, 14.06, 13.7) par(mfrow=c(1,1)) par(mar=c(6,6,4,2)) plot(AFO~CL, xlab="CL (cm²)",ylab="AFO (cm²)",cex=2, lwd=2, cex.lab=1.5, cex.axis=1.5, col="blue") Pelo diagrama de dispersão ao lado parece que ajusta bem uma regressão linear simples. 185 3.3 – MÉTODO PARA OBTER A EQUAÇÃO ESTIMADA NA RLS Os dados do diagrama de dispersão anterior, sobre AFO em função de CL, podem ser assim representados, após ajuste da equação adequada: CL<-c(1.74, 2.24, 5.04, 15.93, 19.5, 23.45, 15.6, 19.17, 17.75) AFO<-c(1.92, 1.9, 3.96, 11.77, 13.89, 16.76, 11.15, 14.06, 13.7) RLSCL<-lm(AFO~CL) summary(RLSCL) AFECL<-predict(RLSCL, data.frame(x=CL)) par(mfrow=c(1,1)) par(mar=c(6, 6, 4, 2)) plot(CL, AFO,type="n",xlab="CL (cm²)", ylab="AFO (cm²)", cex.axis="1", xlim=c(0,25),ylim=c(0,20), cex.axis="1.5", cex.lab="1.5") lines(CL[1:9], AFO[1:9], type="p", pch=19,cex=1.5, col="blue") lines(CL[1:9], AFECL[1:9], type="l", lwd=2, col="black") legend(-1.2,20,c("AFE = 0,5139 + 0,7016CL","R² = 0,9967"), col=c("black","black","black"), cex=1.5,title = "", inset = 0.00,bty="n") 186 Como visto, os pontos do diagrama de dispersão ficam um pouco distante da curva do modelo escolhido. Um dos métodos que se pode utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos das curvas do modelo, no todo, sejam as menores possíveis. Este método é denominado de Método dos Mínimos Quadrados (MMQ). Mais especificamente, na estimação dos parâmetros do modelo admitido, usaremos o método dos mínimos quadrados ordinários, que pressupõem: a) A relação entre X e Y é linear. b) Os valores de X são fixos. c) E(ei) = 0, ou seja, E(ε) = φ, onde φ representa um vetor de zeros. d) Os erros são homocedásticos, isto é, apresentam a mesma variância. e) Os erros são não-correlacionados entre si, isto é, E(ei.ej) = 0 para i ≠j. f) Os erros tem distribuição normal (necessários para os testes de hipóteses). 3.4 – MODELO LINEAR DE 1O GRAU O modelo estatístico para esta situação seria: Yi = β0 + β1Xi + ei , em que: Yi = valor observado para a variável dependente Y no nível i da variável independente X. β0 = Constante da regressão. Representa o intercepto da reta com o eixo dos y. β1 = Coeficiente de regressão. Representa a variação Y em função da variação de uma unidade da variável X. Xi = é o nível i da variável independente X (i = 1,2,...,n) ei = erro associado à distância entre o valor observado Yi e o correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X. Para se obter a equação estimada, vai se utilizar o MMQ, visando a minimização dos erros. Assim, ei = Yi – β0 - β1Xi elevando ambos os membros da equação ao quadrado ei2 = [Yi – β0 - β1Xi]2 aplicando somatório Σ ei2 = Σ[Yi – β0 - β1Xi]2 (I) Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação à variável de interesse e igualá-la a zero. Derivando então a expressão 1 em relação a β0 e β1 e igualando-as a zero, chegaremos as seguintes equações. 187 ∑ ∑ ∑ ∑ ∑ − − = n ) ( n ) )( ( 2 i 2 i i i i i 1 X X Y X Y X βˆ ou ∑ ∑ ∑ ∑ ∑ = = = = = − − = β n 1 i 2 n 1 i i 2 i n 1 i n 1 i i n 1 i i i i 1 ) X ( X n Y ) )( X ( Y X n ˆ b X Y ˆ 1 0 − = β Onde: n Y Y n i 1 ∑ i = = e n X X n i 1 i ∑ = = Uma vez obtida estas estimativas, podemos escrever a equação estimada: i i X Y 1 0 ˆ ˆ ˆ = β + β Exemplo:1: O modelo linear abaixo foi proposto para explicar a relação entre a quantidade de ração fornecida e produção de leite por cabras. Pede-se por meio dos dados, determinar a equação de regressão. Níveis de ração (g) (X) 50 75 100 125 150 Produção de leite (L/dia) (Y) 1,2 1,7 2,0 2,1 2,5 Solução: 188 i X iY XiYi i2 X 2 iY iYˆ ( ) 2 ˆ Yi −Y 50 1,2 60 2500 1,44 1,3 0,36 75 1,7 127,5 5625 2,89 1,6 0,09 100 2,0 200,0 10000 4,0 1,9 0,00 125 2,1 262,5 15625 4,41 2,2 0,09 150 2,5 375,0 22500 6,25 2,5 0,36 500 9,5 1025 56250 18,99 0,90 100 1,9 ( )( ) ,0 012 6250 75 5 250000 56250 5 5,9 500 1025 n ) ( n ) )( ( 2 i 2 i i i i i 1 X X Y X X Y βˆ = = − − = − − = ∑ ∑ ∑ ∑ ∑ ( ) 7,0 2,1 9,1 ,0 012 100 9,1 b X Y ˆ 1 0 = − = − = − = β A equação de regressão linear simples será: i i i 1 0 i ,0 012X 7,0 Yˆ ˆ X ˆ Yˆ + = ∴ = β + β Solução usando o R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 190 3.5 – ANÁLISE DE VARIÂNCIA DA REGRESSÃO LINEAR SIMPLES A equação estimada obtida, apenas estabelece uma relação entre a variável dependente e a variável independente, para representar o fenômeno em estudo. A simples obtenção, da equação estimada não responde se a variação da variável independente influencia significativamente na variação da variável dependente. Para verificar a resposta a esta pergunta, é necessário realizar um teste estatístico para as estimativas dos coeficientes da equação da regressão estimada. Um teste que pode ser realizado para verificar tal fato é o teste F da análise de variância. Portanto, é necessária uma análise de variância dos dados observados, em função do modelo proposto. O quadro para a análise de variância para a regressão é, considerando inexistência de informações sobre a anova do experimento: FV GL SQ QM F Regressão p SQRegr. QMRegr. QMRegr/QMDesvio Desvio n-p-1 SQDesvio QMDesvio - TOTAL n-1 SQTotal - - Onde: p = no de coeficientes da regressão (não inclui o β0) n = no de observações As fórmulas para a obtenção das somas de quadrados são: ( ) ∑ − ∑ = n Y Y SQtotal i i 2 2 ou ( ) Y 2 Y SQtotal i − =∑ ou ∑ = − = n i i nY Y SQT 1 2 2 191 ∑ ∑ ∑ ∑ ∑ − − = n ) ( n ) )( ( SQRegr. 2 i 2 i 2 i i i i X X Y X X Y ou ( )( ) − = ∑ ∑ ∑ ∑ i i i i Y Y X X Y b 1 1 SQRegr. ou ( ) 2 ˆ Re Y Y gr SQ i − =∑ ou ∑ ∑ = = − + = n i n i i i i nY X Y b Y b gr SQ 1 1 2 1 0 . Re ( ) 2 ˆ i i Y Y SQDesvio − =∑ ou SQDesvio = SQTotal - SQRegr. As hipóteses estatísticas para o teste F são as seguintes: Ho: β1 = 0, o que significa dizer que a variável independente não exerce influência na variável dependente, segundo o modelo proposto. Ha: β1 ≠ 0, o que significa dizer que a variável independente exerce influência na variável dependente, segundo o modelo proposto. O valor de F da análise de variância deve ser comparado com o valor de F tabelado, onde Ftab = F(α; p; n-p-1). A regra decisória para o teste F é: Se Fcalc ≥ Ftab. ⇒ Rejeita-se Ho e pode-se inferir que o modelo proposto é adequado para descrever o fenômeno em estudo. Se Fcalc < Ftab. ⇒ Não se Rejeita Ho e pode-se inferir que o modelo proposto não é adequado para descrever o fenômeno em estudo. As SQRegr., SQtotal e SQDesvio podem ser ilustradas na Figura a seguir, que representa hipoteticamente o gasto mensal de manutenção de um trator em função de seu tempo de uso: 192 Exemplo: Fazer a análise de variância da regressão do exemplo da produção de leite de cabras (página 187 da apostila): ( ) ( ) ,0 94 5 5,9 ,99 18 2 2 2 = − = − = ∑ ∑ n Y Y SQtotal i i ou ( ) ( ) ( ) ,0 94 9,1 5,2 ... 9,1 2,1 2 2 2 = − + + − = − =∑ Y Y SQtotal i Gasto de manutenção em função do tempo de uso 0 10 20 30 40 50 60 0 2 4 6 8 10 12 14 Tempo de uso (anos) Gasto mensal na manutenção (R$) ˆ )2 ( exp i i Y Y quadrados licada dos não Soma − i 1 0 i b X b Yˆ + = )2 ˆ ( exp Y Y quadrados licada dos Soma i − )2 ( Y Y total dos quadrados Soma i − Y 193 ( )( ) ,0 90 5 5,9 500 ,0 012 1025 SQRegr. 1 1 = − = − = ∑ ∑ ∑ x n Y X X Y b i i i ou ( ) ( ) ( ) ,0 90 9,1 5,2 ... 9,1 3,1 ˆ Re 2 2 2 = − + + − = − =∑ Y Y gr SQ i ( ) ( ) ( ) ,0 04 5,2 5,2 ... 3,1 2,1 ˆ 2 2 2 = − + + − = − =∑ i i Y Y SQDesvio ou SQDesvio = 0,94 – 0,90 = 0,04 FV GL SQ QM F Regr. 1 0,90 0,90 67,5** Desvio 3 0,04 0,0133 Total 4 0,94 ** Significativo a 1% pelo teste F, F(1%, 1, 3) = 34,12 Conclusão: a variável nível de ração exerce influência sobre a produção de leite em cabras. No Genes: Arquivo Excel®: regressao LS.prn 50 1.2 75 1.7 100 2 125 2.1 150 2.5 194 ========================================================== Programa GENES REGRESSÃO LINEAR SIMPLES Arquivo de dados D:\AAtuais\Est Exp Pós\Aulas\Unidade VI - Regressão e Correlação\regressao LS.prn Número de variáveis 2 Data 05-22-2010 ========================================================== REGRESSÃO LINEAR SIMPLES Variável independente : nivel racao Variável dependente : produção de leite __________________________________________________________________________________ FV GL SQ QM F Probabilidade(%) ____________________________________________________________________________________ REGRESSÃO 1 .9 .9 67.5 .377424 DESVIO 3 .04 .013333 TOTAL 4 .94 ____________________________________________________________________________________ ESTIMATIVAS E VARIÂNCIAS DOS COEFICIENTES DE REGRESSÃO ___________________________________________________________________________________ INTERCEPTO ß0 = .7 INCLINAÇÃO ß1 = .012 V(ß0) = .024 V(ß1) = .000002 t (Ho:ß1=0) = 8.215838 Probab(Ho:ß1=0) = .284314 % Cov(ß0,ß1) = ..000213 COEFICIENTE DE DETERMINAÇÃO (%) = 95.744681 ___________________________________________________________________________________ nivel racao (X) produção de leite (Y) produção de leite estimado ___________________________________________________________________________________ 50.0 1.2 1.3 75.0 1.7 1.6 100.0 2.0 1.9 125.0 2.1 2.2 150.0 2.5 2.5 ___________________________________________________________________________________ 195 Resolução no R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 196 O procedimento do R libera parte dos resultados da Anova, sendo que DP do desvio = 0,1155 e o valor de Fcal = 67,5. Desta forma podemos compor a Tabela da Anova da RLS do caso do leite de cabra. Veja: FV GL SQ QM F RLS 1 0,90 0,90 67,5** Desvio 3 0,04 0,01334 ** Significativo a 1% pelo teste F. 3.6 - COEFICIENTE DE DETERMINAÇÃO O coeficiente de determinação, representado por r2 na RLS, fornece uma informação auxiliar ao resultado da análise de variância da regressão, para verificar se o modelo proposto é adequado ou não para descrever o fenômeno. Também pode ser representado por R2. O r2 é obtido por: 197 SQtotal gr SQ Variação total licada Variação r . Re exp 2 = = O valor de r2 varia no intervalo de 0 a 1 e também pode ser representado em porcentagem. Valores próximos de 1 indicam que o modelo proposto é adequado para descrever o fenômeno. O r2 indica ainda, o quanto da SQTotal é explicada pela regressão, ou seja, o quanto da variação na variável dependente Y está sendo explicada pela variação independente X. Exemplo: Calcular o r2 do exemplo dado sobre produção de leite de cabras da página 187 da apostila: 95,74% ,0 9574 ,0 94 ,0 90 . Re 2 = = = = SQtotal gr SQ r O r2 ajustado (r2aj.) Para interpretar o coeficiente de determinação, alguns pesquisadores sugerem que seja calculado um r2 ajustado para refletir também o tamanho da amostra. É dado por: − − − − = 2 n 1 r ) n 1( 1 r 2 2 aj. Para o exemplo em questão, do leite de cabras, com n = 5: ,0 9432 2 5 1 ,0 9574 ) 5 1( 1 2 . = − − − − = ajr 198 3.7 – COEFICIENTE DE VARIAÇÃO NA RLS Um outro indicador da qualidade do ajustamento obtido é o coeficiente de variação, dado por: Y QMDesvio CV (%) = 100 O CV mede a dispersão relativa das observações. O resultado é tanto melhor quanto menor for o CV. Exemplo: Calcular o CV do exemplo dado, de leite de cabras: ,6 08% 9,1 ,0 01333 100 100 (%) = = = Y QMDesvio CV 3.8 – TESTE DE HIPÓTESE A RESPEITO DOS PARÂMETROS E RESPECTIVOS INTERVALOS DE CONFIANÇA Os dados amostrais usados para calcular uma reta de regressão podem ser encarados como um número relativamente pequeno de observações possíveis de pares de valores. Nesse sentido, a reta de regressão calculada pode ser encarada como uma estimativa da relação real, porém desconhecida, que existe entre as duas variáveis na população. Como dito anteriormente, 0ˆβ e 1ˆβ servem como estimativas dos dois parâmetros populacionais correspondentes, β0 e β1 e a equação i 1 0 i ˆ X ˆ Yˆ = β + β é uma reta estimada da relação populacional i i 1 0 i X Y + ε = β + β Vimos também que iε representa o erro aleatório em Y para a observação i ou a dispersão na população. A Figura a seguir ilustra a dispersão em uma população. 0 20 40 60 80 100 120 0 200 400 600 800 População de possíveis valores para equação de regressão 199 Por que existe dispersão? Porque há outras variáveis que influenciam os valores da variável dependente. A dispersão significa que as estatísticas amostrais tendem a diferir dos parâmetros efetivos da população. Assim, poderiam ser obtidas diversas equações de regressão diferentes a partir dessa população, conforme ilustra a Figura ao lado: A dispersão na população significa que, para qualquer valor de X, haverá muitos possíveis valores de Y. 200 A análise de regressão supõe que, para cada valor possível de X, há uma distribuição de valores de Y e que segue a lei normal. Considerando que há dispersão na população, pergunta-se: que precisão tem as estimativas da regressão? Sabe-se que quanto maior a dispersão, menor a precisão das estimativas. A quantidade de dispersão na população pode ser estimada com base na dispersão das observações amostrais em relação à reta de regressão calculada, mediante a fórmula: QMDesvio n SQDesvio n Y Y S n i i i = − = − − = ∑ = 2 2 ˆ ) ( 1 2 sendo S o desvio padrão ou erro-padrão da estimativa. Este desvio padrão possui n-2 no denominador, ao invés de n-1. Este n-2 é o número de graus de liberdade que é devido a dois parâmetros (β0 e β1) que se devem estimar para se calcular a SQDesvio. Para o exemplo da produção de leite de cabras (página 187 da apostila): ,0 11547 ,0 01333 = = = QMDesvio S Este valor (0,11547) é o desvio padrão de pontos em torno da reta de regressão. Este cálculo é útil para a determinação do ajustamento e do intervalo de confiança para o coeficiente angular. O ajustamento do coeficiente angular é feito pelo teste t. a) Teste t para o coeficiente angular O modelo de regressão linear simples é i i 1 0 i X Y + ε + β = β . Se X e Y estão linearmente relacionados, devemos ter β1 ≠ 0. O objetivo do teste t é ver se podemos usar os dados da amostra para concluir que β1 ≠ 0. Testaremos a hipótese sobre β1 como segue: H0: β1 = 0 Ha: β1 ≠ 0 Sendo H0 a hipótese de nulidade e Ha a hipótese alternativa. Lembramos que se β1 = 0, não há relacionamento válido estatisticamente entre as duas variáveis. 201 Para calcular t teremos: 1 ˆ 1 1 s ˆ t β = β − β sendo 1ˆsβ o erro padrão para o coeficiente angular 1ˆβ . Considerando a hipótese H0: β1 = 0, a equação acima se resume a: 1 ˆ 1 s ˆ t β = β sendo Sb1 o erro padrão, dado por: ∑ ∑ = = β − = n 1 i 2 n i 1 i 2 i ˆ / n X X s s 1 Para o exemplo base de produção de leite de cabras, erro padrão é: ,0 0014605 79,057 11547 ,0 (500) /5 56250 ,011547 s 2 ˆ 1 = = − β = e t: ,8 22 0,0014605 0,012 s ˆ t 1 ˆ 1 = = β = β Como mencionado anteriormente, no caso de regressão linear simples, onde p = 1, t2 = F da anova da regressão: 202 67,50 ,8 22 t 2 2 = = F ∴ 67,42 ,0 0426 ,2 8722 ,0 9574 1 9574(3) ,0 r 1 2) r (n F 2 2 = = − = − − = ,8 2111221 ,0 2063076 6947565 ,1 ,0 9574 1 9784681 3 ,0 r 1 2 r n t 2 = = − = − − = Na tabela de t bilateral com 3 graus de liberdade para o desvio e significância de 0,01, t tabelado é 5,841. Como t calculado é maior que t tabelado, rejeita-se H0 ao nível de 1% de significância e, portanto, concluímos que temos uma relação significante entre o nível de ração e a produção de leite. Veja o valor do erro padrão do coeficiente angular obtido pelo R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 203 Resumindo os passos do teste t para uma relação entre duas variáveis: a1) Estabelecimento das hipóteses H0: β1 = 0 Ha: β1 ≠ 0 a2) Estatística do teste 1 ˆ 1 s ˆ t β = β a3) Regra de rejeição em um nível de significância α (normalmente 0,05 ou 0,01) Rejeita-se H0 se t < - tα ou se t > tα, onde tα é baseado em uma distribuição t bilateral com n-2 graus de liberdade. b) Intervalo de confiança para o coeficiente angular Podemos também obter intervalos de confiança para o parâmetro β1. [ ] ) .s(βˆ t βˆ β .s(βˆ ) t : βˆ IC(β ) 1 tab 1 1 1 tab 1 1 1 α + ≤ ≤ − − Exemplo: Fazer o teste de hipótese e Intervalo de Confiança para β1, com base no exemplo dado sobre alimentação de cabras. [ ,3182.0,0014605 ] ,0 012 β ,3182.0,0014605 : 0,012 IC(β ) 1 1 ,0 95 + ≤ ≤ − [ ,0 01664 ] β : 0,00735 IC(β ) 1 1 ,0 95 ≤ ≤ Isto significa que o verdadeiro valor do coeficiente angular populacional deva estar entre 0,00735 e 0,01664 com 95% de confiança. 204 c) Intervalo de confiança e intervalo de previsão na RLS Intervalo de confiança e intervalo de previsão no R Parte gráfica a partir de https://www.youtube.com/watch?v=SIxQ4haNiC8 ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) dados<-data.frame(X=ração, Y=leite) #coloca na forma de banco de dados dados RLS<-lm(dados$Y~dados$X) summary(RLS) pred.int<-predict(RLS, interval="prediction") pred.int #libera os valores do intervalo de previsão mydata<-cbind(dados, pred.int) mydata require(ggplot2) p<-ggplot(mydata,aes(x=X, y=Y))+ geom_point()+ stat_smooth(method=lm)+ylab("Leite")+ xlab("Ração") p #até aqui com o IC p+geom_line(aes(y=lwr),color="red", linetype="dashed")+ geom_line(aes(y=upr),color="red", linetype="dashed") #adiciona o intervalo de previsão 208 EXERCÍCIOS ENVOLVENDO RLS 1) Obter a equação de regressão, o coeficiente de determinação e a análise de variância da regressão para o modelo ie 1Xi 0 Yi + + β = β X 2,0 4,0 6,0 8,0 10,0 12,0 Y 10,2 12,8 16,1 18,5 21,0 24,5 Resp. ,0 9972 r 1440,93 F ,1 407X ,7 33 Yˆ 2 ** RL i i = = + = 2) Dada à amostra abaixo, estimar: a) A equação da regressão; b) Anova da Regressão; c) Coeficiente de determinação; d) Coeficiente de variação; e) Testar as hipóteses: H0: β1 = 0 versus Ha: β1 ≠ 0 para α = 5% ; f) Estimar o intervalo de confiança para previsão quando X = 10, ao nível de confiança de 95%; X 0 2 4 6 8 Y 2 3 14 15 26 3) Para o seguinte conjunto de valores de X (variável independente) e Y (variável dependente), faça a análise de regressão segundo o modelo linear de 1º grau e obtenha a equação de regressão estimada e o coeficiente de determinação. X 2 4 6 8 10 12 14 16 18 20 Y 10,3 18,2 25,1 35,6 43,0 50,0 59,1 67,8 75,2 85,0 4) Anova Regressão sem repetição para enraizamento ramos mamão in vitro AIB (mg/L) % Enr. Yˆ ( ) Yi −Y 2 ( ) 2 ˆ Yi −Y ( ) 2 ˆ i i Y −Y Xi Yi 0,0 14 20.4 1866.24 1354.24 40.96 0,1 44 38.8 174.24 338.56 27.04 0,2 62 57.2 23.04 0.00 23.04 0,3 76 75.6 353.44 338.56 0.16 0,4 90 94.0 1075.84 1354.24 16.00 1,0 286 3492.80 3385.60 107.2 209 57 2. 5 Y = 286 = ( ) 8. 3492 1 2 = − = ∑ = n i i Y Y SQTotal ( ) 3385.60 ˆ . Re 2 1 = − = ∑ = Y Y g SQ i n i ( ) 107 2. ˆ 2 1 = − = ∑ = i i n i Y Y SQDesvio FV GL SQ QM F Regressão 1 3385.60 3385.60 94.75** Desvio 3 107.20 35.73 Total 4 3492.80 F significativo, ou seja, o enraizamento pode ser explicado pela equação linear ajustada. Pede-se: a) Determinar a equação de ajuste linear e explicar o significado dos coeficientes; b) Obter o coeficiente de determinação e interpretá-lo corretamente. c) O enraizamento previsto (pontual e o IC a 95%) para nível de 0,25 mg/L de AIB. d) Observa-se que o ponto de máximo enraizamento é obtido com maior nível de AIB. Qual sua sugestão para o próximo experimento deste trabalho? 4. POLINÔMIOS ORTOGONAIS 4.1 INTRODUÇÃO Polinômios ortogonais são usados quando se tem um conjunto de tratamentos quantitativos (ou os níveis do fator são quantitativos) e nos interessa saber a tendência da resposta. Esta tendência pode ser linear simples, quadrática, cúbica. Na análise de polinômios ortogonais, a SQT se decompõe em t – 1 soma de quadrados, cada um com um GL. Cada SQ representa um efeito: linear, quadrático, etc. A tendência para partição da SQT é igual a dos contrastes ortogonais. 4.2 REQUISITOS DA APLICAÇÃO DE POLINÔMIOS ORTOGONAIS, SEM COMPUTADOR a-) Tratamentos equidistantes; b-) Mesmo número de repetições por tratamento; c-) Cuidados com extrapolações; d-) Nem sempre é conveniente o uso do nível zero; e-) Utilização de coeficientes dos polinômios ortogonais, que são apresentados em tabelas. Atente que os coeficientes variam apenas em função do número de tratamentos. Veja a seguir coeficientes de polinômios ortogonais para fatores até seis tratamentos igualmente espaçados e com mesmo número de repetições. 210 4.3 ANOVA O quadro a seguir refere-se à análise de variância para o exemplo citado em Figura à página 155 (SCHMILDT et al., 2000). Observe-o bem. 211 Pode-se notar que os requisitos anteriores foram satisfeitos: a) Os níveis de floroglucinol foram equidistantes (0; 30; 60; 90; 120 mg/L – p. 155, na Figura); b) O número de repetições foi o mesmo para todos os tratamentos. Pelo quadro 2, observa-se que foi DIC e 5 repetições; c) Não se dispunha de trabalhos com Citrus usando floroglucinol, por isto os autores usaram os mesmos níveis usados em outros trabalhos com macieira; d) Achou-se conveniente usar o nível zero de floroglucinol por não se dispor de trabalhos anteriores que apontassem resposta para Citrus; e) Foi possível desmembrar a SQT em SQ para regressão até nível de quarto grau, que corresponde ao número de GL para tratamentos (níveis de floroglucinol). Convêm lembrar que para fenômenos biológicos se torna difícil explicá-los quando apresenta resposta além da quadrática (vide uma exceção, com acúmulo de amido em raízes tuberosas de mandioca, no artigo de Oliveira et al., Acta Scientiarum – Agronomy, v. 32, n. 1, p. 99-108, 2010. Desta forma, na prática, desdobra-se a SQT até a de terceiro grau e os demais graus de liberdade e SQ passam a ser computados para o desvio. No exemplo citado, os GL ficariam: FV GL Floroglucinol (4) Regressão Linear 1 Regressão Quadrática 1 Regressão Cúbica 1 Desvio 1 Resíduo 20 Desta forma, quando se montarem os experimentos deste tipo, usar no mínimo 5 níveis (I ≥ 5). E assim, os GL ficariam: FV GL Tratamentos (I - 1) Regressão Linear 1 Regressão Quadrática 1 Regressão Cúbica 1 Desvio I – 4 Resíduo GLE 212 Se não se considera GL para desvio, a curva ajustada será exatamente nos pontos obtidos e o R2 será 100%. Isto nunca deve ser feito. O grau de ajuste máximo será I - 2. Desta forma, se usarmos 3 níveis (I = 3), o nível máximo de ajuste será o linear. Veja ilustração a seguir: Correto Errado Note no quadro 2 (p.210) que o valor de F é obtido pela divisão do QMReg. Pelo QME e não pelo QMDesvio. A divisão pelo QMDesvio só é feita para dados sem repetição, como mencionado para RLSimples no item 3 desta unidade. A equação a ser ajustada, será a de maior grau significativo até o grau 3, mesmo que os anteriores sejam não significativos. Veja: y = 0.135x + 47.003 R² = 0.1377 y = -0.0175x2 + 2.4748x - 17.99 R² = 1 213 As SQ serão obtidas: K / J Cˆ K J Cˆ SQ 2 i 2 i Re g. = = Sendo: QRReg. Linear, quadrática ou cúbica; 2 i Cˆ a estimativa do contraste obtida; K é o = ∑ ia2 K , sendo ai os coeficientes para polinômios ortogonais, como citado à página 210; J o número de repetições. Assim: SQLinear SQQuadrática SQCúbica K J C SQ RLinear 2 1ˆ = K J Cˆ SQ 2 2 RQuadrátic a = K J Cˆ SQ 2 3 RCúbica = De acordo com o modelo completo, as hipóteses que podem ser testadas são: a) 0 : 1 0 β = H versus 0 : 1 1 β ≠ H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito linear de X sobre Y é significativo em nível α de erro. b) 0 : 2 0 = β H versus 0 : 2 1 ≠ β H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito quadrático de X sobre Y é significativo em nível α de erro. Em outras palavras, o 20 grau ajustou uma porção significativa de variação a mais que 10 grau. c) 0 : 3 0 β = H versus 0 : 3 1 β ≠ H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito cúbico de X sobre Y é significativo em nível α de erro. Em outras palavras, o 30 grau ajustou uma porção significativa de variação a mais daquela ajustada pelos 10 e 20 graus. Exemplo: Considere os dados a seguir e realize a ANOVA pelos polinômios ortogonais. Foi um DIC com 5 repetições e a SQE = 436,80 e Xi é kg/ha de NPK e Yi é dado em t/ha: i i X i Y 1 0 10 2 20 14 3 40 17 4 60 17,4 5 80 17,6 6 100 16 214 Solução: I i X .i Y 1ia 2 ia 3 ia . 1 ai Yi . 2 ai Yi . 3 ai Yi 1 0 10 -5 5 -5 -50 50 -50 2 20 14 -3 -1 7 -42 -14 98 3 40 17 -1 -4 4 -17 -68 68 4 60 17,4 1 -4 -4 17,4 -69,6 -69,6 5 80 17,6 3 -1 -7 52,8 -17,6 -123,2 6 100 16 5 5 5 80 80 80 ∑ 300 92 0 0 0 1ˆC = 41,2 2ˆC = -39,2 3ˆC = 3,2 K=∑ 2 ia 70 84 180 As SQ: 121,246 / 5 70 2, 41 / ˆ 2 12 = = = J K C SQ RLinear 91,467 16 8, 1536 ,64 84 / 5 39 2, K / J Cˆ SQ 2 2 2 RQuadrátic a = = = − = ,0 284 36 ,24 10 / 5 180 2,3 K / J Cˆ SQ 2 2 3 RCúbica = = = = 214,267 5 6 460 5 80 88 87 85 70 50 2 2 2 2 2 2 2 = − + + + + + = x SQT ,1 269 ,0 284 91,467 121,246 214,264 = − − − = − − − = RC RQ RL T D SQ SQ SQ SQ SQ 215 Anova da regressão FV GL SQ QM F Tratamentos (5) 214,267 Regressão Linear 1 121,246 121,246 6,66* Regressão Quadrática 1 91,467 91,467 5,02* Regressão Cúbica 1 0,284 0,284 0,01ns Desvio 2 1,269 0,634 0,03ns Resíduo 24 436,800 18,200 ns; * Não significativo e significativo a 5% pelo teste F [F(5%, 1, 24) = 4,26]. 4.4 O COEFICIENTE DE DETERMINAÇÃO O r2 ou R2 será obtido pela divisão da SQReg pela SQT. Desta forma, de acordo com o modelo ajustado: Linear: SQT SQ r Linear 2 = Quadrático: SQT SQ SQ R Quadrática Linear + 2 = Cúbica: SQT SQ SQ SQ R Cúbica Quadrática Linear + + 2 = Assim verifica-se que quanto maior o grau de ajuste, maior será o R2. Neste ponto chamamos a atenção para um detalhe que tem levado muitos a se equivocarem. O modelo a ser ajustado deve ser em função da significância da análise de variância e não do maior valor do R2. Para o exemplo em questão: 99,20% ,0 992 214,267 91,467 121,246 SQT SQ SQ R Quadrática Linear 2 = = + = + = 216 4.5 ESTIMATIVA DA EQUAÇÃO O modelo geral para estimar uma equação quando se usa o método dos polinômios ortogonais é: e B M P B M P B M P Y Y k k k + + + + + = ... 2 2 2 1 1 1 .. Para estimar uma equação, usa-se parte da equação geral, de acordo com o modelo determinado pelos testes de hipóteses das regressões. Considerando até o terceiro grau, a escolha é feita assim: 3 3 3 2 2 2 1 1 1 .. ˆ B M P B M P B M P Y Y + + + = Equação linear Equação quadrática Equação cúbica K C B 1 1 ˆ = K C B 2 2 ˆ = K C B 3 3 ˆ = M1, M2 e M3 são obtidos nas tabelas de polinômios ortogonais, como mostrado abaixo: 217 P1, P2 e P3 são obtidos da seguinte forma: P = x 1 ( ) 12 1 2 2 2 − − = I x P ( ) 20 7 3 2 3 3 − − = I x x P Para o exemplo em questão, com grau 2 ajustado: ,0 5886 70 41 2, ˆ 1 1 = = = K C B ,0 4667 84 39 2, ˆ 2 2 = − = − = K C B ( ) ( ) 35 /12 12 1 6 12 1 2 2 2 2 2 2 − = − − = − − = x x I x P ( )( ) ( )( )( 35 /12) 3 / 2 ,0 4667 2 ,0 5886 15,333 ˆ 2 2 2 2 1 1 1 .. − + − + = + + = x x B M P B M P Y Y ,2 042 ,0 70005 ,11772 15,333 ˆ 2 + − + = x x Y 2 ,0 70005 ,11772 17,375 ˆ x x Y − + = É necessário despadronizar x e x2, ou seja, obter X e X2, onde X refere-se aos níveis de NPK, no exemplo em questão: h X X x i i − = sendo h a distância entre os níveis. 218 20 − 50 = − = i i i X h X X x 2 20 50 ,0 70005 20 50 ,11772 17,375 ˆ − − − + = i i X X Y 2 ,0 00175 ,0 2338 10,0565 ˆ i i X X Y − + = Solução pelo R, sem delineamento experimental: NPK<-c(0, 20, 40, 60, 80, 100) PROD<-c(10, 14, 17, 17.4, 17.6, 16) modelo_quadrático=lm(PROD~NPK+I(NPK^2)) anova(modelo_quadrático) summary(modelo_quadrático) 219 NPK<-c(0, 20, 40, 60, 80, 100) PROD<-c(10, 14, 17, 17.4, 17.6, 16) modelo_quadrático=lm(PROD~NPK+I(NPK^2)) anova(modelo_quadrático) summary(modelo_quadrático) #Até aqui para achar a equação par(mfrow=c(1,1)) par(mar=c(6, 6, 4, 2)) par(mgp=c(2.5, 0.75, 0)) windowsFonts(A = windowsFont("Times New Roman")) plot(NPK, PROD,type="p", xlab = expression(NPK (kg.ha^-1)), ylab= expression(Produtividade (t.ha^-1)), xlim=c(0,100),ylim=c(0,20), cex.axis="1.5", cex.lab="1.5", pch=19, cex=1.5, col="blue", axes=FALSE, family="A",) axis(1,cex.axis=1.5, family="A") axis(2, cex.axis=1.5, family="A") box(bty="L",lwd=3) curve(10.0565 + 0.2338*(x) -0.00175*x^2,from = 0, to = 100, lwd=2, lty=1,add=TRUE) #lty=1 = curva contínua; lty = 3 = curva tracejada text(50, 6, cex=1.5, family="A", expression(hat(Y)[i]==10.0565+0.2338*X[i]-0.00175*X[i]^2)) text(50, 4, cex=1.5, family="A", expression(R^2==0.9920))l 220 Solução pelo Genes, com delineamento experimental: Arquivo Excel: polinomial.prn 0 10 20 14 40 17 60 17.4 80 17.6 100 16 O QME é digitado no próprio Genes 221 ========================================================== Programa GENES REGRESSÃO POLINOMIAL Arquivo de dados D:\AAtuais\Est Exp Pós\Aulas\Unidade VI - Regressão e Correlação\polinomial.prn Número de variáveis 2 Arquivo com QMR Grau do polinômio 3 Número de repetições 5 GL do resíduo 24 Data 05-25-2010 ========================================================== ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 1 ________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) ________________________________________________________________________________ ß0 12.39047619 3.08760965 4.01296718 .0005752 ß1 .05885714 .0509902 1.15428354 .25894104 ________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 2 __________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) __________________________________________________________________________________ ß0 10.05714286 3.86652299 2.60108187 .01503989 ß1 .23385714 .18184815 1.28600231 .20835415 ß2 ..00175 .00174553 .1.00256082 .32775567 __________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 3 __________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) _________________________________________________________________________________ ß0 9.96825397 4.18064323 2.38438284 .02418058 ß1 .25415344 .40602617 .62595334 .5441087 ß2 ..00230556 .01008901 ..22852141 .81590853 ß3 .0000037 .00006625 .05590852 .95451321 _________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 222 ANÁLISE DE REGRESSÃO POLINOMIAL - GRAU: 3 __________________________________________________________________________________ FV GL SQ QM F PROBAB __________________________________________________________________________________ TOTAL 5 214.26666667 REGRESSÃO 3 212.9968254 70.9989418 3.90104076 .02108973 GRAU 1 1 121.24571429 121.24571429 6.66185243 .01638829 GRAU 2 1 91.46666667 91.46666667 5.02564103 .0344833 GRAU 3 1 .28444445 .28444445 .01562882 100.0 DESVIO 2 1.26984127 .63492063 .03488575 100.0 RESÍDUO 24 436.8 18.2 _________________________________________________________________________________ Modelo R²(%) R²(ajustado)(%) __________________________________________________________________________________ Grau 1 56.58636323 45.73295404 Grau 2 99.27460219 98.79100364 Grau 3 99.40735473 98.51838682 __________________________________________________________________________________ 4.6 PONTO DE MÁXIMO E DE MÍNIMO No caso da equação quadrática existirá um ponto de máximo ou ponto de mínimo. Este ponto é obtido pela derivada segunda da equação de segundo grau obtido. Se o sinal for positivo, existirá ponto de mínimo. Se o sinal for negativo, existirá ponto de máximo. Para obtenção do ponto de máximo ou mínimo, basta obter a derivada primeira da equação de segundo grau e igualar a zero. Desta forma se obtêm Xi que será 2 1 2b b X i = − . A partir deste Xi na equação estimada se obtêm o ponto de máximo para i Yˆ . Para o exemplo em questão, ( ) ( ) 66 8, kg / ha NPK ,0 00175 2 ,0 2338 2b b PM de máximo Ponto 2 1 = − = − = − = que corresponde a um valor máximo de ˆ = 18,09 Yi . 4.7 EXERCÍCIOS 1) Um experimento envolvendo 3 drogas (DA, DB e DC) foi conduzido para estudar cada efeito de droga no batimento cardíaco (bpm) dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos (T1 = 5; T2 = 10; T3 = 15; T4 = 20). Veja: 223 Os dados representam um experimento em DIC num esquema em parcelas subdivididas no tempo. As parcelas eram constituídas das drogas e as subparcelas eram os tempos para medir o batimento cardíaco. Os tratamentos drogas são qualitativos e os tratamentos tempo são quantitativos. Pede-se: a) Fazer a anova para o experimento; b) Determinar os CV; c) Fazer as análises apropriadas após teste F. 2) Se realizou um experimento em DBC, com objetivo de comparar 4 níveis de água aplicados semanalmente em banana ‘Cavendish gigante’, a saber: T1: 20 mm semanais T2: 40 mm semanais T3: 60 mm semanais T4: 80 mm semanais Os dados de rendimento final foram: Tratamentos Repetições I II III IV 1 38,3 37,8 38,1 38,4 2 69,2 65,6 67,8 69,1 3 53,7 52,8 54,1 55,6 4 45,6 44,3 46,1 44,8 Pede-se: a) Proceder à anova do experimento; b) Fazer anova para regressão; 224 c) Obter a equação ajustada; d) Achar o coeficiente de determinação; e) Obter o ponto de máximo ou mínimo; f) Fazer análise crítica sobre o dimensionamento do experimento; g) Fazer o gráfico correspondente e identificar o ponto de máximo ou mínimo. 5 - LITERATURA CITADA: CRUZ, C. D. Programa GENES: estatística experimental e matrizes. Viçosa (MG): Editora UFV, 2006. 285 p. FERREIRA, J. P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v. 42, n. 2, p. 563-566, 2011. LEVIN, J. Estatística aplicada a ciências humanas. 2. ed. São Paulo: Harbra, 1987. Tradução de Sérgio Francisco Costa. NASCIMENTO, A.L. et al. Obtaining and evaluating new hybrids of papaya tree. Journal of Agricultural Science, v.10, n.7, p.146-155, 2018. https://doi.org/10.5539/jas.v10n7p146 PEARSON, K. Contribution to the mathematical theory of evolution. Philosophical Transactions of the Royal Society A., v.185, p.71-110, 1894. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SCHMILDT, E. R. et al. Efeito do floroglucinol na reação morfogênica in vitro de segmentos internodais de Citrus sinensis (Linn.) Osbeck cv. Pêra. Revista Ceres, v. 47, n. 269, p. 113-120, 2000. SPEARMAN, C. The proof and measurement of association between two things. The American Journal of Psychology, v.15, n.1, p.72-101, 1904. STEVENSOM, W. J. Estatística aplicada à administração. Tradução de Alfredo Alves de Farias. São Paulo: Harbra, 2001. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. Santo Antônio de Goiás: Embrapa Arroz e feijão, 2004. 400 p. ISBN: 85-7437-020-7. 225 Tabela t bil α = 10% α = 5% α = 2% α = 1% α = 10% α = 5% α = 2% α = 1% α = 10% α = 5% α = 2% α = 1% uni α = 5% α = 2,5% α = 1% α = 0,5% α = 5% α = 2,5% α = 1% α = 0,5% α = 5% α = 2,5% α = 1% α = 0,5% GL erro 1 6.314 12.706 31.821 63.657 GL erro 20 1.725 2.086 2.528 2.845 GL erro 39 1.685 2.023 2.426 2.708 2 2.920 4.303 6.965 9.925 21 1.721 2.080 2.518 2.831 40 1.684 2.021 2.423 2.704 3 2.353 3.182 4.541 5.841 22 1.717 2.074 2.508 2.819 41 1.683 2.020 2.421 2.701 4 2.132 2.776 3.747 4.604 23 1.714 2.069 2.500 2.807 42 1.682 2.018 2.418 2.698 5 2.015 2.571 3.365 4.032 24 1.711 2.064 2.492 2.797 43 1.681 2.017 2.416 2.695 6 1.943 2.447 3.143 3.707 25 1.708 2.060 2.485 2.787 44 1.680 2.015 2.414 2.692 7 1.895 2.365 2.998 3.499 26 1.706 2.056 2.479 2.779 45 1.679 2.014 2.412 2.690 8 1.860 2.306 2.896 3.355 27 1.703 2.052 2.473 2.771 46 1.679 2.013 2.410 2.687 9 1.833 2.262 2.821 3.250 28 1.701 2.048 2.467 2.763 47 1.678 2.012 2.408 2.685 10 1.812 2.228 2.764 3.169 29 1.699 2.045 2.462 2.756 48 1.677 2.011 2.407 2.682 11 1.796 2.201 2.718 3.106 30 1.697 2.042 2.457 2.750 49 1.677 2.010 2.405 2.680 12 1.782 2.179 2.681 3.055 31 1.696 2.040 2.453 2.744 50 1.676 2.009 2.403 2.678 13 1.771 2.160 2.650 3.012 32 1.694 2.037 2.449 2.738 60 1.671 2.000 2.390 2.660 14 1.761 2.145 2.624 2.977 33 1.692 2.035 2.445 2.733 70 1.667 1.994 2.381 2.648 15 1.753 2.131 2.602 2.947 34 1.691 2.032 2.441 2.728 80 1.664 1.990 2.374 2.639 16 1.746 2.120 2.583 2.921 35 1.690 2.030 2.438 2.724 90 1.662 1.987 2.368 2.632 17 1.740 2.110 2.567 2.898 36 1.688 2.028 2.434 2.719 100 1.660 1.984 2.364 2.626 18 1.734 2.101 2.552 2.878 37 1.687 2.026 2.431 2.715 110 1.659 1.982 2.361 2.621 19 1.729 2.093 2.539 2.861 38 1.686 2.024 2.429 2.712 120 1.658 1.980 2.358 2.617 Valores de t obtidos pelo software R, originalmente com seis casas decimais, com o script para valores bilaterais: qt(1-α/2,GLerro) 226 Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.65 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 continua ... 227 Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GL do numerador GLerro 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 200 1 248.3 248.6 248.8 249.1 249.3 249.5 249.6 249.8 250.0 250.1 250.7 251.1 251.5 251.8 252.2 252.5 252.7 252.9 253.0 253.7 2 19.45 19.45 19.45 19.45 19.46 19.46 19.46 19.46 19.46 19.46 19.47 19.47 19.47 19.48 19.48 19.48 19.48 19.48 19.49 19.49 3 8.65 8.65 8.64 8.64 8.63 8.63 8.63 8.62 8.62 8.62 8.60 8.59 8.59 8.58 8.57 8.57 8.56 8.56 8.55 8.54 4 5.79 5.79 5.78 5.77 5.77 5.76 5.76 5.75 5.75 5.75 5.73 5.72 5.71 5.70 5.69 5.68 5.67 5.67 5.66 5.65 5 4.55 4.54 4.53 4.53 4.52 4.52 4.51 4.50 4.50 4.50 4.48 4.46 4.45 4.44 4.43 4.42 4.41 4.41 4.41 4.39 6 3.86 3.86 3.85 3.84 3.83 3.83 3.82 3.82 3.81 3.81 3.79 3.77 3.76 3.75 3.74 3.73 3.72 3.72 3.71 3.69 7 3.43 3.43 3.42 3.41 3.40 3.40 3.39 3.39 3.38 3.38 3.36 3.34 3.33 3.32 3.30 3.29 3.29 3.28 3.27 3.25 8 3.14 3.13 3.12 3.12 3.11 3.10 3.10 3.09 3.08 3.08 3.06 3.04 3.03 3.02 3.01 2.99 2.99 2.98 2.97 2.95 9 2.93 2.92 2.91 2.90 2.89 2.89 2.88 2.87 2.87 2.86 2.84 2.83 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.73 10 2.76 2.75 2.75 2.74 2.73 2.72 2.72 2.71 2.70 2.70 2.68 2.66 2.65 2.64 2.62 2.61 2.60 2.59 2.59 2.56 11 2.64 2.63 2.62 2.61 2.60 2.59 2.59 2.58 2.58 2.57 2.55 2.53 2.52 2.51 2.49 2.48 2.47 2.46 2.46 2.43 12 2.53 2.52 2.51 2.51 2.50 2.49 2.48 2.48 2.47 2.47 2.44 2.43 2.41 2.40 2.38 2.37 2.36 2.36 2.35 2.32 13 2.45 2.44 2.43 2.42 2.41 2.41 2.40 2.39 2.39 2.38 2.36 2.34 2.33 2.31 2.30 2.28 2.27 2.27 2.26 2.23 14 2.38 2.37 2.36 2.35 2.34 2.33 2.33 2.32 2.31 2.31 2.28 2.27 2.25 2.24 2.22 2.21 2.20 2.19 2.19 2.16 15 2.32 2.31 2.30 2.29 2.28 2.27 2.27 2.26 2.25 2.25 2.22 2.20 2.19 2.18 2.16 2.15 2.14 2.13 2.12 2.10 16 2.26 2.25 2.24 2.24 2.23 2.22 2.21 2.21 2.20 2.19 2.17 2.15 2.14 2.12 2.11 2.09 2.08 2.07 2.07 2.04 17 2.22 2.21 2.20 2.19 2.18 2.17 2.17 2.16 2.15 2.15 2.12 2.10 2.09 2.08 2.06 2.05 2.03 2.03 2.02 1.99 18 2.18 2.17 2.16 2.15 2.14 2.13 2.13 2.12 2.11 2.11 2.08 2.06 2.05 2.04 2.02 2.00 1.99 1.98 1.98 1.95 19 2.14 2.13 2.12 2.11 2.11 2.10 2.09 2.08 2.08 2.07 2.05 2.03 2.01 2.00 1.98 1.97 1.96 1.95 1.94 1.91 20 2.11 2.10 2.09 2.08 2.07 2.07 2.06 2.05 2.05 2.04 2.01 1.99 1.98 1.97 1.95 1.93 1.92 1.91 1.91 1.88 21 2.08 2.07 2.06 2.05 2.05 2.04 2.03 2.02 2.02 2.01 1.98 1.96 1.95 1.94 1.92 1.90 1.89 1.88 1.88 1.84 22 2.06 2.05 2.04 2.03 2.02 2.01 2.00 2.00 1.99 1.98 1.96 1.94 1.92 1.91 1.89 1.88 1.86 1.86 1.85 1.82 23 2.04 2.02 2.01 2.01 2.00 1.99 1.98 1.97 1.97 1.96 1.93 1.91 1.90 1.88 1.86 1.85 1.84 1.83 1.82 1.79 Valores de F obtidos pelo software R, originalmente com seis casas decimais, com o script: qf(1-α,GLnumerador,GLdenominador) 228 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GL erro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 1539 6170 6181 6192 6201 6209 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 49.43 99.44 99.44 99.44 99.45 99.45 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.13 27.05 26.98 26.92 16.66 26.83 26.79 26.75 26.72 26.69 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 9.78 14.15 14.11 14.08 14.05 14.02 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 7.12 9.68 9.64 9.61 9.58 9.55 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 5.76 7.52 7.48 7.45 7.42 7.40 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 4.95 6.28 6.24 6.21 6.18 6.16 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 4.42 5.48 5.44 5.41 5.38 5.36 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.04 4.92 4.89 4.86 4.83 4.81 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 3.76 4.52 4.49 4.46 4.43 4.41 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 3.54 4.21 4.18 4.15 4.12 4.10 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 3.37 3.97 3.94 3.91 3.88 3.86 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.23 3.78 3.75 3.72 3.69 3.66 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.11 3.62 3.59 3.56 3.53 3.51 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.02 3.49 3.45 3.42 3.40 3.37 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 2.93 3.37 3.34 3.31 3.28 3.26 17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 2.86 3.27 3.24 3.21 3.19 3.16 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 2.80 3.19 3.16 3.13 3.10 3.08 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 2.74 3.12 3.08 3.05 3.03 3.00 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 2.70 3.05 3.02 2.99 2.96 2.94 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.24 3.17 3.12 3.07 2.65 2.99 2.96 2.93 2.90 2.88 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.07 3.02 2.61 2.94 2.91 2.88 2.85 2.83 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 3.02 2.97 2.58 2.89 2.86 2.83 2.80 2.78 continua ... 229 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GL erro GL do numerador 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 200 1 6216 6223 6229 6235 6240 6245 6249 6253 6257 6261 6276 6287 6296 6303 6313 6321 6326 6331 6334 6350 2 99.45 99.45 99.46 99.46 99.46 99.46 99.46 99.46 99.46 99.47 99.47 99.47 99.48 99.48 99.48 99.48 99.49 99.49 99.49 99.49 3 26.66 26.64 26.62 26.60 26.58 26.56 26.55 26.53 26.52 26.50 26.45 26.41 26.38 26.35 26.32 26.29 26.27 26.25 26.24 99.49 4 13.99 13.97 13.95 13.93 13.91 13.89 13.88 13.86 13.85 13.84 13.79 13.75 13.71 13.69 13.65 13.63 13.61 13.59 13.58 99.49 5 9.53 9.51 9.49 9.47 9.45 9.43 9.42 9.40 9.39 9.38 9.33 9.29 9.26 9.24 9.20 9.18 9.16 9.14 9.13 99.49 6 7.37 7.35 7.33 7.31 7.30 7.28 7.27 7.25 7.24 7.23 7.18 7.14 7.11 7.09 7.06 7.03 7.01 7.00 6.99 99.49 7 6.13 6.11 6.09 6.07 6.06 6.04 6.03 6.02 6.00 5.99 5.94 5.91 5.88 5.86 5.82 5.80 5.78 5.77 5.75 99.49 8 5.34 5.32 5.30 5.28 5.26 5.25 5.23 5.22 5.21 5.20 5.15 5.12 5.09 5.07 5.03 5.01 4.99 4.97 4.96 99.49 9 4.79 4.77 4.75 4.73 4.71 4.70 4.68 4.67 4.66 4.65 4.60 4.57 4.54 4.52 4.48 4.46 4.44 4.43 4.41 99.49 10 4.38 4.36 4.34 4.33 4.31 4.30 4.28 4.27 4.26 4.25 4.20 4.17 4.14 4.12 4.08 4.06 4.04 4.03 4.01 99.49 11 4.08 4.06 4.04 4.02 4.01 3.99 3.98 3.96 3.95 3.94 3.89 3.86 3.83 3.81 3.78 3.75 3.73 3.72 3.71 99.49 12 3.84 3.82 3.80 3.78 3.76 3.75 3.74 3.72 3.71 3.70 3.65 3.62 3.59 3.57 3.54 3.51 3.49 3.48 3.47 99.49 13 3.64 3.62 3.60 3.59 3.57 3.56 3.54 3.53 3.52 3.51 3.46 3.43 3.40 3.38 3.34 3.32 3.30 3.28 3.27 99.49 14 3.48 3.46 3.44 3.43 3.41 3.40 3.38 3.37 3.36 3.35 3.30 3.27 3.24 3.22 3.18 3.16 3.14 3.12 3.11 99.49 15 3.35 3.33 3.31 3.29 3.28 3.26 3.25 3.24 3.23 3.21 3.17 3.13 3.10 3.08 3.05 3.02 3.00 2.99 2.98 99.49 16 3.24 3.22 3.20 3.18 3.16 3.15 3.14 3.12 3.11 3.10 3.05 3.02 2.99 2.97 2.93 2.91 2.89 2.87 2.86 99.49 17 3.14 3.12 3.10 3.08 3.07 3.05 3.04 3.03 3.01 3.00 2.96 2.92 2.89 2.87 2.83 2.81 2.79 2.78 2.76 99.49 18 3.05 3.03 3.02 3.00 2.98 2.97 2.95 2.94 2.93 2.92 2.87 2.84 2.81 2.78 2.75 2.72 2.70 2.69 2.68 99.49 19 2.98 2.96 2.94 2.92 2.91 2.89 2.88 2.87 2.86 2.84 2.80 2.76 2.73 2.71 2.67 2.65 2.63 2.61 2.60 99.49 20 2.92 2.90 2.88 2.86 2.84 2.83 2.81 2.80 2.79 2.78 2.73 2.69 2.67 2.64 2.61 2.58 2.56 2.55 2.54 99.49 21 2.86 2.84 2.82 2.80 2.79 2.77 2.76 2.74 2.73 2.72 2.67 2.64 2.61 2.58 2.55 2.52 2.50 2.49 2.48 99.49 22 2.81 2.78 2.77 2.75 2.73 2.72 2.70 2.69 2.68 2.67 2.62 2.58 2.55 2.53 2.50 2.47 2.45 2.43 2.42 99.49 23 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.64 2.63 2.62 2.57 2.54 2.51 2.48 2.45 2.42 2.40 2.39 2.37 99.49 Valores de F obtidos pelo software R, originalmente com seis casas decimais, com o script: qf(1-α,GLnumerador,GLdenomanador) 230 Tabela Tukey 5% - valores de q I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B GLerro 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 6.08 8.33 9.80 10.88 11.73 12.43 13.03 13.54 13.99 14.40 14.76 15.09 15.39 15.67 15.92 16.16 16.38 16.59 16.78 3 4.50 5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.52 10.69 10.84 10.98 11.11 11.24 4 3.93 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.66 8.79 8.91 9.03 9.13 9.23 5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21 6 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 6.79 6.92 7.03 7.14 7.24 7.34 7.43 7.51 7.59 7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.10 7.17 8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87 9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 5.98 6.09 6.19 6.28 6.36 6.44 6.51 6.58 6.64 10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.11 6.19 6.27 6.34 6.40 6.47 11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.06 6.13 6.20 6.27 6.33 12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 5.61 5.71 5.80 5.88 5.95 6.02 6.09 6.15 6.21 13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86 5.93 5.99 6.05 6.11 14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.71 5.79 5.85 5.91 5.97 6.03 15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72 5.78 5.85 5.90 5.96 16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66 5.73 5.79 5.84 5.90 17 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.54 5.61 5.67 5.73 5.79 5.84 18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57 5.63 5.69 5.74 5.79 19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.31 5.39 5.46 5.53 5.59 5.65 5.70 5.75 20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.49 5.55 5.61 5.66 5.71 continua ... 231 Tabela Tukey 5% - valores de q I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B GLerro 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2.94 3.56 3.94 4.21 4.42 4.60 4.74 4.87 4.98 5.08 5.17 5.25 5.33 5.40 5.46 5.52 5.58 5.63 5.68 22 2.93 3.55 3.93 4.20 4.41 4.58 4.72 4.85 4.96 5.06 5.14 5.23 5.30 5.37 5.43 5.49 5.55 5.60 5.65 23 2.93 3.54 3.91 4.18 4.39 4.56 4.70 4.83 4.94 5.03 5.12 5.20 5.27 5.34 5.41 5.46 5.52 5.57 5.62 24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38 5.44 5.49 5.55 5.59 25 2.91 3.52 3.89 4.15 4.36 4.53 4.67 4.79 4.90 4.99 5.08 5.16 5.23 5.30 5.36 5.42 5.47 5.52 5.57 26 2.91 3.51 3.88 4.14 4.35 4.51 4.65 4.77 4.88 4.98 5.06 5.14 5.21 5.28 5.34 5.40 5.45 5.50 5.55 27 2.90 3.51 3.87 4.13 4.33 4.50 4.64 4.76 4.86 4.96 5.04 5.12 5.19 5.26 5.32 5.38 5.43 5.48 5.53 28 2.90 3.50 3.86 4.12 4.32 4.49 4.62 4.74 4.85 4.94 5.03 5.11 5.18 5.24 5.30 5.36 5.41 5.46 5.51 29 2.89 3.49 3.85 4.11 4.31 4.47 4.61 4.73 4.84 4.93 5.01 5.09 5.16 5.23 5.29 5.34 5.40 5.44 5.49 30 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.47 40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 4.90 4.98 5.04 5.11 5.16 5.22 5.27 5.31 5.36 50 2.84 3.42 3.76 4.00 4.19 4.34 4.47 4.58 4.68 4.77 4.85 4.92 4.98 5.04 5.10 5.15 5.20 5.24 5.29 60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06 5.11 5.15 5.20 5.24 70 2.82 3.39 3.72 3.96 4.14 4.29 4.42 4.53 4.62 4.71 4.78 4.85 4.91 4.97 5.03 5.08 5.12 5.17 5.21 80 2.81 3.38 3.71 3.95 4.13 4.28 4.40 4.51 4.60 4.69 4.76 4.83 4.89 4.95 5.00 5.05 5.10 5.14 5.18 90 2.81 3.37 3.70 3.94 4.12 4.27 4.39 4.50 4.59 4.67 4.75 4.81 4.88 4.93 4.98 5.03 5.08 5.12 5.16 100 2.81 3.36 3.70 3.93 4.11 4.26 4.38 4.48 4.58 4.66 4.73 4.80 4.86 4.92 4.97 5.02 5.07 5.11 5.15 110 2.80 3.36 3.69 3.92 4.10 4.25 4.37 4.48 4.57 4.65 4.72 4.79 4.85 4.91 4.96 5.01 5.05 5.10 5.14 120 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95 5.00 5.04 5.09 5.13 Valores de q obtidos pelo software R, originalmente com seis casas decimais, com o script: qtukey(1-α,ntratamentos,glresíduo) 232 Tabela Duncan 5% - valores de z GLerro I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 6.08 5.81 5.56 5.33 5.13 4.96 4.80 4.66 4.54 4.42 4.32 4.22 4.13 4.05 3.98 3.90 3.84 3.77 3.71 3 4.50 4.52 4.47 4.41 4.34 4.27 4.21 4.14 4.08 4.02 3.97 3.91 3.86 3.81 3.77 3.72 3.68 3.64 3.60 4 3.93 4.01 4.03 4.03 4.00 3.97 3.94 3.91 3.87 3.84 3.80 3.77 3.73 3.70 3.67 3.64 3.61 3.58 3.55 5 3.64 3.75 3.80 3.81 3.81 3.81 3.79 3.77 3.75 3.73 3.71 3.68 3.66 3.64 3.62 3.59 3.57 3.55 3.53 6 3.46 3.59 3.65 3.68 3.69 3.70 3.69 3.69 3.67 3.66 3.65 3.63 3.61 3.60 3.58 3.56 3.55 3.53 3.51 7 3.34 3.48 3.55 3.59 3.61 3.62 3.63 3.62 3.62 3.61 3.60 3.59 3.58 3.57 3.56 3.54 3.53 3.52 3.50 8 3.26 3.40 3.48 3.52 3.55 3.57 3.58 3.58 3.58 3.58 3.57 3.56 3.56 3.55 3.54 3.53 3.52 3.51 3.49 9 3.20 3.34 3.42 3.47 3.50 3.52 3.54 3.54 3.55 3.55 3.55 3.54 3.54 3.53 3.52 3.52 3.51 3.50 3.49 10 3.15 3.29 3.38 3.43 3.47 3.49 3.51 3.52 3.52 3.52 3.53 3.52 3.52 3.52 3.51 3.51 3.50 3.49 3.49 11 3.11 3.26 3.34 3.40 3.44 3.46 3.48 3.49 3.50 3.51 3.51 3.51 3.51 3.51 3.50 3.50 3.49 3.49 3.48 12 3.08 3.23 3.31 3.37 3.41 3.44 3.46 3.47 3.48 3.49 3.50 3.50 3.50 3.50 3.50 3.49 3.49 3.49 3.48 13 3.06 3.20 3.29 3.35 3.39 3.42 3.44 3.46 3.47 3.48 3.48 3.49 3.49 3.49 3.49 3.49 3.49 3.48 3.48 14 3.03 3.18 3.27 3.33 3.37 3.40 3.43 3.44 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 3.48 3.48 3.48 15 3.01 3.16 3.25 3.31 3.36 3.39 3.41 3.43 3.45 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 3.48 3.48 16 3.00 3.14 3.23 3.30 3.34 3.38 3.40 3.42 3.44 3.45 3.46 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 17 2.98 3.13 3.22 3.28 3.33 3.37 3.39 3.41 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.48 3.48 3.48 18 2.97 3.12 3.21 3.27 3.32 3.36 3.38 3.40 3.42 3.43 3.45 3.45 3.46 3.47 3.47 3.47 3.47 3.47 3.47 19 2.96 3.11 3.20 3.26 3.31 3.35 3.37 3.40 3.41 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 3.47 20 2.95 3.10 3.19 3.25 3.30 3.34 3.37 3.39 3.41 3.42 3.44 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 continua ... 233 Tabela Duncan 5% - valores de z GLerro I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2.94 3.09 3.18 3.25 3.30 3.33 3.36 3.38 3.40 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 22 2.93 3.08 3.17 3.24 3.29 3.33 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 3.47 23 2.93 3.07 3.17 3.23 3.28 3.32 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 24 2.92 3.07 3.16 3.23 3.28 3.31 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 25 2.91 3.06 3.15 3.22 3.27 3.31 3.34 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 26 2.91 3.05 3.15 3.22 3.27 3.31 3.34 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 27 2.90 3.05 3.14 3.21 3.26 3.30 3.33 3.36 3.38 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 28 2.90 3.04 3.14 3.21 3.26 3.30 3.33 3.35 3.38 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 29 2.89 3.04 3.13 3.20 3.25 3.29 3.33 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 30 2.89 3.04 3.13 3.20 3.25 3.29 3.32 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.45 3.46 3.47 3.47 40 2.86 3.01 3.10 3.17 3.22 3.27 3.30 3.33 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.46 3.46 3.47 50 2.84 2.99 3.08 3.15 3.21 3.25 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.47 60 2.83 2.98 3.07 3.14 3.20 3.24 3.28 3.31 3.33 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.47 70 2.82 2.97 3.06 3.14 3.19 3.23 3.27 3.30 3.33 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.46 3.47 80 2.81 2.96 3.06 3.13 3.18 3.23 3.27 3.30 3.32 3.35 3.37 3.38 3.40 3.41 3.43 3.44 3.45 3.46 3.47 90 2.81 2.96 3.05 3.13 3.18 3.23 3.26 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.46 3.47 100 2.81 2.95 3.05 3.12 3.18 3.22 3.26 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.42 3.44 3.45 3.46 3.47 110 2.80 2.95 3.05 3.12 3.17 3.22 3.26 3.29 3.32 3.34 3.36 3.38 3.39 3.41 3.42 3.44 3.45 3.46 3.47 120 2.80 2.95 3.04 3.12 3.17 3.22 3.25 3.29 3.31 3.34 3.36 3.38 3.39 3.41 3.42 3.44 3.45 3.46 3.47 Valores de z obtidos pelo software R, originalmente com seis casas decimais, com o script: qtukey(1-α^I-1,ntratamentos,glresíduo) 234 Tabela Dunnett a 5%, unilateral GLerro I Tratamentos de experimento em DIC, DBC ou DQL, comparados com a testemunha 2 3 4 5 6 7 8 9 10 15 20 10 2.1507 2.3376 2.4657 2.5624 2.6398 2.7042 2.7591 2.8070 2.8493 3.0082 3.1173 11 2.1273 2.3100 2.4350 2.5293 2.6048 2.6675 2.7211 2.7677 2.8089 2.9636 3.0696 12 2.1081 2.2874 2.4099 2.5023 2.5762 2.6376 2.6900 2.7356 2.7759 2.9271 3.0307 13 2.0922 2.2686 2.3890 2.4798 2.5524 2.6126 2.6641 2.7088 2.7484 2.8967 2.9984 14 2.0786 2.2526 2.3713 2.4608 2.5322 2.5916 2.6422 2.6862 2.7251 2.8710 2.9710 15 2.0670 2.2390 2.3562 2.4445 2.5150 2.5735 2.6234 2.6668 2.7052 2.8490 2.9475 16 2.0570 2.2272 2.3431 2.4303 2.5000 2.5579 2.6072 2.6501 2.6880 2.8300 2.9272 17 2.0482 2.2168 2.3316 2.4180 2.4870 2.5442 2.5930 2.6354 2.6729 2.8133 2.9095 18 2.0404 2.2077 2.3215 2.4071 2.4754 2.5321 2.5804 2.6225 2.6596 2.7987 2.8938 19 2.0335 2.1996 2.3125 2.3974 2.4652 2.5214 2.5693 2.6110 2.6478 2.7856 2.8799 20 2.0274 2.1923 2.3044 2.3888 2.4560 2.5118 2.5594 2.6007 2.6372 2.7739 2.8674 30 1.9890 2.1473 2.2546 2.3351 2.3993 2.4524 2.4977 2.5370 2.5718 2.7017 2.7904 40 1.9704 2.1254 2.2303 2.3090 2.3717 2.4236 2.4677 2.5061 2.5400 2.6665 2.7529 50 1.9593 2.1124 2.2160 2.2936 2.3554 2.4065 2.4500 2.4878 2.5212 2.6458 2.7307 60 1.9520 2.1039 2.2065 2.2834 2.3446 2.3952 2.4383 2.4757 2.5088 2.6320 2.7161 70 1.9469 2.0978 2.1998 2.2762 2.3370 2.3872 2.4300 2.4672 2.4999 2.6223 2.7057 80 1.9430 2.0932 2.1947 2.2708 2.3313 2.3813 2.4238 2.4608 2.4934 2.6151 2.6980 90 1.9400 2.0897 2.1909 2.2666 2.3268 2.3767 2.4190 2.4558 2.4883 2.6094 2.6920 100 1.9376 2.0869 2.1877 2.2633 2.3233 2.3730 2.4152 2.4519 2.4842 2.6049 2.6872 120 1.9340 2.0827 2.1831 2.2583 2.3180 2.3674 2.4095 2.4459 2.4781 2.5982 2.6801 Determinado no R, com seis casas decimais, usando o pacote nCDunnett (BROCH; FERREIRA, 2014).
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
2
P3 - Estatística Experimental 2021 2
Estatística Experimental
UFES
34
Slide - Análise de Regressão - 2023-1
Estatística Experimental
UFES
2
P2 - Estatística Experimental 2021-2
Estatística Experimental
UFES
6
Lista - Fatorial Parcelas Subdivididas Correlação e Regressão - Estatística Experimental 2023-1
Estatística Experimental
UFES
68
Slide - Regressão Linear Múltipla - 2023-1
Estatística Experimental
UFES
1
Exercício Estatística Experimental 2021 2
Estatística Experimental
UFES
3
Lista 6 - Métodos Estatísticos 1 - 2023-1
Estatística Experimental
UFES
2
P1 - Estatística Experimental 2021-2
Estatística Experimental
UFES
82
Slide - Introdução à Análise de Regressão - 2023-1
Estatística Experimental
UFES
80
Slide - Testes de Hipóteses - 2023-1
Estatística Experimental
UFES
Texto de pré-visualização
1 Preâmbulo Apostila elaborada pelo professor Edilson Romais Schmildt, para atender aos alunos de graduação em Agronomia do Ceunes/Ufes, na disciplina CAB06203 – Estatística Experimental, que tem a seguinte ementa: Teste de hipótese. Contrastes. Princípios básicos de experimentação. Análise de variância. Teste de significância. Procedimentos para comparações múltiplas. Delineamentos experimentais. Experimentos fatoriais. Experimentos em parcelas subdivididas. Regressão linear. Correlação. A sequência abordada contém todo o conteúdo da ementa e está exatamente como apresentado no plano de ensino (programa) da referida disciplina. Ao final de cada unidade são apresentados exercícios, no qual, para melhor contextualização com a área agrária, são explorados artigos científicos, e são exigidas análises de forma manual e nos softwares Genes e R. As abordagens de experimentos com número de parcelas diferentes ou com perda de parcelas são exceção e não a regra, visto que, o importante é compreender cada estatística envolvida e, nos casos excepcionais de perda de parcelas, os softwares referidos podem ser usados para resolver tais situações. O uso de tamanho 12 na letra é suficiente para o aluno ler o material no Leptop e, tamanho 20 da letra é usado, principalmente para tabelas e gráficos e de forma proposital já que tem por finalidade melhor visualização na apresentação virtual, visto que o período de oferta se caracteriza como Ensino aprendizagem Remoto Temporário Emergencial (Earte). A apostila poderá ser usada também por alunos da disciplina PGAT1002 – Estatística experimental que tem a seguinte ementa: Princípios básicos de experimentação. Procedimentos para comparações múltiplas. Delineamentos experimentais. Experimentos fatoriais e parcelas subdivididas. Modelos de regressão e análise de correlação. 2 SUMÁRIO Preâmbulo .......................................................................................................................................................................................................... 01 Unidade I – Teste de hipótese …....................................................................................................................................................................... 03 Unidade II – Princípios básicos de experimentação ....................................................................................................................................... 25 Unidade III – Delineamentos experimentais …............................................................................................................................................... 29 Unidade IV – Procedimentos para comparações múltiplas …....................................................................................................................... 65 Unidade V – Experimentos fatoriais …............................................................................................. ............................................................. 101 Unidade VI – Experimentos em parcelas subdivididas …..............................................................................................................................123 Unidade VII – Regressão e correlação ….........................................................................................................................................................152 Tabelas estatísticas ...........................................................................................................................................................................................225 Unidade I – TESTE DE HIPÓTESE Ao executar um experimento, o pesquisador busca comprovar alguma hipótese que estabeleceu (ZIMMERMANN, 2014, p.29). Hipóteses: Dois tipos de hipóteses são formuladas: hipóteses nula (H0), segundo qual se declara a não existência de efeito do que se está testando; hipóteses alternativa (H1), que declara a existência desse efeito e pode ser do tipo bilateral (diferente) ou unilateral (maior que, ou menor que). A hipóteses alternativa pode também ser designada por Ha. Essas duas hipóteses são formuladas segundo o tipo de pressuposição adequado à análise a que se propõe. No decorrer do curso, serão lançadas hipóteses tais como: reativas à análise de variância; relativa a testes de comparação de médias; referente aos coeficientes de equações lineares. Nesta unidade faremos algumas aplicações relativas a análises cujas amostras não caracterizam delineamentos experimentais tal como teste de t para comparação de dois tratamentos apenas. Erros tipos I e II: Quando se realiza inferência estatística, que é o caso de experimentos na área agronômica, tem que se considerar que os resultados não são precisos e que há erros embutidos, diferente da estatística descritiva que se atém apenas ao conjunto de dados em análise, e, portanto, sem erro embutido. Na aplicação de um teste estatístico qualquer, associam-se dois tipos de erros: erro tipo I; erro tipo II. O quadro seguinte resume a situação. Hipótese | Decisão Aceitar | Rejeitar H0 | Correta | Erro tipo I (a) H1 | Erro tipo II (b) | Correta (poder) O erro tipo I (a) é também chamado nível de significância do teste, e, normalmente na área agronômica se trabalha com a = 5% e a = 1%. Se for usado a = 5% quer dizer que a confiança do teste é de 95%. O erro tipo I ocorre ao rejeitar-se uma hipótese nula que é verdadeira. O erro tipo II é designado por b. O complemento da unidade, qual seja, 1 - b é chamado de poder de um teste. Se comete o erro tipo II ao se aceitar uma hipótese nula falsa. Via de regra, nos trabalhos experimentais pouco se trabalha o erro tipo II, muito embora o poder do teste seja importante. Para se determinar o tamanho ótimo de parcelas experimentais (X0), na metodologia segundo Hatheway (1961), conforme equação a seguir. X0 = \dfrac{b}{2}\sqrt{2(t1 + t2)^2CV^2/r\ d^2} Na equação, os valores do coeficiente de heterogeneidade (b) e o coeficiente de variação (CV) podem ser obtidos por simulação bootstrap, com 2000 reamostragens ou mais. Já o d é a precisão experimental que compreende a diferença entre as médias dos tratamentos detectadas como significativas a 5% de probabilidade, expressa em porcentagem da média geral do teste de uniformidade; t1 é o valor tabelado de t para testes de significância (teste bilateral a 5%), com gl graus de liberdade; t2 é o valor tabelado de t, bilateral, correspondente a um erro de 2(1-p), e p é a probabilidade de se obter resultados significativos, ou seja, o poder do teste. Os valores tabelados da distribuição de t são obtidos com gl graus de liberdade do resíduo, em função dos I tratamentos e r repetições, sendo gl = (I - 1)(r - 1) para experimentos em blocos casualizados. Para verificar a aplicação do poder de teste na metodologia de Hatheway (1961), podem ser consultados os artigos de Schimidt et al. (2016), Celanti et al. (2016) e Santos et al. (2019). gl graus de liberdade; t2 é o valor tabelado de t, bilateral, correspondente a um erro de 2(1-p), com gl graus de liberdade, sendo p = 0,80 a probabilidade de se obter resultados significativos, ou seja, o poder do teste. Os valores tabelados da distribuição de t são obtidos com gl graus de liberdade do resíduo, em função dos I tratamentos e r repetições, sendo gl = (I - 1)(r - 1) para experimentos em blocos casualizados. Para verificar a aplicação do poder de teste na metodologia de Hatheway (1961), podem ser consultados os artigos de Schimidt et al. (2016), Celanti et al. (2016) e Santos et al. (2019). São abordados, a seguir, alguns testes de hipóteses, que podem ser conferidos em Zimmermann (2014). 1) Teste de t para dados pareados tcalc = \dfrac{\overline{d} - mD}{sd/\sqrt{n}} H0: mD = 0 Ha: mD < 0 Outras hipóteses alternativas: Ha: mD > 0 ou Ha: mD ≠ 0 ttab(a;n-1 GL;unilateral) Se |tcalc| ≥ ttab, rejeitamos a hipótese de nulidade Se |tcalc| < ttab, não rejeitamos a hipótese de nulidade Para este caso, uma mesma amostra é usada para avaliação em dois momentos, como por exemplo, antes e após a aplicação de um inibidor da fotossíntese em 20 plantas de milho, como ilustrado a seguir, onde foi avaliada a taxa de crescimento. A pergunta é, o inibidor foi eficiente? 5 Planta Antes Depois Planta Antes = x1 Depois = x2 0 = 12 − 14 1 15 14 1 15 14 -1 2 14 12 2 14 12 -2 3 13 11 3 13 11 -2 4 14 13 4 14 13 -1 5 15 13 5 15 13 -2 6 13 11 6 13 11 -2 7 15 15 7 15 15 0 8 16 14 8 16 14 -2 9 12 10 9 12 10 -2 10 16 15 Cálculos necessários 10 16 15 -1 11 14 12 11 14 12 -2 12 16 15 12 16 15 -1 13 15 13 13 15 13 -2 14 14 12 14 14 12 -2 15 15 11 15 15 11 -4 16 17 12 16 17 12 -5 17 12 12 17 12 12 0 18 13 10 18 13 10 -3 19 14 10 19 14 10 -4 20 16 11 20 16 11 -5 Média = 0̅ -2,15 DP = 56 1,4244 H0: mD = 0 Ha: mD < 0 \overline{d} - mD sd/\sqrt{n} = -2,15 - 0 1,4244/\sqrt{20} = -6,75 tcalc = \dfrac{\overline{d} - mD}{sd/\sqrt{n}} ttab(a;n-1 GL;unilateral) = t(5%;19;unilateral) = -1,729 Tabela t bil | a = 10% | a = 5% | a = 2% | a = 1% uni | a = 5% | a = 2,5% | a = 1% | a = 0,5% 1 | 6.314 | 12.706 | 31.821 | 63.657 2 | 2.920 | 4.303 | 6.965 | 9.925 Gl erro 19 | 1.729 | 2.093 | 2.539 | 2.861 20 | 1.725 | 2.086 21 | 1.721 | 2.080 38 | 1.686 | 2.024 O valor de ttab pode ser obtido no R por: qt(0.05,19,lower.tail=TRUE): qt(0.05,19,lower.tail=TRUE) [1] -1.729133 Conclusão: Como |tcalc| ≥ ttab, rejeitamos a hipótese de nulidade e podemos afirmar que o inibidor é eficiente para reduzir a taxa de crescimento em plantas de milho, a 5% de probabilidade pelo teste t. Script para resolução no software R (R CORE TEAM, 2021): X<-read.table("e:\\dados\\milho t pareado.txt",header=T) # Leitura dos dados X t.test(X$Depois,X$Antes,paired=TRUE,alternative="less", var.equal=TRUE) #ordem: depois, antes. Alternative: less = unilateral à esquerda; greater = unilateral à direita; two.sided = bilateral boxplot(X$Antes,X$Depois,names=c("Antes","Depois"), ylab="Taxa de crescimento") Resultados do R: Paired t-test data: X$Depois and X$Antes t = -6.7502, df = 19, p-value = 0.0000009471 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: Inf -1.599257 sample estimates: mean of the differences -2.15 LI_{5\%} = \overline{d} - (t_{\alpha}) \Big(\frac{s_d}{\sqrt{n}} \Big) LI_{5\%} = -2,15 - (-1,729) \Big(\frac{1,4244}{\sqrt{20}} \Big) = -1,5993 2) Teste para duas variâncias Podemos fazer o teste de t para duas amostras independentes, amostra 1 e amostra 2. Para este caso, é necessário saber se as variâncias das duas amostras são homogêneas. H_{0}: \sigma^{2}_{1} = \sigma^{2}_{2} H_{a}: \sigma^{2}_{1} \neq \sigma^{2}_{2} Vejamos um exemplo com dados reais. No trabalho de dissertação de uma aluna do PPGAT, procurou-se verificar se as plantas de mamoeiro das variedades Aliança e THB apresentam alturas diferentes. Para tal foi estruturado um experimento, um ensaio em branco em que, numa mesma área foram plantadas, na mesma época, uma fileira com 100 plantas de ‘Aliança’ do lado de outra fileira de 100 plantas de ‘THB’. Para esta análise usaremos apenas 15 plantas de cada variedade, como segue, avaliadas 488 dias após o plantio. Poderiam ter sido amostras de tamanho diferente. Cálculos necessários Planta | Aliança | THB 1 | 305 | 250 2 | 302 | 260 3 | 300 | 270 4 | 280 | 298 5 | 296 | 290 6 | 305 | 260 7 | 320 | 265 8 | 312 | 242 9 | 296 | 265 10 | 290 | 275 11 | 300 | 260 12 | 282 | 290 13 | 302 | 280 14 | 310 | 263 15 | 330 | 255 Médias | 302,00 | 268,20 Variâncias | 171,2857 | 247,7429 Para testar as hipóteses procedemos da seguinte forma: a) Obtemos a razão entre as duas variâncias, o valor F de Snedecor: Fcalc = \frac{maior \ \sigma^{2}_{i}}{menor \ \sigma^{2}_{i}} b) Comparar o Fcalc com o Ftab(\alpha,GLnumerador,GLdenominador). Se Fcal \geq Ftab, rejeita-se H0 e se conclui que as variâncias são heterogêneas; Se Fcal < Ftab, não se rejeita-se H0 e se conclui que as variâncias são homogêneas. H_{0}: \sigma^{2}_{Aliança} = \sigma^{2}_{THB} H_{a}: \sigma^{2}_{Aliança} \neq \sigma^{2}_{THB} Fcalc = \frac{\sigma^{2}_{Aliança}}{\sigma^{2}_{THB}} = \frac{171,2857}{247,7429} = 0,6914 Fcalc = \frac{maior \ \sigma^{2}_{i}}{menor \ \sigma^{2}_{i}} = \frac{\sigma^{2}_{THB}}{\sigma^{2}_{Aliança}} = \frac{247,7429}{171,2857} = 1,4464 Ftab(\alpha,GLnumerador,GLdenominador) = Ftab(5\%,14,14) = 2,48 Tabela F 5\% - limites unilaterais de F ao nível de 5\% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 ... ... 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 13 Resolvendo pelo R: X<-read.table("e:\\dados\\mamoeiro t independente.txt",header=T) # Leitura dos dados X t.test(X$Aliança,X$THB, var.equal=TRUE,alternative="two.sided") boxplot(X$Aliança,X$THB,names=c("Aliança","THB"), ylab="Altura de planta (cm)") 3.2) Teste de t para duas amostras independentes, variâncias heterogêneas No caso de os dois tratamentos apresentarem variâncias amostrais heterogêneas, o teste de t fica como mostrado a seguir. tcalc = ( m̄2 - m̄1 ) / sqrt( s1^2/n1 + s2^2/n2 ) H0: m1 = m2 Ha: m1 ≠ m2 ou os unilaterais, dependendo do caso O t calculado é comparado com o ttab, bilateral no caso, ao nível de significância alfa GI como segue, conforme Satterthwaite (1946): GL = ( ( ( s1^2/n1 + s2^2/n2 )^2 ) ) / ( ( ( s1^2/n1 )^2 ) / ( n1 - 1 ) + ( ( s2^2/n2 )^2 ) / ( n2 - 1 ) ) Exemplo: Considere que um engenheiro agrônomo resolveu testar um produto para avaliar o crescimento de mudas clonais de eucalipto. Para tal, separou 25 mudas, do mesmo clone, com a mesma idade e altura uniforme e aplicou o produto, na dosagem recomendada pelo fabricante em 10 mudas e acompanhou as outras 15 mudas, sem aplicação do produto. Os dados são apresentados a seguir, para crescimento das mudas em cm, depois de 20 dias da aplicação, já digitadas para uso no R. Na Sequência, verificação da homogeneidade das variâncias. 15 X<-read.table("e:\\dados\\eucalipto mudas t independente.txt",header=T) # Leitura dos dados X var.test(X$Produto,X$Testemunha) Verificando que não há homogeneidade entre as variâncias, aplicaremos o teste t em questão (para variâncias heterogêneas). Muda Produto Testemunha 1 10 2 2 9 1.6 3 6.8 2 4 8.9 3 5 11.2 2 6 12 1 7 10.3 1.5 8 8.7 2.2 9 9 3.1 10 5.9 4.7 11 NA 2 12 NA 1.9 13 NA 3 14 NA 2.8 15 NA 2.5 Cálculos necessários Médias 9,1800 2,3533 Variâncias 3,4173 0,7841 GL = ( ( S^2_Produto/n_Produto + S^2_Testemunha/n_Testemunha )^2 ) / ( ( ( S^2_Produto/n_Produto )^2 ) / ( n_Produto - 1 ) + ( ( S^2_Testemunha/n_Testemunha )^2 ) / ( n_Testemunha - 1 ) ) = ( ( 3,4173/10 + 0,7841/15 )^2 ) / ( ( 3,4173^2/10 ) / ( 10 - 1 ) + ( 0,7841^2/15 ) / ( 15 - 1 ) ) = 11,787 H0: m_Produto = m_Testemunha Ha: m_Produto > m_Testemunha tcalc = ( m̄_Produto - m̄_Testemunha ) / sqrt( S^2_Produto/n_Produto + S^2_Testemunha/n_Testemunha ) = ( 9,1800 - 2,3533 ) / sqrt( 3,4173/10 + 0,7841/15 ) = 10,876 O valor de ttab pode ser obtido no R por: qt(0.95,12,lower.tail=TRUE) ou em tabela, como segue: Tabela t bil alfa=10% alfa=5% alfa=2% alfa=1% uni alfa=5% alfa=2,5% alfa=1% alfa=0,5% 1 6.314 12.706 31.821 63.657 2 2.920 4.303 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2.776 3.747 4.604 5 2.015 2.571 3.365 4.032 6 1.943 2.447 3.143 3.707 7 1.895 2.365 2.998 3.499 8 1.860 2.306 2.896 3.355 9 1.833 2.262 2.821 3.250 10 1.812 2.228 2.764 3.169 11 1.796 2.201 2.718 3.106 12 1.782 2.179 2.681 3.055 GL erro 20 1.725 2.086 2.528 2.845 21 1.721 2.080 2.518 2.831 22 1.717 2.074 2.508 2.819 23 1.714 2.069 2.500 2.807 24 1.711 2.064 2.492 2.797 25 1.708 2.060 2.485 2.787 26 1.706 2.056 2.479 2.779 27 1.703 2.052 2.473 2.771 28 1.701 2.048 2.467 2.763 29 1.699 2.045 2.462 2.756 30 1.697 2.042 2.457 2.750 31 1.696 2.009 2.403 2.744 39 1.685 2.023 2.426 2.708 40 1.684 2.021 2.423 2.704 41 1.683 2.020 2.421 2.701 42 1.682 2.018 2.418 2.698 43 1.681 2.017 2.416 2.695 44 1.680 2.015 2.414 2.692 45 1.679 2.014 2.412 2.690 46 1.679 2.013 2.410 2.687 47 1.678 2.012 2.408 2.685 48 1.677 2.011 2.407 2.682 49 1.677 2.010 2.405 2.680 50 1.676 2.009 2.403 2.678 18 Conclusão: o produto é eficiente no crescimento de mudas de eucalipto, sendo comprovado estatisticamente pelo teste de t a 5% de probabilidade. Resolução pelo R: X<-read.table("e:\\dados\\eucalipto mudas t independente.txt",header=T) # Leitura dos dados X t.test(X$Produto,X$Testemunha, var.equal=FALSE,alternative="greater") boxplot(X$Produto,X$Testemunha,names=c("Produto","Testemunha"), ylab="Crescimento de muda (cm)") 19 Uma vez obtido o resultado, não há necessidade de se mencionar se as variâncias foram homogêneas ou não. Vide a Tabela 2, extraída da tese do Dr. Omar Schmildt (SCHMILDT, 2010). 4) Teste de t para uma média Embora de uso menos frequente na área agronômica, por vezes tem-se a necessidade de se fazer o teste de média para o caso de uma média específica (m̄), a partir de amostra retirada de uma população com variável normalmente distribuída. O teste é para uma média, mas estão envolvidas duas médias. A outra média é a média tidas como média populacional (m). A estatística do teste é, para a qual será feito um exemplo na sequência: tcalc = (m̄ - m) / (s / √n) planta prodplanta 1 42.60 2 50.25 3 55.00 4 60.00 5 67.00 6 65.70 7 72.00 8 75.00 9 65.00 10 55.00 11 54.00 12 48.00 Cálculos necessários planta prodplanta 1 42.6 2 50.25 3 55 4 60 5 67 6 65.7 7 72 8 75 9 65 10 55 11 54 12 48 Média 59,1292 DP 9,9737 Exemplo: A média populacional de lavouras de mamoeiro THB, no primeiro ano, é de 80 t/ha, o que corresponde a 43 kg/planta. Um produtor verificou que o manejo diferenciado permitia uma produção um pouco maior que a média citada para a variedade. Para fazer a verificação, avaliou a produção de 12 plantas no primeiro ano (dados acima). Verificar se a sua média de produção por planta é superior à média populacional. H₀: m = 43 kg/planta Hₐ: m > 43 kg/planta tcalc = (m̄ - m) / (s / √n) = (59,1292 - 43) / (9,9737 / √12) = 5,6021 O valor de ttab pode ser obtido no R por: qt(0.95,11,lower.tail=TRUE) ou em tabela, como segue: > qt(0.95,11,lower.tail=TRUE) [1] 1.795885 Tabela t GL erro alpha = 10% alpha = 5% alpha = 2% alpha = 1% uni alpha = 5% alpha = 2,5% alpha = 1% alpha = 0,5% 1 6.314 12.706 31.821 63.657 2 2.920 4.303 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2.776 3.747 4.604 5 2.015 2.571 3.365 4.032 6 1.943 2.447 3.143 3.707 7 1.895 2.365 2.998 3.499 8 1.860 2.306 2.896 3.355 9 1.833 2.262 2.821 3.250 10 1.812 2.228 2.764 3.169 11 1.796 2.201 2.718 3.106 12 1.782 2.179 2.681 3.055 13 1.771 2.160 2.650 3.012 14 1.761 2.145 2.624 2.977 15 1.753 2.131 2.602 2.947 16 1.746 2.120 2.584 2.921 17 1.740 2.110 2.567 2.898 18 1.734 2.101 2.552 2.878 19 1.729 2.093 2.539 2.861 20 1.725 2.086 2.528 2.845 21 1.721 2.080 2.518 2.831 22 1.717 2.074 2.508 2.819 23 1.714 2.069 2.500 2.807 24 1.711 2.064 2.492 2.797 25 1.708 2.060 2.485 2.787 26 1.706 2.056 2.479 2.779 27 1.703 2.052 2.473 2.771 28 1.701 2.048 2.467 2.763 29 1.699 2.045 2.462 2.756 30 1.697 2.042 2.457 2.750 23 Para relembrar o boxplot, segue Figura ilustrativa. Exercícios Ia) No item 3.1 foi realizado o teste de t bilateral para a comparação de altura de plantas entre as culivares de mamoeiro Aliança e THB. Demonstre como se chega aos valores de IC apresentados pelo R, na referida análise; Ib) Ainda referente ao exemplo no item 3.1, qual a confiança estatística que se tem ao dizer que a cultivar Aliança possui maior altura de plantas do que a cultivar THB, aos 488 dias após plantio? Referências: CELANTI, H. F.; SCHMILDT, O.; ALEXANDRE, S. R.; CATTANEO, F. L.; SCHMILDT, E. R. Plot size in the evaluation of papaya seedlings ‘Baixinho de Santa Amália’ in tubes. Revista Brasileira de Fruticultura, v.38, n.3, p.e-533, 2016. https://doi.org/10.1590/0100-29452016533 HATHEWAY, W.H. Convenient plot size. Agronomy Journal, v.53, n.4, p.279-280, 1961. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. 24 SANTOS, G.P. et al. Plot size related to numbers of treatments and replications, and experimental precision in conilon coffee from clonal seedlings of LB1. Journal of Agricultural Science, v.11, n.11, p.285-294, 2019. https://doi.org/10.5539/jas.v11n11p285 SATTERTHWAITE, F.E. An approximate distribution of estimates of variance components. Biometrics Bulletin, Washington-DC, v.2, n.6, p.110-114, 1946. SCHMILDT, O. Cultivo in vitro e estaquia dos mamoeiros Golden e Uenf/Caliman 01. 2010. 119f. Tese (Doutorado em Produção Vegetal), Universidade Estadual do Norte Fluminense Darcy Ribeiro, Campos dos Goytacazes, 2010. SCHMILDT, E. R.; SCHMILDT, O.; CRUZ, C. D.; CATTANEO, L. F.; FERREGUETTI, G. A. Optimum plot size and number of replications in papaya field experiment. Revista Brasileira de Fruticultura, v.38, n.2, p.e-373, 2016. https://doi.org/10.1590/0100-29452016373 ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 25 Unidade II – PRINCÍPIOS BÁSICOS DE EXPERIMENTAÇÃO O conteúdo desta unidade é explorado, de forma mais ilustrativa, na apresentação em Power Point, disponibilizado aos alunos. Segue o conteúdo, de forma bem resumida. Para que se compreenda os princípios básicos da experimentação, há necessidade de entendermos o que é experimento, unidade experimental, repetição entre outros termos. Conceitos Básicos: I) Fator – aquilo que se aplica em um ensaio de forma não homogênea. Por exemplo: cultivar, quando se testam várias delas; adubação, ao se compararem diversas formulações; etc. II) Nível – as diferentes manifestações de um fator. por exemplo: as doses de adubação empregadas; os tipos de formulações usadas; os espaçamentos utilizados; as diferentes cultivares testadas; diferentes temperaturas de cocção; diferentes raças bovinas; etc. III) Tratamento – Cada um dos níveis de um fator ou cada uma das combinações dos níveis dos fatores quando testados mais de um fator.. IV) Testemunha – grupo que não recebe o tratamento. Também chamado de padrão, termo usado no melhoramento de plantas, quando se refere a um genótipo usual na região a ser comparado com novos genótipos.A testemunha pode ser a ausência do fator (dose zero do inseticida por exemplo). V) Experimento (ensaio) - trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos, sendo estes aplicados de forma repetida: estudo de alimentação de vacas leiteiras com diferentes rações; competição de cultivares de milho; etc. Quando mais de um fator estiver sendo estudado, o experiment é chamado de factorial. VI) Delineamento Experimental - É o desenho amostral. Os principais são: delineamento inteiramente casualizado (DIC); delineameno em blocos casualizados (DBC); delineamento em quadrado latino (DQL). Obs.: Fatorial e Parcelas Subdivididas (PSD) são esquemas experimentais e estão organizados dentro de um DIC, DBC ou DQL. Em trabalhos acadêmicos e em artigos científicos, nunca usar as siglas, coloque o nome por extenso, como … delineamento inteiramente casualizado. VII) Unidade Experimental = Parcela - Unidade para a experimentação, para a colheita dos dados que deverão refletir os efeitos dos tratamentos: uma ovelha para se verificar a produção de leite; duas fileiras de 5 metros para se avaliar a produção de milho; um vaso para se avalair o efeito de determinado adubo na produção de matéria seca; etc. Segundo Pimentel Gomes (2009, p.25) em experimentos com vegetais, a parcela também tem recebido o nome de canteiro ou talhão. VIII) Repetição - Aplicação dos tratamentos a mais de uma parcela. Em experimentação, a repetição é necessária para se determiner erro experimental. IX) Bloco – conjunto ambiental homogêneo que contém todos os tratamentos ou parte deles. No DQL, em que se apresentam dois tipos de blocos, eles recebem a denominação de colunas e linhas. X) Erro Experimental - Variação entre parcelas recebendo o mesmo tratamento. Na ANOVA é computado como QME. É o erro não controlado do experimento. XI) Casualização - É a aleatorização dos tratamentos às parcelas por meio de algum tipo de sorteio: “cumbuca”; tabela de números aleatórios; recursos da calculadora; recursos computacionais. XII) Fontes de Variação – também chamado de causas de variação. Como o nome indica, são as fontes onde existirá variabilidade, contida no modelo matemático e que entrará na análise de variância. É importante o pesquisador saber ler o modelo matemático e compor as fontes de variação. XIII) Variável (Característica, caractere) em análise - É a característica medida ou observada no experimento: produtividade; teor de óleo; altura de plantas; altura de inserção de espiga; taxa de multiplicação; porcentagem de germinação; IVG; porcentagem de estacas enraizadas; massa fresca de raízes; etc. XIV) Parâmetro – estatística da população como: media (mₐ); desvio padrão (σ); variância genética (σg²); etc. Enfatizamos que experimentos são amostras e, portanto, as estatísticas obtidas nos experimentos são estimativas dos parâmetros, representadas com assento circunflexo (Ex.: m̂ₐ). No lançamento de hipóteses, sempre sem sinal de estimativa. Exemplo, H₀: mₐ = m̂ₐ Ainda referente ao erro experimental, Zimmermann (2014) aponta que o mesmo nunca pode ser eliminado, mas pode ser amenizado por meio de um conjunto de atividades ou procedimentos, dos quais podem-se citar: uniformização das parcelas experimentais; parcela experimental de tamanho adequado; uso de bordaduras; utilização de um número adequado de repetições e de preferência igual para todos os tratamentos; manejo das parcelas de forma homogênea, no qual diz respeito a todos os fatores não envolvidos no estudo; uso do delineamento estatístico adequado para as condições de realização do experimento, de forma a obter o melhor aproveitamento dos resultados. Os delineamentos devem receber algumas ações dos pesquisadores a fim de minimizar os efeitos das variações que ocorrem no ambiente em que o experimento é conduzido. Para tal, os experimentos são estruturados Segundo alguns princípios básicos. Os princípios básicos de experimentação são três: repetição; casualização; controle local. Princípios Básicos de experimentação: Repetição: como relatado anteriormente, se refere à aplicação dos tratamentos a mais de uma parcela e, sem repetição, não tem com os fazer análise de variância em delineamentos experimentais. Quantas repetições? No mínimo duas. Segundo Pimentel Gomes (2009, p.53), um experimento deve ter no mínimo 20 parcelas e 10 GL do erro. Portanto, se um experimento tiver apenas dois tratamentos, terá que ter no mínimo 10 repetições. Casualização: Proporcionar a todos os tratamentos a mesma chance de serem designados a qualquer uma das parcelas, evitando assim que qualquer tratamento seja sistematicamente favorecido ou desfavorecido por fatores externos. Sem casualização imagine: insetos-pragas em reboleira; incidência maior de luz em um dos tratamentos; enchercamento em parte da área experimental; etc. A Casualização faz com que: as variações que contribuem para o erro experimental sejam convertidas em variações aleatórias; permite obter estimativas válidas para o erro experimental; garante o uso de testes de significância e por tornar os erros independentes. Controle Local: A finalidade é dividir um ambiente heterogêneo em sub-ambientes homogêneos e tornar o delineamento experimental mais eficiente, pela redução do erro experimental. DIC não possui controle local. DBC e DQL possuem controle local. Exemplos de uso: a) Leitões com diferentes idades; b) Solos com texturas diferentes; c) Declividades diferentes do terreno; d) fertilidade diferente do terreno. As atividades do experimentador devem ser planejadas. Imagine a instalação de um experimento de mandioca e que no momento faltam algumas manivas para completar a área experimental. É apenas um dos problemas da falta de planejamento. Planejamento Experimental: a) Projeto de pesquisa – já foi a época em que o pesquisador procurava o experimentador ou analista estatístico para fazer as análises estatísticas. Ao se dialogar com o “dono dos dados” verificava-se que o mesmo não sabia qual delineamento tinha usado, o número de parcelas experimentais era pequeno demais, não houve controle de erro experimental de forma adequada, etc, inviabilizando muitas análises. Isto é um diagnóstico da falta de um projeto adequado. b) Delineamento experimental – o projeto deve constar qual o delineamento experimental, se tem mais de um fator, qual o esquema, número de repetições, tamanho das parcelas, etc. c) Zelo pela redução do erro experimental – voltamos ao exemplo com a instalação de um experimento, a campo, com mandioca, para avaliar adubos. Deve-se usar as manivas: de mesmo cultivar; de mesmo tamanho, normalmente 20 cm; com mesmo número de gemas; mesma posição da planta (1/3 médio do ramo); 27 32 plantas/parcela. Se as padronizações não forem efetivadas incorremos em muita variabilidade dentro do mesmo tratamento, o que aumenta o erro experimental e, consequentemente a precisão do experimento medida pelo coeficiente de variação (CV). d) A unidade experimental – no exemplo da mandioca, a unidade experimental seria uma área uniforme, no espaçamento adequado, contend as 32 manivas. e) A variável em análise e a forma como será medida – no caso em questão poderia ser a prudutividade, em t/ha, estimada a partir das 32 plantas colhidas na parcela de área conhecida. A apresentação da produção por parcela não se mostra adequada na prática pois o leitor tem apenas uma noção de comparação entre os tratamentos sem no entando ter uma noção global da produtividade. É importante definer que seriam colhidas todas as raizes tuberosas de cada planta. f) Os tratamentos em comparação – no exemplo com o experimento de mandioca poderia ser quatro tipos de adubos nitrogenados: uréia; nitrato de amônio; nitocálcio; nitrato de potássio. g) Hipóteses – devem ser definidas quais as hipóteses de acordo com o problema de pesquisa e qual a metodologia para se verificar as hipótsese. h) Softwares e pacotes – citar e referenciar. i) Exigências para publicação – se a pesquisa foi realizada com a possibilidade de publicação, atentar para as exigências dos periódicos da área de publicação. Algumas destas exigências somente serão atendidas se constar no planejamento experimental, tais como número mínimo de parcelas, se terá testemunha e como que esta será avaliada em comparação com os demais tratamentos, etc. Embora os termos usados na experimentação sejam os mesmos em todas as oito grandes áreas da ciência, existem publicações específicas para determinadas áreas, sempre focando em detalhes específicos desta área. A título de exemplo, focamos aqui a experimentação na área de Cultura de Tecidos Vegetais. Detalhes mais específicos para a referida área podem ser vistos nas publicações de Mize & Chun (1988), Compton (1994), Compton & Mize (1999), Mize et al. (1999), Ibañez et al. (2003), Nas et al. (2005), Ledo & Faria (2006) e Werner et al. (2012). Exercícios II) Outros conhecimentos são importantes para o pesquisador na experimentação e não foram abordados nesta unidade e se solicita responder: IIa) O que é bordadura e efeito bordadura e como proceder para amenizar os possíveis problemas do efeito bordadura? IIb) Costumamos representar uma sigla para análise de variância, podendo ser anova ou anava, ambas corretas Explique porque esta diferença; IIc) Citar quais as quatro pressuposições da anova, explique cada uma delas por meio de um exemplo e cite testes estatísticos que podem ser usados para verificar se os dados experimentais atendem às pressuposições da anova; IId) Mencione pelo menos quatro softwares estatísticos, free, que podem ser usados para se realizar análise de experimentos na área agropecuária, citando suas referências; IIe) Para o exemplo da sua resposta no item c, fazer os testes estatísticos usando o software R, colocando os scripts (apenas para os discentes do PPGAT, não para a graduação em Agronomia). Referências: COMPTON, M. E. Statistical methods suitable for the analysis of plant tissue culture data. Plant Cell, Tissue and Organ Culture, v. 37, p. 217-242, 1994. COMPTON, M. E.; MIZE, C. Statistical consideration for in vitro research: I – Birth of on idea to collecting data. In Vitro Cellular & Developmental Biology- Plant. v. 35, n. 2, p. 115-121, 1999. IBAÑEZ, M. A.; MARTIN, C.; PÉREZ, C. Alternative statistical analyses for micropropagation: a pratical case of proliferation and rooting phases in Viburnum opulus. In Vitro Cellular & Developmental Biology-Plant. v. 39, n. 5, p. 429-436, 2003. 28 LEDO, C. A. da S.; FARIA, G. A. Experimentação em cultura de tecidos. In: SOUZA, A. da S.; JUNGHANS, T. G. Introdução à micropropagação de plantas. Cruz das Almas: Embrapa, 2006, p. 141-152. MIZE, C. W.; KOEHLER, K. J.; COMPTON, M. E. Statistical considerations for in vitro research: II: data to presentation. In Vitro Cellular & Developmental Biology-Plant. v. 35, n. 2, p. 122-126, 1999. MIZE, C. W.; CHUN, Y. M. Analyzing treatment means in plant tissue culture research. Plant Cell, Tissue and Organ Culture, v. 13, p. 201-217, 1988. NAS, M. N.; ESKRIDGE, K. M.; READ,P. E. Experimental designs suitable for testing many factors with limited number of explants in tissue culture. Plant Cell, Tissue and Organ Culture, v. 81, n.2, p. 213-220, 2005. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. WERNER, E.T.; MOTTA, L.B.; MARTINS, M.Q.; LIMA, A.B.P.; SCHMILDT, E.R. Coeficiente de variação como medida da precisão em experimentos de cultura de tecidos de plantas. Plant Cell Culture Micropropagation, Lavras, v.8, n.1-2, p.27-36, 2012. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. Unidade III - DELINEAMENTOS EXPERIMENTAIS Como apontado na Unidade II, delineamento experimental é o desenho experimental. Estudaremos alguns deles na sequência. IIIa - DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 1. INTRODUÇÃO É o tipo de delineamento mais simples que existe. A distribuição dos tratamentos às unidades experimentais é feita completamente ao acaso, ou seja, não é feita nenhuma restrição na casualização. É indicado quando as condições experimentais são homogêneas sendo mais recomendado em condições de laboratório, onde as condições ambientais podem ser melhor controladas. 2. VANTAGENS E DESVANTAGENS DO DIC VANTAGENS a) Pode-se usar qualquer número de tratamento e repetições, sendo que o número de repetição pode ser diferente de um tratamento para outro sem que isto venha dificultar a análise. b) Apresentar maior número de graus de liberdade associado ao resíduo em relação a outros delineamentos. DESVANTAGENS a) Exige homogeneidade total das condições experimentais. b) Pode conduzir a uma estimativa de variância residual bastante alta, uma vez que, não se utilizando o princípio do controle local, todas as variações exceto as devidas a tratamentos, são consideradas como variação do acaso. 3. MODELO ESTATÍSTICO Para o DIC tem-se o seguinte modelo: yi_j = m + t_i + e_ij yij = é o valor observado na repetição j do tratamento i; m = média geral; t_i = é o efeito do particular tratamento i; e_ij = é o erro aleatório. O erro se deve ao fato de não ser possível controlar todas as condições experimentais. O erro experimental se refere às variações observadas entre as repetições do mesmo tratamento. 4. ANÁLISE DE VARIÂNCIA É uma técnica de análise estatística que permite decompor a variação total, na variação devido a diferença entre os efeitos dos tratamentos e na variação devido ao acaso (também chamado de erro experimental ou resíduo). Para que esta técnica seja empregada é necessário que sejam satisfeitas as pressuposições consideradas básicas da análise de variância. O quadro de ANOVA para o DIC é: FV GL SQ QM Fcalculado Tratamento (I - 1) SQT SQT / (I − 1) QMT / QMResíduo Resíduo (I) (J - 1) SQResiduo SQResiduo / (I)(J − 1) - Total IJ − 1 SQtotal - - As hipóteses para o teste F da análise de variância para tratamentos de efeito fixo são as seguintes: H0: t1 = t2 = ... = ti ou H0: ti = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: Não H0 ou Ha: ti ≠ 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. O Ftabelado é obtido na tabela F, no nível de significância 5% ou 1% e com número de graus de liberdade de tratamentos e de resíduo. A regra decisória para o teste F é a seguinte: C A B B D C A B A C A D B B C B A B C A D B D A C D D 3 mudas/vaso Variedade B 3 mudas/vaso Variedade A Tabela 4. Peso seco da parte aérea (g/parcela) de 4 variedades de cana-de-açúcar (A, B, C e D) em um delineamento inteiramente casualizado com 6 repetições Rep. \ Trat. A B C D 1 113,83 174,94 213,39 166,76 2 133,89 168,76 86,69 131,17 3 96,15 156,35 157,17 127,88 4 101,22 144,89 177,44 121,94 5 95,16 181,57 180,37 90,94 6 127,34 178,79 192,70 144,61 Total 667.59 1005.30 1011.87 922.59 3607,35 (total geral) Média 111,27 167,55 168,65 153,77 150,31 (média geral) Correção (C) C = (3607,35)^2/24 = 542207,2509 n n = 4.6 = 24 SQT SQTotal Resolvendo: 6.1) Hipóteses: H0: tA = tB = tC = tD , ou ainda, H0: ti = 0, ou ainda H0: mA = mB = mC = mD Ha: ti ≠ 0 ou ainda Ha: não H0 6.2) Explicando o modelo estatístico: Yij = m + ti + eij Yij = é o valor observado na repetição j do tratamento i. Considere-se ao tratamento 2 (variedade B) e repetição 3. YB3 = 156,35 g/parcela m = média geral. No exemplo, 𝑚̂ = 150,31 g/parcela ti = é o efeito do particular tratamento i. t̂B = 𝑚̂B − 𝑚̂ t̂B = 167,55 − 150,31 = 17,24 g/parcela eij = é o erro aleatório. êB3 = 𝑌̂B3 − 𝑚̂B êB3 = 156,35 − 167,55 = −11,2 g/parcela Yij = m + ti + eij 156,35 = 150,31 + 17,24 − 11,2 156,35 g/parcela = 156,35 g/parcela 6.3) Fazendo a análise de variância SQtotal = ∑ y^2_ij - C SQtotal = 113,83^2 + ... + 144,61^2 - 542207,2509 SQtotal = 28333,0508 SQT = ∑ T^2_i / r_i - C SQT = (667,59^2 + ... + 922,59^2) / 6 - 542207,2509 SQT = 13019,0329 SQResíduo = SQtotal - SQT SQResíduo = 28333,0508 - 13019,0329 SQResíduo = 15314,0179 FV GL SQ QM F_calc F_tab(5%) F_tab(1%) Variedades 3 13019,0329 4339,6776 5,67** 3,10 4,94 Resíduo 20 15314,0179 765,7009 Total 23 28333,0508 Significativo a 1% de probabilidade. Forma algébrica de determinar a SQResíduo no DIC: SQDesviosA = (113,83 - 111,27)^2 + ... + (127,34 - 111,27)^2 SQDesviosA = 1365,612 SQDesviosB = (174,94 - 167,55)^2 + ... + (178,79 - 167,55)^2 SQDesviosB = 1017,89 SQDesviosC = (213,39 - 168,65)^2 + ... + (192,7 - 168,65)^2 SQDesviosC = 9788,758 SQDesviosD = (166,76 - 153,77)^2 + ... + (144,61 - 153,77)^2 SQDesviosD = 3141,758 SQResíduo = SQDesvioA + ... + SQDesvioD SQResíduo = 1365,612 + ... + 3141,758 = 15314,02 38 Resultado da análise programa Genes: Programa Genes Anova DIC Costa.doc ANÁLISE DE VARIÂNCIA DA VARIÁVEL => peso seco p. a. cana _______________________________________________________________ FV GL SQ QM F Prob. _______________________________________________________________ TRATAMENTOS 3 13019.032913 4339.677637 5.6676 .005608 RESÍDUO 20 15314.0179 765.700895 _______________________________________________________________ TOTAL 23 28333.0508 _______________________________________________________________ MÉDIA geral 150.30625 CV (%) 18.4099469763459 _______________________________________________________________ Quando o teste é feito usando algum software como o Genes, o programa libera o valor-p que é o nível de significância real do teste. No caso acima, em laranja, indica que a análise usando o F de Snedecor é significativo a 0,56%. O valor-p pode ser obtido também em softwares como o R (R CORE TEAM, 2021) com a expressão pf(valor de Fcac,GLnumerador,GLdenominador,lowere.tail=FALSE). Para o exemplo: Os valores de Ftabelado, são obtidos em tabelas como Tabela F 5% e Tabela F 1% ou no R (R CORE TEAM, 2021) com a expressão: 39 qf(1-α,GLnumerador,GLdenominador) Veja: Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GL erro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 ... 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 1539 6170 6181 6192 6201 6209 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 49.43 99.44 99.44 99.44 99.45 99.45 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 2.70 3.05 3.02 2.99 2.96 2.94 6.4) Concluindo Rejeita-se a hipótese H0. Os tratamentos diferem entre si. Há diferença estatística significativa entre as médias de peso seco da parte aérea das quatro variedades de cana-de-açúcar. Há, portanto, necessidade de aplicação de um teste de comparação de médias de tratamentos. 6.5) Análise complementar A determinação da precisão do experimento normalmente pode ser feita usando o coeficiente de variação (CV). Citamos a seguir a classificação dos valores de CV feita por Pimentel Gomes (2009, p.21) em ensaios agricolas de campo. Classificação | Faixa de CV | Precisão Baixos | < 10% | Alta Médios | 10 ≤ CV < 20% | Média Altos | 20 ≤ CV < 30% | Baixa Muito Altos | ≥ 30% | Muito Baixa Para amostras vimos que: CV = 100s / m^ Para o caso do DIC: CV = 100 √QMResíduo / m^ Para o exemplo em questão: CV = 100 √765,7009 (g/parcela)^2 / 150,31 g/parcela = 18,41% 41 Pela classificação citada, o experimento do exemplo com variedades de cana tem CV médio, caso fosse realizado a campo. Considerando que, mesmo no campo, os valores de CV são variáveis em função da cultura agrícola ou da espécie animal, e ainda em função da característica em análise, vários trabalhos científicos apontam classificação de CV para estas especificidades. Já se encontram para melão, arroz, mamoeiro, milho comum, milho pipoca, soja, feijão, cana, erva mate, citros, alface, suínos, bovinos, cultura de tecidos vegetais, entre outros. Para o caso específico de cana em campo, consultar Couto et al. (2013). Segundo estes autores, para produtividade de cana, o CV é considerado muito alto a partir de 21% e não 30% como Pimentel Gomes (2009) propôs. 7. Apresentação de Tabelas em produção científica Normalmente a análise de variância é realizada para mais de uma característica do experimento e sua apresentação final em artigos, dissertações, teses, TCCs acaba sendo simplificada, contendo, de preferência, todas as características na mesma Tabela. Normalmente se oculta a coluna de SQ e a de F. Veja o exemplo na Tabela 1 a partir do artigo publicado por Ferreira et al. (2011). 8. Acerca do tamanho da parcela No experimento em questão, o tamanho da parcela foi de três mudas por vaso, em que, no experimento obteve-se um CV = 18,41%. E se o tamanho da parcela fosse de uma muda apenas por vaso? E se fosse de duas mudas por vaso? E se fosse de cinco mudas por vaso? E se fosse de 10 mudas por vaso? Sabe-se que, quanto maior o tamanho da parcela, menor o CV experimental. Se fosse usada apenas uma muda por vaso, o valor do CV seria > 18, 41% e, se o tamanho da parcela fosse igual a cinco mudas por vaso, o tamanho da parcela seria < 18,41%. 42 Sabe-se também que não existe uma relação linear entre o valor do CV e o tamanho da parcela (STORCK et al., 2011; BARBIN, 2013; FERREIRA, 2018). Desta forma, o ideal é que se determine o tamanho ótimo da parcela (top). A título de exemplo, veja a relação entre os possíveis tamanhos de parcela e os valores de CV para um experimento com mudas de mamoeiro em tubetes, avaliando-se o número de folhas por plântula, assim como a determinação do top pelo método de Meier e Lessman (1971). Metodologia de Meier e Lessman (1971) é feita partir de ensaio em branco e pode estimar o top para qualquer modelo experimental. Artigos científicos usando a determinação do top pelo método de Meier e Lessman (1971) podem ser encontrados para diversas características em experimentos com mamoeiro (SCHMILDT et al., 2016; CELANTI et al., 2016), quiabeiro (SANTOS et al., 2019), entre outros. 9. EXERCÍCIOS Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. DIC-1) Considere os dados a seguir, a partir de um DIC, realizado a campo, na área agropecuária, com r = 4 para todos os tratamentos qualitativos, de efeito fixo: Y .1 = ,2 675 Y .2 = ,3 35 Y .3 = ,4 65 43 Y .4 = ,510 Y .5 = ,7 30 Y .6 = ,8 65 SQRes. = 2,3975 Pede-se: a) Quantas parcelas teve o experimento? b) Fazer a ANOVA e interpreta corretamente; c) Determinar o CV experimental e o classifique segundo critério de Pimentel Gomes (2009). DIC-2) Considere um experimento em DIC com seis tratamento para promover a germinação de sementes de mamoeiro da variedade THB, in vitro. Os resultados da avaliação, depois de 80 dias da instalação do experimento, são apresentados a seguir: Repetições Tratamentos A B C D E F ---------- Germinação de sementes (%) ----------- 1 30 60 100 40 85 5 2 25 40 80 50 95 10 3 20 35 90 45 90 0 4 30 30 95 50 80 5 A partir das informações fornecidas, responda: a) Quantas parcelas teve o experimento? b) Faça a anova do referido experimento, e interprete corretamente; c) Apresente o valor do CV experimental e o interprete segundo critérios de Pimentel Gomes (2009). IIIb - DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) 1. INTRODUÇÃO Este tipo de delineamento é utilizado quando as condições experimentais não são completamente homogêneas. Nessa situação devemos então subdividir a área ou o material experimental em blocos (ou grupos) de tal forma que exista homogeneidade dentro de cada um deles e que cada um contenha uma repetição de cada tratamento distribuída inteiramente ao acaso dentro de cada bloco. O DBC envolve os três princípios básicos da experimentação: repetição, casualização e controle local. Em experimentos instalados segundo o DBC, não importa que as condições experimentais de um bloco sejam diferentes das condições experimentais do outro bloco. O que importa é a homogeneidade dentro de cada bloco. 2. VANTAGENS E DESVANTAGENS DO DBC VANTAGENS a) Conduz a estimativas menos elevadas do erro experimental em relação ao DIC, pelo fato de conseguir isolar do resíduo as variações resultantes da heterogeneidade das condições experimentais. O mesmo não acontece com o DIC, pois todas as variações entre as parcelas, exceto as devidas a tratamentos, ficam embutidas no resíduo; b) Controla a heterogeneidade do material utilizado ou do ambiente onde o experimento será conduzido; c) Apresenta um número razoável de graus de liberdade para o resíduo. Ele se encontra numa faixa intermediária entre o DIC, que apresenta um maior grau de liberdade para o resíduo, e o DQL. Sabe-se quanto maior o GLResid., maior sensibilidade terá os testes de hipóteses para detectar diferenças significativas entre os tratamentos avaliados, além de proporcionar maior precisão experimental. Portanto o DBC apresenta esta vantagem em relação ao DQL. DESVANTAGENS a) Quando ocorrem parcelas perdidas, é necessário o uso de fórmulas e/ou métodos especiais para estima-las, a fim de poder efetuar a análise de variância. Quando o número de parcelas perdidas é muito alto, há necessidade de se repetir o experimento. Isso porém não acontece com o DIC, onde permite que os tratamentos tenham número de repetições diferentes e a análise de variância pode ser efetuada do mesmo modo sem parcela perdida. b) Há uma redução do GLResid. pela utilização do controle local. 3. MODELO ESTATÍSTICO O modelo estatístico para o DBC é: Y_{ij} = m + t_i + b_j + e_{ij} onde: Y_{ij} = é o valor observado para a variável em estudo referente ao tratamento i no bloco j; m = média geral; t_{i} = é o efeito do tratamento i; b_{j} = é o efeito do bloco j; e_{ij} = é o erro associado à observação Y_{ij}. 4. ANÁLISE DE VARIÂNCIA O quadro de ANOVA para o DBC é: \[ \begin{array}{cccc} \text{FV} & \text{GL} & \text{SQ} & \text{QM} & \text{F} \text{calculado} \\ \text{Tratamento} & (I - 1) & \text{SQT} & \frac{\text{SQT}}{(I - 1)} & \frac{\text{QMT}}{\text{QMResiduo}} \\ \text{Bloco} & (J - 1) & \text{SQBloco} & \frac{\text{SQBloco}}{(J - 1)} & \frac{\text{QMBloco}}{\text{QMResiduo}} \\ \text{Resíduo} & (I - 1)(J - 1) & \text{SQResiduo} & \frac{\text{SQResiduo}}{(I - 1)(J - 1)} & - \\ \text{Total} & IJ - 1 & \text{SQtotal} & - & - \\ \end{array} \] As hipóteses para o teste F da análise de variância para tratamentos de efeito fixo são as seguintes: H_{0}: t_{1} = t_{2} = ... = t_{i} ou H_{0}: t_{i} = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. H_{a}: Não H_{0} ou H_{a}: t_{i} \neq 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. 5. FÓRMULAS \text{SQtotal} = \sum Y_{ij}^{2} - C, \quad \text{onde} \quad C = \frac{\left(\sum Y_{ij}\right)^{2}}{IJ} \text{SQT} = \sum \frac{T_{i}^{2}}{J} - C SQBloco = \sum \frac{Bloco_{j}^{2}}{I} - C \text{SQRésiduos} = \text{SQtotal} - \text{SQT} - \text{SQBlocos} 6. Exemplo: Estudou-se a influência de 4 tipos de cobertura morta (1 = sorgo, 2 = crotalária, 3 = milheto e 4 = vegetação espontânea) no peso seco de brócolis, em kg/parcela. O experimento foi instalado em DBC com 5 repetições. Os dados de peso seco estão dispostos na tabela a seguir (COSTA, 2003, p.63). Fazer a ANOVA. \begin{array}{|c|c|c|c|c|} \hline \text{BL I} & 2 & 3 & 1 & 4 \\ \hline \text{BL II} & 4 & 1 & 2 & 3 \\ \hline \text{BL III} & 2 & 1 & 4 & 3 \\ \hline \text{BL IV} & 3 & 2 & 1 & 4 \\ \hline \text{BL V} & 1 & 4 & 3 & 2 \\ \hline \end{array} Tabela 6. Peso seco (kg/parcela) de brócolis em um experimento em blocos casualizados (DBC) com 5 repetições em que foi avaliada a influência de 4 tipos de cobertura morta (1: sorgo, 2: crotalária; 3: milheto e 4: vegetação espontânea) Rep. \ Trat. | 1 | 2 | 3 | 4 | Total 1 | 72,8 | 69,0 | 45,3 | 66,5 | 253,6 2 | 58,3 | 64,1 | 60,9 | 67,4 | 250,7 3 | 50,4 | 72,1 | 67,9 | 58,6 | 249,0 4 | 51,6 | 73,6 | 66,2 | 27,4 | 218,8 5 | 59,0 | 65,0 | 52,0 | 39,0 | 215,0 Total | 292,1 | 343,8 | 291,6 | 259,6 | 1187,1 Média | 58,4 | 68,8 | 58,3 | 51,9 | 59,4 Correção (C) C = (1187,1²)/20 = 70460,3205 n = 4.5 = 20 Resolvendo: 6.1) Hipóteses: H0: t1 = t2 = t3 = t4 , ou ainda, H0: ti = 0, H1: ti ≠ 0 H0: σ²blocos = 0, H1: σ²blocos ≠ 0 6.2) Fazendo a análise de variância SQtotal = Σ Y²ij - C SQtotal = 72,8² + ... + 39,0² - 70640,3205 SQtotal = 2748,7495 SQT = Σ T²i / J - C SQT = 292,1² + ... + 259,6² / 5 - 70460,3205 SQT = 728,3935 SQBloco = 253,6² + ... + 215,0² / 4 - 70460,3205 SQBloco = 355,4020 SQResíduo = SQTotal - SQT - SQBloco SQResíduo = 2748,7495 - 728,3935 - 355,4020 SQResíduo = 1664,9540 Tabela da Análise de Variância FV | GL | SQ | QM | Fcalculado | Ftab(5%) | Ftab(1%) Cobertura | 3 | 728.3935 | 242.7978 | 1,7499ns | 3,49 | 5,95 Bloco | 4 | 355,4020 | 88,8505 | 0,6404ns | 3,26 | 5,41 Resíduo | 12 | 1664,9540 | 138,7462 Total | 19 | 2748,7495 ns Não significativo a 5% de probabilidade. Resolvendo o mesmo exemplo pelo programa Genes (CRUZ, 2006) a partir da planilha DBC Costa.prn: FV | GL | SQ | QM | F | Probabilidade(%) BLOCOS | 4 | 355.402 | 88.8505 TRATAMENTOS | 3 | 728.3935 | 242.7978 | 1,7499 | 21.0107 ns RESÍDUO | 12 | 1664.954 | 138.7462 TOTAL | 19 | 2748.75 MÉDIA | 59.355 CV(%) | 19.8451 MÍNIMO | 27.4 MÁXIMO | 73.6 DMS-Tukey(1%) | 28.97265 DMS-Tukey(5%) | 22.12457 Quando o teste é feito usando algum software como o Genes, o programa libera o valor-p que é o nível de significância real do teste. No caso acima, em laranja, indica que a análise usando o F é significativo a 21,01%, o que não é aceito na área agronômica pois aceita-se 5% ou menos de erro do tipo I. 6.3) Concluindo Não se rejeita a hipóteses H0. Conclui-se que as quatro coberturas mortas tiveram influência semelhante no peso seco de brócolis. Neste caso, não há necessidade de aplicação de um teste de comparação múltipla. 6.4) O CV experimental Para o caso do DBC: CV = (100 * √QMResíduo) / m̂ Para o exemplo em questão: CV = (100 * √138,7462 (kg/parcela)²) / 59,36 kg/parcela = 19,85% 51 Tratamento Blocos Total Trat. 1 2 3 4 1 142,36 144,78 145,19 138,88 571,21 2 139,28 137,77 144,44 130,61 552,10 3 140,73 134,06 136,97 136,36 548,12 4 150,88 135,83 136,97 136,36 560,04 5 153,49 151,75 150,22 Total Bloco 726,74 715,32 692,43 Obs.: O experimento ficará com 19 parcelas para análise, mas teve 20 parcelas na implantação. De acordo com Pimentel-Gomes (2009, p. 53), em experimentação agrícola ou zootécnica, deve-se ter no mínimo 20 parcelas e 10 graus de liberdade para o resíduo. Arquivo Excel®: DBC parcela perdida.prn Resultado da análise programa Genes: Programa Genes Anova DBC parcela perdida.doc Análise de variância 1 1 142.36 1 2 144.78 1 3 145.19 1 4 138.88 2 1 139.28 2 2 137.77 2 3 144.44 2 4 130.61 3 1 140.73 3 2 134.06 3 3 136.97 3 4 136.36 4 1 150.88 4 2 135.83 4 3 136.97 4 4 136.36 5 1 153.49 5 2 -9 5 3 151.75 5 4 150.22 _____________________________________________________________________________________________ FV GL SQ QM F Prob. _____________________________________________________________________________________________ Blocos Ajustado 3 131.922225 43.974075 Genótipos Ajustado 4 417.66657 104.416643 6.4689 .006269 Resíduo 11 177.5554 16.1414 ____________________________________________________________________________________________ Total 18 772.7476 ____________________________________________________________________________________________ Média 141.417368 CV(%) 2.840978 Mínimo 130.61 Máximo 153.49 DMS-Tukey(1%) 11.992644 DMS-Tukey(5%) 9.180299 ___________________________________________________________________________________________ Código para valores perdidos 52 8. Exercícios: Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. DBC-1) A seguir são apresentados resultados de um experimento em que se desejou verificar a eficiência de quatro tratamentos de poda na formação de brotos/planta podada de mamoeiro ‘Tainung 01’ aos dois anos de idade. Cada parcela era composta de cinco plantas. Tratamento Bloco Nº brotos/planta Tratamento Bloco Nº brotos/planta 1 1 0.8 3 1 11.6 1 2 0.2 3 2 9.6 1 3 1.2 3 3 12.4 1 4 1.0 3 4 12.2 1 5 0.8 3 5 10.8 2 1 3.0 4 1 17.8 2 2 2.2 4 2 17.2 2 3 3.2 4 3 18.6 2 4 3.6 4 4 18.8 2 5 3.2 4 5 17.0 Pede-se: a) Qual o número total de plantas usadas no experimento? b) Faça a ANOVA e interprete corretamente; c) Calcule o CV experimental e o interprete de acordo com Pimentel Gomes (2009). DBC-2) Foi realizada a análise de variância para dados cujas médias são apresentadas a seguir. Foram 3 repetições para cada tratamento qualitativo de efeito fixo. O valor do grau de liberdade de erro foi 10 e o quadrado médio do erro foi 4,08. a) Qual delineamento experimental foi usado? Demonstre pelos GL das fontes de variação. b) Quantas parcelas teve o experimento? y .1 = 95 5, y .2 = 87 8, y .3 = 86 9, y .4 = 26 3, y .5 = 108 2, c) Faça a ANOVA e interprete corretamente; d) Determine o CV experimental e o interprete segundo Pimentel Gomes (2009). 53 IIIc - DELINEAMENTO EM QUADRADO LATINO (DQL) 1 – INTRODUÇÃO Este delineamento é apropriado quando podemos reconhecer duas fontes de variação (dupla heterogeneidade) entre as unidades experimentais, antes da aplicação dos tratamentos. Cada uma dessas fontes de variação deve ter o mesmo número de níveis (linhas e colunas) que o número de tratamentos. É comum se designar a presença de dupla heterogeneidade por linha e por coluna. De fato, em experimentos a campo, geograficamente, a heterogeneidade de solo pode se dar em duas direções perpendiculares (linhas numa direção e colunas na direção perpendicular), como por exemplo nos casos de fertilidade de solo, como pode ser visto na ilustração seguinte. Podemos citar alguns exemplos de DQL em que a heterogeneidade é presente, geograficamente: 1) Exemplo de Pimentel Gomes (2009, p.96-99) - competição de cinco variedades de cana-de açúcar (A, B, C, D, E) para se avaliar a produtividade em kg/parcela; 2) Exemplo de Zimmermann (2014, p.98-100) - competição de oito genótipos de arroz para se avaliar a produtividade em kg/ha; 3) Exemplo de Ferreira (2018, p.178-181) - competição de cinco cultivares de feijão (A, B, C, D, E) para se avaliar a produtividade em kg/parcela; 4) Exemplo de Dias e Barros (2009, p.247-249) – produção de frutos de cacau obtidos de cinco cultivares; 5) Exemplo de Dias e Barros (2009, p.261) – competição de cultivares de café (A, B, C, D, E) para avaliar a produtividade em sacas beneficiadas por ha; 6) Exemplo segundo Storck et al. (2011, p.63-64) - avaliação de quatro cultivares de alho (A, B, C, D) em que o bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). Para o DQL não há requerimento para a existência física das linhas e colunas. Podemos citar como exemplos: 1) Exemplo de Storck et al. (2011) - Avaliar quatro adubos (A, B, C, D) na produção de Citrus sp, sendo que cada parcela é uma árvore e as fontes de variação são quatro idades das plantas (fator A 54 de heterogeneidade) e quatro tipos de poda (fator B de heteroneidade); 2) Exemplo citado pelo professor Alcinei Azevedo, contido em https://www.youtube.com/watch?v=ESYFFmfI92o&t=633s – avaliação da digestibilidade em bovinos submetidos aos tratamentos de aplicação de cinco formulações de silagens (A, B, C, D, E) em que as fontes de heterogeneidade são as cinco vacas e os cinco meses da avaliação (cada vaca é avaliada com uma formulação num determinado mês, visto que existem apenas cinco vacas par se realizar o experimento); 3) Exemplo contido no artigo de Gonçalves et al. (2015) – avaliada a ingestão de carboidratos totais em ovinos da raça Santa Inês diante dos tratamentos que eram os níveis de substituição do milho por silagem de amido de mandioca (0%, 25%, 50%, 75%, 100%) em que as fontes de heterogeneidade são os cinco ovinos e os cinco períodos de avaliação; 4) Num experimento estudou-se o efeito da época de castração no desenvolvimento e produção de suínos. Dispunha-se para esse estudo, de 5 matrizes da mesma raça, que foram submetidas à mesma alimentação e manejo durante o período de gestação. Os tratamentos foram: (A) Castração aos 56 dias de idade; (B) Castração aos 7 dias de idade; (C) Castração aos 36 dias de idade; (D) Inteiros; (E) Castração aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variação entre leitegadas (linhas) e a variação no peso inicial dos leitões (colunas), sendo a parcela experimental constituída de um leitão. Faixas de Peso Inicial Leitegadas 1 2 3 4 5 1 A C E D B 2 C E B A D 3 B D A E C 4 D A C B E 5 E B D C A Os experimentos em quadrado latino também levam em consideração os três princípios básicos da experimentação: repetição, casualização e controle local. Contudo, o controle local é mais eficiente que no delineamento em blocos casualizados, pois controla a heterogeneidade do ambiente ou do material experimental tanto na horizontal como na vertical, ou seja, os blocos são organizados de duas maneiras diferentes, uns constituindo as linhas, outros as colunas. Desta forma a estimativa do erro experimental é menor que no DBC. Como linhas e colunas são termos gerais referentes ao critério de classificação, elas podem ser tipos de tratamentos. Quando há interação entre dois ou todos os critérios de classificação, isto é, entre linhas, colunas e tratamentos, o F computado não segue a distribuição do F tabelado, invalidando o teste de significância. Em casos onde o pesquisador não está preparado para assumir a ausência de interação, o quadrado latino não deve ser usado. Neste caso, talvez seja preferível utilizar um esquema fatorial, pois somente se as interações entre os fatores em estudo fossem não significativos, seria válido a análise por quadrados latinos. 2 – CARACTERÍSTICAS DO DQL a) Este delineamento é recomendável quando as unidades experimentais puderem ser agrupadas de acordo com os níveis de duas fontes de variação. b) A característica principal deste delineamento é que um tratamento aparece uma vez, e só uma ao acaso, em cada linha e em cada coluna. Dentro das linhas e dentro das colunas deve-se ter a maior uniformidade possível. c) O número total de unidades experimentais necessárias para esse delineamento é igual a I2, sendo I o número de tratamentos. d) O número de tratamento é igual ao número de repetições, logo, este delineamento é menos flexível que blocos ao acaso. e) Em experimento de campo, ao contrário do que ocorre nos blocos ao acaso, onde os blocos não necessitam ser contíguos, os quadrados latinos perdem suas vantagens, se as parcelas não estiverem dispostas contiguamente no campo. 55 f) Uma vez que o número de tratamentos depende das linhas e das colunas, a flexibilidade do DQL fica muito restrita, não sendo recomendável para mais de 8 tratamentos, pois o número de repetições aumentaria exageradamente, resultando num experimento muito caro, além de perder sua eficiência em razão do aumento do erro experimental (a homogeneidade dentro das linhas e colunas diminui). Por outro lado, os quadrados latinos com 3x3 e 4x4 tem um número muito reduzido de parcelas, sendo necessário a utilização de vários quadrados latinos e realizar uma análise conjunta. O tamanho ideal oscila entre 5x5 a 8x8. g) O número mínimo de tratamentos é I=3, devido GL resíduo = (I-1) (I-2) h) Apresenta um número menor de graus de liberdade para o resíduo, pois se sabe que quanto maior o número de graus de liberdade para o resíduo, maior sensibilidade terá os testes de hipóteses para detectar diferenças significativas entre os tratamentos avaliados, além de proporcionar maior precisão experimental. 3 – INSTALAÇÃO DO EXPERIMENTO Para a disposição no campo do quadrado latino a ser efetivamente utilizado, inclusive com a determinação das posições dos tratamentos dentro de cada linha e de cada coluna, deve-se obedecer a certa sequência, tal como: a) Escolhe-se um quadrado latino tirado ao acaso de uma tabela de quadrados latinos, como por exemplo, para três tramanetos (A, B, C): Coluna Linha 1 2 3 1 A C B 2 B A C 3 C B A b) A partir disto, sorteia-se a ordem das colunas, obtendo-se um quadrado latino intermediário, com a permutação das colunas na sequência sorteada. Por exemplo, ordem sorteada: 3, 1, 2. Coluna Linha 3 1 2 1 B A C 2 C B A 3 A C B 56 c) Finalmente, sorteia-se a ordem das linhas, num processo análogo ao anterior. Por exemplo, ordem sorteada: 2, 3, 1. Coluna Linha 3 1 2 2 C B A 3 A C B 1 B A C d) Designar ao acaso as identificações (A, B, C) aos tratamentos. Se o quadrado latino fosse a partir de uma casualização sistemática, ficaria: a) Escolhe-se um quadrado latino a partir de uma sistematização: Coluna Linha 1 2 3 1 A B C 2 B C A 3 C A B b) A partir disto, sorteia-se a ordem das colunas, obtendo-se um quadrado latino intermediário, com a permutação das colunas na sequência sorteada. Por exemplo, ordem sorteada: 3, 1, 2. Coluna Linha 3 1 2 1 C A B 2 A B C 3 B C A c) Finalmente, sorteia-se a ordem das linhas, num processo análogo ao anterior. Por exemplo, ordem sorteada: 2, 3, 1. Coluna Linha 3 1 2 2 A B C 3 B C A 1 C A B d) Designar ao acaso as identificações (A, B, C) aos tratamentos. 4 – MODELO ESTATÍSTICO Todo delineamento experimental possui um modelo estatístico. Este modelo visa identificar quais fatores estão influenciando a variável em estudo. No DQL o modelo estatístico é: Y(i)jk = m + ti + lj + ck + e(i)jk Onde: Y(i)jk é o valor observado na parcela que recebeu o tratamento i na linha j e na coluna k; m é a média geral do experimento; ti é o efeito do tratamento i; lj é o efeito da linha j; ck é o efeito da coluna k; e(i)jk é o efeito do erro experimental na parcela que recebeu o tratamento i na linha j e na coluna k. O quadro da anova para DQL com I tratamentos é: FV GL SQ QM Fcalculado Tratamentos (I - 1) SQT QMT (I - 1) QMResíduo QMTratamento Linhas (I – 1) SQBLinhas QMLinhas (I - 1) QMResíduo Colunas (I – 1) SQBColunas QMColunas (I - 1) QMResíduo Resíduo (I - 1) (I -2) SQResíduo - (I - 1) (I - 2) Total I² – 1 SQtotal - - Onde: SQtotal = ΣY(i)jk² - C, onde C = (ΣY(i)jk)² / I² SQT = ΣTi² / I - C SQLinhas = ΣLj² / I - C SQColunas = ΣCk² / I - C SQResíduos = SQtotal – SQT – SQLinhas - SQColunas Geralmente o que interessa na análise de um experimento, é avaliar se existe diferença entre os tratamentos, o que pode ser verificado por meio do teste F para tratamentos. O valor do F calculado no quadro de ANOVA deve ser comparado com o valor de F tabelado, o qual é obtido na tabela de distribuição da variável aleatória F, de acordo com o nível de significância do teste, dos graus de liberdade para tratamentos e dos graus de liberdade para o resíduo. As hipóteses para o teste F da análise de variância para tratamentos qualitativos de efeito fixo são as seguintes: H0: t1 = t2 = ... = ti ou H0: ti = 0, o que equivalem a dizer que todos os possíveis contrastes entre médias de tratamentos são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: Não H0 ou Ha: ti ≠ 0, o que equivale a dizer que existe pelo menos um contraste entre médias, estatisticamente diferente de zero, ao nível de probabilidade em que foi realizado o teste. O teste F para linhas ou colunas, ou seja, comparação entre linhas ou entre colunas, geralmente é desnecessária, pois ao instalar o experimento no DQL, o pesquisador utilizou as linhas e colunas para controlar uma causa de variação já conhecida. Nos casos em que a variação entre linha e/ou entre colunas é duvidosa, o pesquisador pode realizar o teste F para estas fontes de variação, para servir como orientação para a instalação de futuros experimentos. H0: σ²Linhas = 0, H1: σ²Linhas ≠ 0 H0: σ²Colunas = 0, H1: σ²Colunas ≠ 0 6 – UM EXEMPLO NUMÉRICO O objetivo de um experimento foi estudar o efeito da época de castração no desenvolvimento e produção de suínos. Dispunha-se para esse estudo, de 5 matrizes da mesma raça, que foram submetidas à mesma alimentação e manejo durante o período de gestação. Os tratamentos foram: (A) Castração aos 56 dias de idade; (B) Castração aos 7 dias de idade; (C) Castração aos 36 dias de idade; (D) Inteiros; (E) Castração aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variação entre leitegadas (linhas) e a variação no peso inicial dos leitões (colunas), sendo a parcela experimental constituída de um leitão. Os ganhos de pesos, em kg, após o período experimental (28 semanas), estão apresentados na tabela a seguir. Faixas de Peso Inicial Leitegadas 1 2 3 4 5 Totais 1 93,0(A) 115,4(C) 116,9(E) 110,2(D) 110,4(B) 545,9 2 110,6(C) 96,5(E) 108,9(B) 97,6(A) 112,0(D) 525,6 3 102,1(B) 108,6(D) 77,9(A) 102,0(E) 111,7(C) 502,3 4 115,4(D) 94,9(A) 114,0(C) 100,2(B) 118,5(E) 543,0 5 117,6(E) 114,1(B) 118,7(D) 108,8(C) 80,2(A) 539,4 Totais 538,7 529,5 536,4 518,8 532,8 2656,2 Pede-se: a. Faça a análise de variância. b. A realização da anova deste exemplo pode ser visto em https://www.youtube.com/watch?v=Ro8Yzy3XIQY. Assista ao vídeo e faça uma análise crítica sobre a representação das hipóteses lançadas e também sobre o resultado da anova. Solução: a. Faça a análise de variância. H0: mA = mB = mC = mD = mE Ha: Não H0 H0: σ²Leitegada = 0, H1: σ²Leitegada ≠ 0 H0: σ²Faixa de peso inicial = 0, H1: σ²Faixa de peso inicial ≠ 0 C = (ΣY(I)JK)² / I² C = (2656,2)² / 5² = 282215,94 ΣQtotal = ΣY²(ij)k − C SQtotal = 93,0² + ⋯ + 80,2² − 282215,94 = 2998,4824 SQLinhas = ΣL²J / I − C SQLinhas = 545,9² + ⋯ + 539,4² / 5 − 282215,94 = 257,824 SQColunas = ΣC²k / I − C SQColunas = 538,7² + ⋯ + 532,8² / 5 − 282215,94 = 48,496 SQT = ΣT²i / I − C Tratamentos Totais Médias A 443.6 88.72 B 535.7 107.14 C 560,5 112,10 D 564,9 112,98 E 551,5 110,30 63 A = 13,1 D = 13,2 B = 24,5 C = 11,3 E = 18,5 C = 10 E = 18,9 D = 14,2 B = 23,0 A = 15,0 E = 18 B = 23,2 C = 11,2 A = 14,1 D = 12,9 B = 22,3 A = 14,2 E = 18,6 D = 11,7 C = 9,9 D = 12,3 C = 8,00 = 12,7 E = 18,9 B = 21,2 Pede-se: a) Quantas parcelas teve o experimento? b) Fazer a anova e interpretar; c) Determinar o CV experimental e interpretá-lo segundo critério de Pimentel Gomes (2009). DQL-2) Os dados a seguir referem-se a rendimento, em t/ha, de 4 cultivares (A, B, C, D) de alho. O bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). L (i) C (j) iY .. 1 2 3 4 1 B = 11 D = 4 A = 7 C = 15 37 2 A = 12 C = 9 D = 7 B = 9 37 3 D = 8 B = 7 C = 12 A = 5 32 4 C = 17 A = 7 B = 12 D =10 46 . j. Y 48 27 38 39 ... Y = 152 Fonte: Storck et al. (2011, p.63-64). d) Quantas parcelas teve no experimento? e) Fazer a anova e interpretar; f) Determinar o CV experimental e interpretá-lo segundo critério de Pimentel Gomes (2009). Literatura Citada BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. CELANTI, H.F. et al. Optimal plot size in the evaluation of papaya scions: proposal and comparison of methods. Revista Ceres, v.63, n.4, p.469-476, 2016. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf 64 COUTO, M.F.; PETERNELLI, L.A.; BARBOSA, M.H.P. Classification of the coefficients of variation for sugarcane crops. Ciência Rural, v.43, p.957-961, 2013. CRUZ, C. D. Programa GENES: estatística experimental e matrizes. Viçosa (MG): Editora UFV, 2006. 285 p. CRUZ, C.D. GENES: a software package for analysis in experimental statistics and quantitative genetics. Acta Scientiarum. Agronomy. v. 35, n. 3, p. 271-276, 2013. CRUZ, C.D. Genes Software – extended and integrated with the R, Matlab and Selegen. Acta Scientiarum. Agronomy. v. 38, n. 4, p. 547-552, 2016. DIAS, L.A. dos S.; BARROS, W.S. Biometria experimental. Viçosa: Suprema, 2009. 408p. FERREIRA, J.P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v.42, n.2, p.563-566, 2011. FERREIRA, P.V. Estatística Experimental Aplicada às Ciências Agrárias. Viçosa: Editora UFV, 2018. 588p. GONÇALVES, J.A.G.; ZAMBOM, M.A.; FERNANDES, T.; TININI, R.C.R.; SCHIMIDT, E.L.; CASTAGNARA, D.D.; CANABARRO, L.O.; CRUZ, E.A. Silagem de resíduo da extração de amido da mandioca em substituição ao milho moído da ração para ovinos. Revista Brasileira de Saúde e Produção Animal, Salvador, v.16, n.4, p.839-849, 2015. https://www.scielo.br/pdf/rbspa/v16n4/1519-9940-rbspa-16-4-0839.pdf MEIER, V.D.; LESSMAN, K.J. Estimation of optimum field plot shape and size for testing yield in Crambe abyssinica Hochst. Crop Science, v.11, p.648-650, 1971. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SANTOS, K.T.H. et al. Comparison of methodologies to determine the optimum plot size for okra seedlings evaluation. Journal of Agricultural Science, v.11, n.5, p.388-394, 2019. SCHMILDT, E.R. et al. Optimum plot size and number of replications in papaya field experimente. Revista Brasileira de Fruticultura, v.38, n.2, p.e-373, 2016. STORCK, L.; LOPES, S.J.; GARCIA, D.C.; ESTEFANEL, V. Experimentação vegetal, 3. ed. Santa Maria: UFSM, 2011. 198 p. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. Nota 1: Na relação de livros de estatística experimental citadas nesta unidade, todos abordam DIC e DBC e, apenas os de Costa (2003) e de Banzatto e Kronka (2013) não abordam DQL. Nota 2: Como complemento desta unidade, em vídeo-aulas, recomendamos as postagens do professor da UFMG, Alcinei Mistico Azevedo: https://www.youtube.com/channel/UCDGyvLCJnv9RtTY1YMBMVNQ/videos Nota 3: Para referências em artigos científicos, das três referências de Cruz (2006, 2013, 2016) citadas anteriormente, dê preferência para as de 2013 e de 2016, apenas por questões do idioma. 74 Apresentaremos os resultados a seguir, usando-se letras minúsculas na frente da média, começando pela letra a. Faremos aqui a apresentação comparando com o teste de Tukey e de Duncan. Note que o teste de Tukey é o mais rigoroso. Tukey a 5% Duncan a 5% DMS-t a 5% Variedade Média Variedade Média Variedade Média C 168,65 a C 168,65 a C 168,65 a B 167,55 a B 167,55 a B 167,55 a D 153,77 ab D 153,77 a D 153,77 a A 111,27 b A 111,27 b A 111,27 b ∆ 44,74 Maior DMS 35,92 DMS-t 33,33 A resolução do exemplo com cana (um DIC), no Genes (CRUZ, 2006) pode ser feita em duas etapas (1 = anova; 2 = teste de média) a partir dos dados originais ou em uma etapa (teste de média) a partir dos resultados da anova. A resolução pelo R (R CORE TEAM, 2021) pode ser feita a partir de scripts desenvolvidos pelo usuário ou a partir de pacotes. Para a resolução de anova e teste de média num DIC (arquivo: cana.txt, semelhante ao arquivo DIC Costa.prn mostrado à página 37, acrescentando os títulos de cada coluna, sem separação para cada coluna), apresentamos a seguir o script a partir do pacote “ExpDes.pt” (FERREIRA et al., 2018): #Usando o ExpDes.pt #install.packages("ExpDes.pt") X<-read.table("e:\\dados\\cana.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dic(variedade, prod, quali = TRUE, mcomp = "lsd", nl = FALSE, hvar='bartlett', sigT = 0.05, sigF = 0.05) #variedade refere-se a tratamento (trat) na planilha “cana.txt”. Testes de agrupamento de médias sk para Scott-Knott e, ccboot para comparações múltiplas bootstrap, tukey para teste de Tukey, duncan para teste de Duncan, snk para teste Studente-Newman-Keuls, lsd para teste t-LSD, lsdb para o tsete LSD de Bonferroni, ccf para o tsete de Calinski e Corsten baseado na distribuição F. 75 Para resolução no R num DBC, apresentamos a seguir o script a partir do pacote “ExpDes.pt” (FERREIRA et al., 2018) para o caso do experimento de cana, supondo que o mesmo tenha sido em DBC (arquivo: cana dbc.txt): X<-read.table("e:\\dados\\cana dbc.txt",header=T) # Leitura dos dados X library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dbc(variedade, bloco, prod, quali = TRUE, mcomp = "lsd", nl=FALSE, hvar='oneillmathews', sigT = 0.05, sigF = 0.05) As planilhas cana.txt e cana dbc.txt são apresentados a seguir, com os respectivos resultados de análise no R (R CORE TEAM, 2021) com o pacote ExpDes.pt (FERREIRA et al., 2028) para o teste de média DMS-t: 76 A seguir colocaremos a planilha e a resolução do R de um DQL (arquivo: castra dql.txt) com aplicação do teste de média DMS-t. O modelo da planilha e o resultado da análise é apresentado a seguir: Conclusão: a castração não é eficiente no ganho de peso dos suínos e prejudicial quando feito aos 56 dias após nascimento. 77 O script para o DQL em questão é apresentado a seguir: X<-read.table("e:\\dados\\castra dql.txt",header=T) # Leitura dos dados X library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais dql(castra, linha, coluna, ganhopeso, quali = TRUE, mcomp = "lsd", sigT = 0.05, sigF = 0.05) Mostraremos a seguir, mais um exemplo da aplicação dos testes de média, comparando os três métodos apresentados, destacando o rigor e o poder de cada teste. Para tal, os dados foram retirados do artigo de Ferreira et al. (2011), já citado na unidade anterior. As análises foram feitas para a característica porcentagem de enraizamento, em nível de 5% de probabilidade de erro tipo I. Os subsídios para análise no software Genes (CRUZ, 2006) são apresentados a seguir, nas Tabelas 1 e 2 (GL resíduo, QM resíduo, Médias dos tratamentos). 78 Tukey a 5% Duncan a 5% DMS-t a 5% Clones Média Clones Média Clones Média T39 93,34 a T39 93,34 a T39 93,34 a T12 70,00 ab T12 70,00 b T12 70,00 b T10 53,33 bc T10 53,33 bc T10 53,33 bc T26 46,67 bc T26 46,67 bc T26 46,67 cd T14 46,67 bc T14 46,67 bc T14 46,67 cd T01 43,33 bc T01 43,33 c T01 43,33 cd T50 40,00 bc T50 40,00 c T50 40,00 cd T05 36,67 bc T05 36,67 c T05 36,67 cd T43 33,33 bc T43 33,33 c T43 33,33 cd T35 30,00 c T35 30,00 c T35 30,00 d ∆ 36,97 Maior DMS 25,09 DMS-t 21,77 + rigor - rigor - poder + poder 4. TESTE DE DUNNETT (1955) Este teste é utilizado quando as únicas comparações que interessam ao experimentador são aquelas feitas entre um determinado tratamento padrão, geralmente a testemunha, e cada um dos demais tratamentos, não havendo interesse na comparação dos demais tratamentos entre si. Assim, um experimento com Ι tratamentos (um dos quais a testemunha ou padrão, P) permite a aplicação do teste a Ι-1 comparações. 81 Para determinar o valor de td no R, podemos usar o pacote nCDunnett (BROCH; FERREIRA, 2014). Para o exemplo em questão, com três tratamentos a serem comparados com a testemunha, o valor de td fica: #install.packages(“nCDunnett”) library(nCDunnett) rho<-c(0.5,0.5,0.5) #0.5 sempre que o mesmo n° de repetições entre tratamentos e testemunha nu<-20 #GL de resíduo delta <- c(0,0,0) #valor zero indica não centralidade n<-32 # n° padrão do pacote p<-0.95 # nível de significância acumulado, independente se é uni ou bilateral qNCDun(p, nu, rho, delta, n, two.sided=FALSE) Tabela Dunnett a 5%, unilateral GLerro I Tratamentos de experimento em DIC, DBC ou DQL, comparados com a testemunha 2 3 4 5 6 7 8 9 10 15 20 10 2.1507 2.3376 2.4657 2.5624 2.6398 2.7042 2.7591 2.8070 2.8493 3.0082 3.1173 11 2.1273 2.3100 2.4350 2.5293 2.6048 2.6675 2.7211 2.7677 2.8089 2.9636 3.0696 ... 20 2.0274 2.1923 2.3044 2.3888 2.4560 2.5118 2.5594 2.6007 2.6372 2.7739 2.8674 ... 120 1.9340 2.0827 2.1831 2.2583 2.3180 2.3674 2.4095 2.4459 2.4781 2.5982 2.6801 Determinado no R, com seis casas decimais, usando o pacote nCDunnett (BROCH; FERREIRA, 2014). 83 Arquivo Excel®: médias dunnett cana1.prn A Tabela 2, a seguir, foi retirada do artigo publicado por Pereira et al. (2012) e ilustra a opção de apresentação dos resultados segundo Cruz (2006). 84 Como ficaria a apresentação, caso fossem duas testemunhas. Vejamos, a seguir, um exemplo hipotético. Como relatado anteriormente, este tipo de solução é apresentado no software Genes (CRUZ, 2006). Híbridos de mamoeiro Produtividade (t/ha) (1) Solo x Solo 1 112 Solo x Solo 2 100a Formosa x Formosa 1 200 Formosa x Formosa 2 173b Formosa x Formosa 3 163b ‘THB’ – Testemunha 1 86a ‘Tainung 01’ – Testemunha 2 160b DMS 15 (1) Médias, de cada híbrido de mamoeiro, seguidas da letra a, não diferem da testemunha THB, e seguidas da letra b não diferem da testemunha ‘Tainung 01’ a 5% de probabilidade pelo teste de Dunnett. 85 Resolvendo no R, pacote asbio (AHO, 2020): X<-read.table("e:\\dados\\cana.txt",header=T) # Leitura dos dados #install.packages(“asbio”) require(asbio) with(X, pairw.anova(y=prod, x=variedade, control="A", conf.level = 0.95, method="dunnett")) 5. TESTE t DE STUDENT para contrastes ortogonais O teste t é um teste clássico, que pode ser utilizado para comparar de maneira ótima, um par pré-escolhido entre duas médias ou mesmo para contrastes envolvendo mais de duas médias. Porém, como requisito para a sua aplicação conscienciosa, exige-se que: 1. As comparações a serem realizadas sejam escolhidas a “priori”, ou seja, antes de serem examinados os dados. 2. Pode-se fazer, no máximo, tantas comparações quanto são os graus de liberdade para tratamentos, e os contrastes devem ser ortogonais. Considerando um contraste de médias, em sua forma geral, 86 Ci = a1m1 + a2m2 + . . . + anmn 0) ( n i 1 ia = ∑ = Do qual obtemos a estimativa por meio do estimador. n n 2 2 1 1 a mˆ . . . a mˆ a mˆ Cˆ i + + + = Que pode ser testada pelo teste t, calculando-se a estatística t, dada por: ∑ − = − = J a QMR C C C V C C t i i i i i 2 ˆ ( ˆ ) ˆ ˆ que tem distribuição t de Student com n2 graus de liberdade, sendo n2 o número de graus de liberdade do resíduo e QMR o quadrado médio residual da análise de variância. Quando aplicamos o teste t a um contaste, C, geralmente o interesse é verificar se a sua estimativa, Cˆ , difere significativamente de zero, valor que t deveria assumir se a hipótese H0: C = 0 fosse verdadeira, comparado com a hipótese alternativa Ha:C ≠ 0. O valor da estatística t deve ser comparado (em valor absoluto) com os valores críticos de t, tabelados em função do no de graus de liberdade e do nível de significância do teste ou seja tTab = tα (n2). A regra de decisão, neste caso, é a seguinte: Se t ≥ tTab ⇒ Rejeita-se H0, caso contrário, ou seja, se t < tTab ⇒ não se rejeita H0. Exemplo: Num experimento foram avaliados quatro tratamentos de controle do mato numa determinada cultura e obtidas as seguintes produtividades, em t/ha (adaptado de STORCK et al., 2011, p. 68 – 72). O experimento foi DIC com seis repetições e o QMR = 90. Tratamento Produt. Média (t/ha) T1 = sem controle do mato 45 T2 = capina manual 55 T3 = herbicida A 70 T4 = herbicida B 60 Pede-se: a) Existe a possibilidade de fazer quantos contrastes? R.: 3 contrastes (veja a seguir). 87 T1 = Sem manejo (testemunha) 4 3 2 1 1 - 1 mˆ 1mˆ - 1 mˆ 3 ˆ Cˆ − = m T2 = Capina manual T3 = Herbicida A T4 = Herbicida B T1 = Sem manejo (testemunha) T2 = Capina manual 4 3 2 2 - 1 mˆ 1mˆ 2 mˆ Cˆ − = T3 = Herbicida A T4 = Herbicida B T1 = Sem manejo (testemunha) T2 = Capina manual T3 = Herbicida A 4 3 3 - 1 mˆ 1mˆ Cˆ = T4 = Herbicida B b) Verifique a ortogonalidade para os contrastes previamente estabelecidos. A ortogonalidade é verificada quando a covariância entre os contrastes é igual a zero. Verificação: i mˆ Coeficientes do contraste i Cˆ : Covariâncias 1ˆC 2ˆC 3ˆC a1i a2i a3i a1i a2i a1i a3i a2i a3i 1ˆm + 3 0 0 0 0 0 2ˆm - 1 + 2 0 - 2 0 0 3ˆm - 1 - 1 + 1 + 1 - 1 - 1 4ˆm - 1 - 1 - 1 + 1 + 1 + 1 ∑ 0 0 0 0 0 0 contrastes Contrastes ortogonais 88 R.: Os contrastes estabelecidos são ortogonais. Caso os contrastes não fossem ortogonais, a análise deveria ser por Scheffé. Desta forma, fica claro que, quando os grupos de médias são estabelecidos pré-instalação do experimento e com contrastes ortogonais, usa-se o teste de t. Quando os grupos de médias não exigem ortogonalidade mas são definidas pelo pesquisador, usa-se teste de Scheffé. No entanto, caso os grupos de médias sejam formadas a partir da análise, pode-se usar o teste de Scott-Knott. Este teste é um teste de agrupamento de médias e não deve ser chamado de teste de média. c) Analise os contrastes pelo teste t. Tratamento imˆ (t/ha) a1i a2i a3i a1i imˆ a2i imˆ a3i imˆ T1 = s/ controle 45 +3 0 0 135 0 0 T2 = cap. manual 55 -1 2 0 -55 110 0 T3 = herbicida A 70 -1 -1 +1 -70 -70 70 T4 = herbicida B 60 -1 -1 -1 -60 -60 -60 0 0 0 -50 -20 10 1ˆC 2ˆC 3ˆC 0 : 1 0 C = H 0 : C1 ≠ Ha 3,73 180 50 6 12 90 50 ˆ ( ˆ ) ˆ ˆ 2 1 1 = − − = − = = − = ∑ J a QMR C C V C C t i i i ( ) ,2086 %;20 . 5 gl = ttab Como o tcalc > ttab, rejeita-se H0. Há diferença na produtividade quando se controla ou não o mato. 93 Sugestão de apresentação em trabalhos científicos é apresentado na tabela seguinte. Sugerimos consultar o artigo de Andrade Junior et al. (2013) para verificar a apresentação quando envolver mais de uma característica. Contraste S© Decisão(1) 1ˆC = sem capina x capina -50 40,91 Ha 2ˆC = capina manual x capina química -20 28,93 H0 3ˆC = herbicida A x herbicida B 10 16,70 H0 (1) H«: C = 0 -5 H®: C ≠ 0 ao nível de 5% pelo teste de Scheffé. Verifica-se que, a capina permite aumento da produtividade e que, no entanto, não há diferença estatística comprovada na produtividade quando se faz capina manual ou química e nem entre os herbicidas usados. Notar que, pelo teste de t, houve diferença significativa na produtividade quanto à capina manual ou química, mostrando que o teste de Scheffé é mais rigoroso que o teste de t. COMPARAÇÃO ENTRE OS TESTES DE COMPARAÇÕES de Médias Sempre que os contrastes de interesse forem escolhidos antes da obtenção dos dados experimentais e forem ortogonais entre si, devemos utilizar o teste t de Student. O motivo dessa escolha é que os intervalos de confiança obtidos por este teste tem amplitude menor que os fornecidos pelos outros testes de comparação de médias. Se não forem ortogonais entre si, devemos escolher entre Dunnett, Tukey, Duncan, DMS-t ou Scheffé. Se interessarem apenas as comparações da testemunha com cada um dos outros tratamento, usar o teste de Dunnett. Se interessarem todas as possíveis comparações de médias, de tratamentos, duas a duas, usar DMS-t, Duncan ou Tukey (melhor). O método de scheffé deve ser adotado quando temos interesse em vários contrastes, com pelo menos um deles envolvendo mais de duas médias, não necessitando obedecer ortogonalidade entre os contrastes. Se os contrastes de interesse forem determinados após a realização do experimento (após a obtenção dos dados), o teste t de Student não deve ser utilizado, devendo-se usar Scheffé. 94 Resumindo: Ortogonais Previamente escolhidos - Teste t Sugeridos pelos dados - Não usar t Mais de duas médias - Scheffé Contrastes Comparar somente com a testemunha - Dunnett Não ortogonais Tukey Duas médias entre si Duncan DMS-t Exercícios teste de média Obs.: todos os exercícios devem ser feitos de forma manual e usando o Genes (CRUZ, 2006) ou o R (R CORE TEAM, 2021), ou ainda ambos. Usar nível de significância de 5 e 1% para a anova e α = 5% para o teste de média. Média-1) Considere um experimento em DIC com seis tratamento para promover a germinação de sementes de mamoeiro da variedade THB, in vitro. Os resultados da avaliação, depois de 80 dias da instalação do experimento, são apresentados a seguir: Repetições Tratamentos A B C D E F ---------- Germinação de sementes (%) ----------- 1 30 60 100 40 85 5 2 25 40 80 50 95 10 3 20 35 90 45 90 0 4 30 30 95 50 80 5 Pede-se: a) Faça a anova do referido experimento, apresente o valor do CV experimental e o interprete segundo critérios de Pimentel Gomes (2009); b) Teste de média usando os métodos de Tukey, Duncan e DMS-t, comparando os três métodos no que se refere ao rigor e poder; c) Fazer o teste de Dunnett de forma mais adequada, considerando o tratamento F como testemunha. 95 Média-2) O artigo publicado por Ribeiro et al. (1991) refere-se ao comportamento de cultivares de batata em Celina, distrito de Alegre-ES. O experimento foi em DBC com cinco repetições. Para a característica produção comercial, em t/ha, ao final do experimento, após análise de dados obteve-se: Diamant = 17,604; Frisa = 15,269; Monalisa = 13,413; Mondial = 21,120. Ainda, CV = 6,5%. Pede-se faça os testes de média de Tukey, Duncan e DMS-t. Média-3) A tabela a seguir refere-se à produção de borracha natural seca, obtida de 14 clones de seringueira, média de oito anos de sangria, delineado em DBC com quatro repetições, conforme Alem et al. (2015). De acordo com os resultados estatísticos apresentados na tabela, qual clone de seringueira é recomendado para o plantio? Para sua resposta consulte as considerações feitas por Storck et al. (2011) sobre comparações com testemunha. Clones Média de produção (kg/ha/ano) (1) % em relação à testemunha IAC 15 1868,59 bc 102,71 IAC 35 1728,01 cd 94,95 IAC 41 1855,44 bc 101,68 IAC 44 1691,48 cd 92,44 IAC 113 1497,58 de 82,82 IAC 111 2268,93 a 124,82 PB 28/59 1802,84 bc 100,20 PB 235 2045,39 ab 113,76 PB 252 1126,72 f 61,76 PB 260 1327,49 ef 72,77 PB 330 1177,69 ef 65,05 RRIM 606 758,63 g 41,69 RIM 725 1137,35 f 63,16 RRIM 600 - testemunha 1808,95 bc 100,00 (1) Médias com letras diferentes diferem estatisticamente entre si no teste de diferença mínima significativa pelo método de Tukey a 5% de probabilidade. Média-4) Os dados a seguir referem-se a rendimento, em t/ha, de quatro cultivares (A, B, C, D) de alho, num DQL. O bloqueamento das linhas foi em função da fertilidade entre as curvas de nível e o bloqueamento das colunas em função do tamanho dos bulbos de alho (florão, graúdo, médio, miúdo). L (i) C (j) iY .. 1 2 3 4 1 B = 11 D = 4 A = 7 C = 15 37 2 A = 12 C = 9 D = 7 B = 9 37 3 D = 8 B = 7 C = 12 A = 5 32 4 C = 17 A = 7 B = 12 D =10 46 . j. Y 48 27 38 39 ... Y = 152 Fonte: Storck et al. (2011). 96 a) Fazer a anova e interpretar; b) Fazer teste de média de Tukey, Duncan e DMS-t. Média-5) O artigo publicado por Nascimento et al. (2018) refere-se à avaliação de 16 características comerciais em 11 híbridos de mamoeiro em Linhares-ES, sendo 10 novos híbridos e a testemunha UENF/Caliman 01. A comparação entre as médias foi feita pelo teste de agrupamento de Scott-Knott. Faça, para a característica produtividade, as seguintes análises, e devida conclusão: a) Teste de média usando os métodos de Tukey, Duncan e DMS-t, comparando os três métodos no que se refere ao rigor e poder; b) Fazer o teste de Dunnett de forma adequada. Média-6) Um treinador de corrida rústica, objetivando melhorar o desempenho de seus atletas, testou três novas técnicas de preparação. Para tanto trabalhou com um grupo de 15 atletas completamente homogêneos para as características essenciais. A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso e de tal forma que o número de atletas avaliados em cada uma das técnicas fosse o mesmo. Os resultados foram: REPETIÇÃO TÉCNICAS DE PREPARAÇÃO 1 2 3 1 130 125 127 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Pede-se: a) Quais foram os Princípios Básicos da Experimentação utilizados pelo Pesquisador neste Experimento? b) Qual foi a unidade experimental nesta pesquisa? c) É possível concluir que existe diferença entre as técnicas de preparação?; d) Se existir diferença entre as técnicas, aplicar os testes de Tukey, de Duncan e DMS-t e informar qual a técnica recomendada para cada método usado. Média-7) Com o objetivo de diminuir o consumo dos motores à gasolina, uma determinada indústria petroquímica testou quatro novas formulações de gasolina, as quais se diferenciavam pelo tipo de aditivo que era acrescentado a mesma durante o seu processo de fabricação. Para efetuar o teste, a indústria petroquímica utilizou carros completamente homogêneos para todas as características. A designação das formulações aos carros foi feita inteiramente ao acaso. Após os testes de rodagem, os resultados obtidos foram (km/L): Aditivo a base de: Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 14,81 6,56 10,06 10,09 No de carros 10 10 10 10 97 SQresíduo = 6,0264 Com base nos resultados acima, pede-se: a) Existe diferença estatística significativa entre os quatro tipos de formulações? b) Estabeleça um contraste entre o grupo à base de formulação ácida contra o grupo à base de formulação básica. Obtenha a estimativa para este contraste (C1). c) Estabeleça um contraste para comparar aditivos de formulação ácida. Obtenha a estimativa deste contraste (C2). d) Estabeleça um contraste para comparar aditivos de formulação básica. Obtenha a estimativa deste contraste (C3). e) Faça teste t para os contrastes estabelecidos. f) Prove que SQT = SQC1 + SQC2 + SQC3. g) Faça o teste de Scheffé para os contrastes estabelecidos e compare com o teste de t realizado no item e. h) Faça uma análise crítica do experimento. Média-8) Em um experimento com cinco variedades de forrageiras (A,B,C,D,E), em DBC, as produções em ton/ha foram: Bloco Variedades A B C D E 1 12 21 22 15 12 2 13 27 29 11 18 3 11 26 24 10 18 4 9 25 25 12 17 Pede-se: a) O quadro da ANOVA b) Aplicar o teste de Tukey. Média-9) A seguir são apresentados resultados de um experimento em que se desejou verificar a eficiência de quatro tratamentos de poda na formação de brotos/planta podada de mamoeiro ‘Tainung 01’ aos dois anos de idade. Cada parcela era composta de cinco plantas. Tratamento Bloco Nº brotos/planta Tratamento Bloco Nº brotos/planta 1 1 0.8 3 1 11.6 1 2 0.2 3 2 9.6 1 3 1.2 3 3 12.4 1 4 1.0 3 4 12.2 1 5 0.8 3 5 10.8 2 1 3.0 4 1 17.8 2 2 2.2 4 2 17.2 2 3 3.2 4 3 18.6 2 4 3.6 4 4 18.8 98 2 5 3.2 4 5 17.0 A partir das informações fornecidas, faça ao teste de média de Tukey, Duncan e DMS-t, comparando os três métodos quanto ao poder e rigor e informar quais tratamentos seriam indicados. Média-10) Considere o experimento em DQL dado por Dias e Barros (2009, p.261) – competição de cultivares de café (A, B, C, D, E) para avaliar a produtividade em sacas beneficiadas por ha. A = 13,1 D = 13,2 B = 24,5 C = 11,3 E = 18,5 C = 10 E = 18,9 D = 14,2 B = 23,0 A = 15,0 E = 18 B = 23,2 C = 11,2 A = 14,1 D = 12,9 B = 22,3 A = 14,2 E = 18,6 D = 11,7 C = 9,9 D = 12,3 C = 8,00 A = 12,7 E = 18,9 B = 21,2 A partir das informações fornecidas, faça ao teste de média de Tukey, Duncan e DMS-t, comparando os três métodos quanto ao poder e rigor e informar quais tratamentos seriam indicados. Média-11) O resumo da análise de variância de um experimento instalado segundo o DBC, para verificar se existe diferença entre 5 tipos de levedura na produção de cerveja, é fornecido abaixo: FV GL SQ QM F Bloco 3 Tratamento Resíduo 4,895 Total Totais de tratamento: T1 = 12,0 T3 = 24,0 T5 = 45,6 T2 = 35,2 T4 = 22,0 Pede-se: a) Existe diferença entre os 5 tipos de levedura, na produção de cerveja? b) Aplicar o teste de Tukey. 99 Referências: AHO, Ken. (2020) Package ‘asbio’. https://cran.r-project.org/web/packages/asbio/asbio.pdf ANDRADE JUNIOR, S. et al. Comparison between grafting and cutting as vegetative propagation methods for conilon coffee plants. Acta Scientiarum. Agronomy, Maringá, v.35, n.4, p.461-469, 2013. ALEM, H.M. et al. Avaliação de clones de seringueira para a região noroeste do Estado de São Paulo. Revista Ceres, v.62, n.5, p.430-437, 2015. http://dx.doi.org/10.1590/0034-737X201562050002 BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. BROCH, S.C.; FERREIRA, D.F. Pacote nCDunnett do software R para o cálculo das distribuições do teste de Dunnett não-central. Sigmae, Alfenas, v.3, n.1, p. 7-14. 2014. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf CRUZ, C. D. Programa Genes: estatística experimental e matrizes, Viçosa: Editora UFV, 2006, 285 p. DIAS, L.A. dos S.; BARROS, W.S. Biometria experimental. Viçosa: Suprema, 2009. 408p. DUNCAN, David B. Multiple range and multiple F tests. Biometrics, v.11, p.1-42, 1955. DUNNETT, C.W. A multiple comparison procedure for comparing several treatments with a control. Journal of the American Statistical Association, New York, v.50, n.272, p.1096-1121, 1955. FERREIRA, J.P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v.42, n.2, p.563-566, 2011. FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. FERREIRA, P.V. Estatística Experimental Aplicada às Ciências Agrárias. Viçosa: Editora UFV, 2018. 588p. NASCIMENTO, A.L. et al. Obtaining and evaluating new hybrids of papaya tree. Journal of Agricultural Science, v.10, n.7, p.146-155, 2018. https://doi.org/10.5539/jas.v10n7p146 PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. PIMENTEL GOMES, F.; GARCIA, C. H. Estatística aplicada a experimentos agronômicos e florestais: exposição com exemplos e orientações para uso de aplicativos. Piracicaba: Fealq, 2002. 309p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. RESENDE, M. D. V. Genética biométrica e estatística no melhoramento de plantas perenes. Brasília: Embrapa Informação Tecnológica, 2002. 975 p. 100 RIBEIRO, L.G.; RODRIGUES, C.; SCHMILDT, E.R. Comportamento de cultivares de batata (Solanum tuberosum L.) na região serrana de Alegre-ES. Boletim Agronômico, v.3, n.1, p.5-11, 1991. SCHEFFÉ, Henry. The analysis of variance. New York: J. Wiley, 1959. 461p. STORCK, L.; GARCIA, D. C.; LOPES, S. J.; ESTEFANEL, V. Experimentação vegetal. 3.ed. Santa Maria: UFSM, 2011. 198 p. TUKEY, JOHN, W. Comparing individual means in the analysis of variance. Biometrics, v.5, p.99-114, 1949. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 101 Unidade V – Experimentos Fatoriais INTERAÇÃO ENTRE FATORES EXPERIMENTAIS (ESQUEMAS FATORIAIS, IMPLICAÇÕES E INTERPRETAÇÃO) 1 – INTRODUÇÃO Experimentos fatoriais são aqueles em que se estudam simultaneamente dois ou mais fatores, cada um deles com dois ou mais níveis. O fatorial é um tipo de esquema, ou seja, uma das maneiras de organizar os tratamentos e não um tipo de delineamento, que representa a maneira pela qual os tratamentos são distribuídos às unidades experimentais. Na verdade, os experimentos fatoriais são instalados segundo um tipo de delineamento experimental, como por exemplo, o DIC e o DBC. Os tratamentos são obtidos pelas combinações dos níveis dos fatores. Num experimento fatorial completo, cada nível de um fator combina com todos os níveis dos outros fatores. Os experimentos fatoriais são aplicáveis a todos os campos da ciência. Sua principal aplicação é quando se quer saber sobre o efeito de diversos fatores que influenciam na variável em estudo e o relacionamento entre eles. A simbologia comumente utilizada, para experimentos fatoriais é indicar os níveis dos fatores em teste. Por exemplo, um experimento fatorial 2x4x6. O produto 2x4x6 informa que no experimento foram testados simultaneamente 3 fatores. O primeiro possui 2 níveis, o segundo, 4 níveis e o terceiro, 6 níveis. Quando o número de níveis é igual para todos os fatores, pode-se utilizar a simbologia: nF, em que: F – no de fatores; n = no de níveis de cada fator. Por exemplo, experimento fatorial 43. A potência 43 informa que o experimento tem 3 fatores com 4 níveis cada um, totalizando 12 tratamentos. Nesta unidade estudaremos a anova e desdobramentos apenas experimentos com dois fatores, embora representaremos a distribuição de GL para três fatores. 2 – VANTAGENS E DESVANTAGENS DE UM EXPERIMENTO FATORIAL i) Vantagens a) Permite o estudo dos efeitos principais e o efeito da interação entre os fatores; b) O número de graus de liberdade associado ao resíduo é alto quando comparado com os experimentos simples dos mesmos fatores, o que contribui para diminuir a variação residual, aumentando a precisão do experimento. Veja: Um pesquisador necessita estudar, num trabalho de cultura de tecidos vegetais, a influência de sacarose e também de sais de MS na multiplicação in vitro de determinada espécie. É necessário estudar sais de MS completo e meia força e sacarose nos níveis 0; 10; 20; 30 e 40 g/L. Veja como ficariam os GL para os estudos isolados e no estudo fatorial, num DIC com cinco repetições. 104 A B 0 1 0 10 15 1 20 20 Interação negativa, pois 10 < 15 A B 0 1 0 10 15 1 20 25 Interação nula, pois 15 = 15 O efeito da interação pode ser mais facilmente compreendido por meio de gráficos: 1- Quando não há interação Quando não há interação a diferença entre os resultados dos níveis de um fator são iguais para todos os níveis do outro fator. 105 Quando não há interação, ocorre um paralelismo entre as retas. 2- Quando há interação Quando há interação as diferenças entre os níveis de um fator dependem dos níveis do outro fator. No caso a existe uma interação devida à diferença na grandeza da resposta. No caso b existe uma interação devida a diferença na direção da resposta. 5– ANÁLISE DE VARIÂNCIA A análise de variância de um experimento fatorial é feita desdobrando-se a soma de quadrados de tratamentos nas partes devido aos efeitos principais de cada fator e na parte devido à interação entre os fatores. As hipóteses estatísticas, para o teste F da análise de variância, devem ser lançadas para cada um dos efeitos principais e também para a interação. As hipóteses são do seguinte tipo, considerando um fatorial simples, com os fatores A e B: - EFEITO PRINCIPAL H0: mA1 = mA2 = ..... = mAi ou seja, todos os possíveis contrastes entre médias de níveis do fator, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0, ou seja, existe pelo menos um contraste entre médias de níveis do fator, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. Para o fator B, de forma semelhante. - INTERAÇÃO H0: Os fatores atuam independentemente. Ha: Os fatores não atuam independentemente. 108 6 – QUADRO AUXILIAR Pode-se montar um quadro auxiliar, denominado Quadro de Interação, composto pelos totais de tratamentos, cujos valores são obtidos pela soma de todas as repetições para o tratamento em questão. Este quadro facilita o cálculo das somas de quadrados da análise de variância. B1 B2 . . . Bj Totais de Ai A1 (AB)11 (AB)12 . . . (AB)1j A1 A2 (AB)11 (AB)22 . . . (AB)2j A2 : : : : : : AI (AB)I1 (AB)I2 . . . (AB)Ij AI Totais de Bj B1 B2 . . . Bj G Para os fatores A e B qualitativos, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Estuda-se um fator dentro dos níveis de outro fator por teste de média Compara médias de A e médias de B Compara médias de A Compara médias de B Termina análise (teste protegido) 109 Para o misto, fator A qualitativo e o fator B quantitativo, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Estuda-se as médias de A dentro dos níveis (doses) do fator B (opcional) e a regressão de B dentro dos níveis de A Compara médias de A e faz regressão Compara médias de A Faz-se regressão de B Termina análise (teste protegido) Para os dois fatores quantitativos, num DIC (para DBC, raciocínio idêntico): FV QM- Situações 1 2 3 4 5 6 7 8 Blocos A *ou** *ou** ns ns *ou** *ou** ns ns B *ou** ns *ou** ns *ou** ns *ou** ns A x B *ou** *ou** *ou** *ou** ns ns ns ns Superfície de resposta Regressão de A e regressão de B Regressão de A Faz-se regressão de B Termina análise (teste protegido) 110 Para os casos de se fazer a regressão, na mioria dad vezes se busca a máxima eficiência técinica, assunto a ser visto no capítulo sobre análise de regressão. 7 - EXEMPLOS 7.1) Caso em que a interação não dará significativa. Seja um experimento com dois fatores A (três cultivares de cana) e B (quatro sistemas de manejo), constituindo 12 tratamentos, dispostos no DIC com 3 repetições. Os totais de tratamentos, referindo-se médias de um corte de cana, em t/ha, constam da tabela a seguir, e SQTotal = 1498,67. Variedades Sistemas de manejo Totais 1 2 3 4 1 120 132 150 162 564 2 126 141 162 171 600 3 144 150 171 186 651 Totais 390 423 483 519 1815 HIPÓTESES: - EFEITO PRINCIPAL para Variedades H0: mA1 = mA2 = ..... = mAi ou seja, todos os possíveis contrastes entre médias de variedades, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0 ou seja, existe pelo menos um contrates entre médias de variedades, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. - EFEITO PRINCIPAL para Sistemas de manejo H0: mB1 = mB2 = ..... = mBk ou seja, todos os possíveis contrastes entre médias de sistemas de manejo, são estatisticamente nulos, ao nível de probabilidade em que foi executado o teste. Ha: não H0 ou seja, existe pelo menos um contrates entre médias de sistemas de manejo, que é estatisticamente diferente de zero, ao nível de probabilidade em que foi executado o teste. - INTERAÇÃO H0: Os fatores atuam independentemente. Ha: Os fatores não atuam independentemente. 114 Tratamentos Blocos Totais 1 2 3 P1D1 11,82 12,03 12,55 36,4 P1D2 12,34 14,08 12,13 38,55 P1D3 13,41 12,98 13,35 39,74 P2D1 6,97 10,26 9,02 26,25 P2D2 8,96 9,02 9,84 27,82 P2D3 8,48 9,66 8,5 26,64 P3D1 7,53 7,67 7,81 23,01 P3D2 6,71 7,87 9,49 24,07 P3D3 7,82 9,44 9,37 26,63 Totais 84,04 93,01 92,06 269,11 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\amendoim fatorial dbc.txt", header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais fat2.dbc(Peneira,Densidade,bloco,Produção,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("Peneira", "Densidade"), sigT = 0.05, sigF = 0.05) 115 7.3) Caso em que a interação dará significativa Vamos considerar os dados de um experimento, inteiramente casualizado, com quatro repetições, no esquema fatorial 3x2, para testar o efeito de 3 Recipientes (R1, R2, R3) para a produção de mudas e 2 espécies de eucaliptos (E1 e E2), quanto ao desenvolvimento das mudas (adaptado de BANZATTO; KRONKA, 2013, p.106-112). Os Recipientes e as Espécies estudados foram: R1 = saco plásticos pequenos R2 = saco plásticos grande R3 = Laminado E1 = Eucalyptus citriodora E2 = Eucalyptus grandis 116 Tratamentos Repetições 1 2 3 4 R1E1 26,2 26,0 25,0 25,4 R1E2 24,8 24,6 26,7 25,2 R2E1 25,7 26,3 25,1 26,4 R2E2 19,6 21,1 19,0 18,6 R3E1 22,8 19,4 18,8 19,2 R3E2 19,8 21,4 22,8 21,3 Solução: Recipiente Espécie Total de Recipientes E1 E2 R1 102,6 101,3 203,9 R2 103,5 78,3 181,8 R3 80,2 85,3 165,5 Total Espécies 286,3 264,9 551,2 120 Resolução no R: Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\eucalipto fatorial.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais fat2.dic(Recipiente,Espécie,Altura,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("Recipiente", "Espécie"), sigT = 0.05, sigF = 0.05) Parte dos resultados do R: 121 Exercícios FAT-1) Quais são os tratamentos no exemplo 7.1 da página 110 da apostila? FAT-2) Resolver o exemplo 7.2 da página 113 da apostila, de forma manual; FAT-3) Represente o quadro da anova (somente FV e GL) para o caso de um experimento em esquema fatorial em DBC com J = 3 repetições. Foram três leguminosas semeadas em três tipos de solo e sementes protegidas ou não com fungicida. FAT-4) Realize as análises necessárias e interprete o seguinte experimento, de acordo com o que se fornece na sequência. Trata-se de um experimento em esquema fatorial 2 x 3 retirado de Costa (2003, p.67-73). Foram avaliadas duas variedades de cana de açúcar e três tipos de inoculante, num DBC e os dados referem-se à produção em t/ha. Realize a análise manual e usando o software R (R CORE TEAM, 2021). 122 Literatura Citada BANZATTO, D. A.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 2013. 237p. COSTA, R. J. Técnicas Experimentais aplicadas às ciências agrárias. Seropédica: Embrapa, 2003, 102 p. (Documentos 163). https://ainfo.cnptia.embrapa.br/digital/bitstream/item/107882/1/DOC163.pdf FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. STORCK, L.; LOPES, S.J.; GARCIA, D.C.; ESTEFANEL, V. Experimentação vegetal, 3. ed. Santa Maria: UFSM, 2011. 198 p. 123 UNIDADE VI – EXPERIMENTO EM PARCELAS SUBDIVIDIDAS 1 – INTRODUÇÃO Nos experimentos com esquema em parcelas subdivididas (PSD) existem dois tipos de tratamentos em comparação: os principais e os secundários. É um tipo especial de experimento fatorial, em inglês denominado “Split plot”. Designam-se os tratamentos às parcelas sem qualquer restrição (DIC) ou no caso do DBC, organizam-se os blocos e sorteiam-se os tratamentos dentro de cada bloco. Para obter as subparcelas, subdivide-se cada parcela em tantas subparcelas quantos sejam os tratamentos secundários. As parcelas podem ser subdivididas no espaço e no tempo e são comuns na área agrícola. Exemplos: 1) Pesquisadores da UNEMAT tem trabalhado com melhoramento de estrelícia (Strelitzia reginae). A produção das flores pode ser feita sob telado e a pleno sol. Um dos trabalhos, em cuja equipe participa o professor Willian Krause (engenheiro agrônomo formado na Ufes), é avaliar os vários genótipos nos dois sistemas citados. Os experimentos são realizados em PSD em que os dois sistemas (1 = sob telado; 2 = a pleno sol) constituem-se nas parcelas e, os genótipos avaliados nestes dois sistemas constituem as subparcelas. Para este caso tem-se PSD no espaço. 2) No exemplo anterior, os pesquisadores podem ainda avaliar características fisiológicas ou produtivas ao longo do tempo, por exemplo, a cada dois meses. Neste caso tem-se uma sub-subparcela e esta é dividida no tempo, e o experimento é chamado de parcela sub-subdividida (PSSD). Note que as subparcelas foram subdivididas no tempo, também chamado de análise de medidas repetidas no tempo. 3) Comparar 3 variedades de uma hortaliça em 2 níveis de irrigação: - Os canteiros são as parcelas; - Os tratamentos principais são os níveis de irrigação (I1 e I2); - Os tratamentos secundários são as variedades (V1, V2 e V3). I2 I2 V1 V2 V3 V2 V1 V3 I2 I1 V2 V1 V3 V1 V3 V2 I1 I2 V2 V3 V1 V3 V1 V2 I1 I1 V1 V2 V3 V2 V3 V1 Esquema de um DIC com parcelas subdivididas. 124 Ou em DBC: I1 I2 Bloco I V2 V1 V3 V2 V1 V3 I2 I1 Bloco II V1 V3 V2 V2 V1 V3 I2 I1 Bloco III V3 V1 V2 V1 V2 V3 I1 I2 Bloco IV V1 V2 V3 V2 V3 V1 Esquema de um DBC com parcelas subdivididas. Importante: Às vezes o pesquisador pode optar por um experimento em parcelas subdivididas ou por um experimento fatorial. No exemplo em questão, se fosse experimento fatorial, os tratamentos seriam: I1V1; I1V2; I2V3; I2V1; I1V2 e I2V3, que poderia ser assim representado num DBC: Bloco I I2V2 I1V1 I2V3 I1V2 I2V1 I1V3 Bloco II I2V1 I2V3 I1V2 I2V2 I1V1 I1V3 Bloco III I1V3 I1V1 I2V2 I2V1 I1V2 I2V3 Bloco IV I1V1 I2V2 I1V3 I1V2 I2V3 I2V1 Esquema de um DBC com 2 fatores. Qual critério para optar por parcelas subdivididas ou por fatorial? Deve ser feito em parcelas subdivididas toda vez que: a) A parcela for “unidade física”, como vaso, animal, uma pessoa, que pode receber vários tratamentos secundários; 125 b) O tratamento principal exige “grandes parcelas”, como é o caso de irrigação; c) O pesquisador deseja comparar tratamentos secundários com maior precisão; d) Na prática fica complicado instalar um fatorial como no caso de experimento com irrigação; e) A possibilidade de efeito bordadura seja evidente, como nos casos de deriva de irrigação, sombreamento devido porte diferente de plantas de cultivares diferentes. 4) Experimento realizado pelo doutor Omar Schmildt na Uenf (SCHMILDT, 2010), como parte de seu doutoramento trabalhando com cultura de tecidos vegetais, sob orientação do professor Eliemar campostrini e coorientação do professor Edilson Romais Schmildt. O delineamento experimental foi inteiramente casualizado com quatro repetições, segundo um esquema de parcelas sub subdivididas, tendo nas parcelas dois tipos de luz (lâmpadas fluorescentes brancas e lâmpadas vermelhas tipo Growlux, ambas com 90 μmol m-2 s-1), nas subparcelas, dois tipos de sistemas de ventilação (fechado e ventilado) e nas subsubparcelas, quatro concentrações de sacarose (10; 20; 30 e 40 g L-1). 5) Considere o experimento realizado por Souza et al. (2005) no qual foi avaliada a produção de biogás. O experimento foi em PSSD 4x3x2 num DBC com 20 repetições. As parcelas foram constituídas por 4 tempos de retenção hidráulica (TRH = 10; 15; 25 35 dias), 3 temperaturas (T = 25; 35; 40 °C) e agitação (Ag = sem agitação; com agitação). Este é um bom exemplo para se verificar como fica o desdobramento da anova quando a interação tripla se apresenta estatisticamente significativa. 6) Experimento com nabo forrageiro, conduzido pelo Eng. Agrônomo Antonio Renan Berchol da Silva, dentro do projeto Biodiesel. Descrição: - Cultivares CATI AL 1000 e IPR 116; - Delineamento Experimental: Blocos casualizados com parcelas sub-subdivididas com quatro repetições; - Parcelas: manejo de irrigação (com e sem irrigação); - Sub-parcelas: espaçamento entre linhas (15, 30 e 45cm); - Subsub-parcelas: cultivares CATI AL-1000 e IPR-116. Obs: população fixa de 12 kg/ha de sementes. Avaliações após a instalação: Velocidade de emergência (até 50%); População inicial; Altura de plantas a cada semana até florescimento; Início do florescimento (“uniformidade”); Área foliar no florescimento pleno; Ocorrência de pragas e doenças. Avaliações de final de ciclo: População final; Massa da parte aérea; Altura de plantas; Número total de síliquoas; Número de síliquoas por planta; Número de síliquoas chochas; Comprimento de síliquoas; Número de ´grãos por síliquoas; Massa de grãos (“produtividade”); Massa de 1000 grãos e Teor de óleo dos grãos. Vide esquema dos tratamentos no experimento, apenas para enxergar onde estão as parcelas, subparcelas e subsubparcelas; Falta ainda aleatorizar. 126 Parcelas B3 B2 B4 B1 131 Solução: Trata-se de DIC num esquema em PSD, com J = 10 repetições Nas parcelas estão os Sistemas de Plantio (Sulcos simples; Sulcos duplos) Nas Subparcelas estão os Cortes (Cana-Planta; Cana-Soca) Sistema de plantio Corte Total de parcelas Sistema de plantio Corte Total de parcelas Cana- planta Cana- soca Cana- planta Cana- soca Sulcos simples 92,9 84,5 177,4 Sulcos simples 92,9 84,5 177,4 128,6 86,5 215,1 128,6 86,5 215,1 121,7 84,5 206,2 121,7 84,5 206,2 122,8 77,0 199,8 122,8 77,0 199,8 118,1 88,1 206,2 118,1 88,1 206,2 115,7 82,4 198,1 115,7 82,4 198,1 121,4 84,0 205,4 121,4 84,0 205,4 126,9 88,8 215,7 126,9 88,8 215,7 118,1 85,7 203,8 118,1 85,7 203,8 122,4 78,8 201,2 122,4 78,8 201,2 1188,6 840,3 2028,9 1188,6 840,3 2028,9 Sulcos simples 122,5 84,5 207,0 Sulcos simples 122,5 84,5 207,0 110,0 85,0 195,0 110,0 85,0 195,0 115,0 85,5 200,5 115,0 85,5 200,5 125,0 88,0 213,0 125,0 88,0 213,0 105,0 86,7 191,7 105,0 86,7 191,7 110,0 80,7 190,7 110,0 80,7 190,7 115,0 88,3 203,3 115,0 88,3 203,3 105,0 89,3 194,3 105,0 89,3 194,3 108,5 94,3 202,8 108,5 94,3 202,8 118,3 90,0 208,3 118,3 90,0 208,3 Total 1134,3 872,3 Total 1134,3 872,3 2006,6 ¸ = 2028,9 + 2006,6 = 4035,5 136 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\psd cana SP Corte.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais psub2.dic(SistemaPlantio,Corte,repet,Prod,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("SistemaPlantio", "Corte"), sigT = 0.05, sigF = 0.05) 143 qtukey(1-α,ntratamentos,glresíduo) qtukey(0.95,8,38) Caso 4: DMS×ÚÛÓÍÜÊÎÚÊ = 4,53M(2 − 1)38,3238 + 80,0635 2x4 = 17,43 Realização pelo R: 144 Script no R (R CORE TEAM, 2021), usando o pacote ExpDes.pt (FERREIRA et al., 2018): X<-read.table("e:\\dados\\adubo verde psd dbc.txt",header=T) # Leitura dos dados library(ExpDes.pt) attach(X) options(scipen = 30) #30 casas decimais psub2.dbc(AduboVerde,Ano,bloco,Prod,quali = c(TRUE,TRUE), mcomp = "tukey",fac.names = c("AduboVerde", "Ano"), sigT = 0.05, sigF = 0.05) 148 10 - EXERCÍCIOS PSD1) O experimento a seguir foi citado por Steel; Torrie; Dickey (1997, p. 405 - 414), no qual foram comparadas 4 variedades de aveia e 4 tipos de tratamentos de sementes. Utilizou-se o modelo em parcelas subdivididas. As 4 variedades constituíram as parcelas, dispostas no delineamento em blocos casualizados com 4 repetições e os 4 tipos de tratamentos de sementes constituíram as subparcelas. Os dados constam da tabela a seguir, e referem-se à produtividade de aveia, em bushels/acre: Var. Trat (sem.) Blocos Totais (A) (B) 1 2 3 4 A1 B1 42,9 41,6 28,9 30,8 144,2 B2 53,8 58,5 43,9 46,3 202,5 B3 49,5 53,8 40,7 39,4 183,4 B4 44,4 41,8 28,3 34,7 149,2 190,6 195,7 141,8 151,2 679,3 A2 B1 53,3 69,6 45,4 35,1 203,4 B2 57,6 69,6 42,4 51,9 221,5 B3 59,8 65,8 41,4 45,4 212,4 B4 64,1 57,4 44,1 51,6 217,2 234,8 262,4 173,3 184,0 854,5 A3 B1 62,3 58,5 44,6 50,3 215,7 B2 63,4 50,4 45,0 46,7 205,5 B3 64,5 46,1 62,6 50,3 223,5 B4 63,6 56,1 52,7 51,8 224,2 253,8 211,1 204,9 199,1 868,9 A4 B1 75,4 65,6 54,0 52,7 247,7 B2 70,3 67,3 57,6 58,5 253,7 B3 68,8 65,3 45,6 51,0 230,7 B4 71,6 69,4 56,6 47,4 245,0 286,1 267,6 213,8 209,6 977,1 Totais 965,3 936,8 733,8 743,9 3379,8 Pede-se para fazer, de forma manual e no R: a) Análise de variância; b) Aplicar teste de Tukey a 5% de acordo com resultado da análise de variância. 149 PSD2) Supor um experimento com três rações A, B e C em seis blocos casualizados, sendo cada parcela constituída de dois bovinos de corte. Em uma determinada fase do experimento, os bovinos dentro de cada parcela, passaram a receber, por sorteio, um dos dois tipos de suplementos minerais M e P, conforme esquema a seguir: Os ganhos individuais no final do experimento foram: Pede-se, faça-se as análises apropriadas (anova, teste Tukey, CV) para concluir a respeito do experimento. Fazer de forma manual e usando o R. A seguir são apresentados os resultados para conferência: 150 CV (parcela) = 7,59% CV (subparcela) = 7,03% 10 - LITERATURA CITADA: FERREIRA, E.B.; CAVALCANTI, P.P; NOGUEIRA, D.A. (2018) Package ‘ExpDes.pt’. PIMENTEL GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: USP/FEALQ, 2009. 451p. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SATTERTHWAITE, F.E. An approximate distribution of estimates of variance components. Biometrics Bulletin, Washington-DC, v.2, n.6, p.110-114, 1946. 151 SCHMILDT, O. Cultivo in vitro e estaquia dos mamoeiros Golden e Uenf/Caliman 01. 2010. 119f. Tese (Doutorado em Produção Vegetal), Universidade Estadual do Norte Fluminense Darcy Ribeiro, Campos dos Goytacazes, 2010. SOUZA, C.F. et al. potencial de dejetos de suínos como substrato na biodigestão anaeróbia sob efeito de diferentes temperaturas e tempos de retenção hidráulica. Revista Ceres, Viçosa, v.52, n.300, p.255-265, 2005. STEEL, R.G.D.; TORRIE, J.H.; DICKEY, D.A. Principles and procedures of statistics: a biometrical approach. 3 ed. New York: MacGraw-Hill Book Companies. 1997. 666p. ISBN: 0070610282. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. 2.ed. Brasília: Embrapa, 2014. 582p. 152 Unidade VI - REGRESSÃO E CORRELAÇÃO - ASSOCIAÇÃO DE RESPOSTAS QUANTITATIVAS 1. INTRODUÇÃO Variáveis quantitativas são aquelas variáveis que correspondem a números resultantes de contagens (discreta) ou de medidas (contínuas), ao contrário das variáveis qualitativas que correspondem a atributos, categorias (estas são nominais quando não são passíveis de ordenação, ou ordinal quando são passíveis de ordenação). Quando a associação entre variáveis quantitativas se manifesta sem que seja possível estabelecer efeito causativo de uma delas sobre a outra, denominamos a ligação entre elas de correlação. A variação de uma delas acompanha a da outra sem que se possa caracterizar uma dependência entre elas. Exemplos para correlação: a) Notas de alunos no secundário e no universitário. Note que são os mesmos alunos. Número Estudante Classificação Secundário (%) Universidade 1 Jim C. 80 1,0 2 Ed 82 1,0 3 Karen 84 2,1 4 Márcia 85 1,4 5 Peter 87 2,1 6 Bevely 88 1,7 7 Tom 88 2,0 8 Marc 89 3,5 9 Sid 90 3,1 10 Jim L. 91 2,4 11 Linda 91 2,7 12 Al 92 3,0 13 John 94 3,9 14 Susan 96 3,6 15 Ann Marie 98 4,0 Fonte: adaptado a partir de Stevenson (2001, p. 370). b) Porcentagem de enraizamento (ENR) e crescimento de ramos (CR) para 10 clones de mamoeiro ‘Tainung 01’ F2 cultivados in vitro (FERREIRA et al., 2011). 153 Clone Média ENR (%) CR (cm) T39 93,34 a 6,12 a T12 70,00 ab 4,17 b T10 53,33 ab 1,87 cd T26 46,67 b 2,50 c T14 46,67 b 0,97 cd T01 43,33 b 1,37 cd T50 40,00 b 0,60 d T05 36,67 b 1,60 cd T43 33,33 b 0,53 d T35 30,00 b 0,87 d DMS 44,94 1,56 Médias seguidas da mesma letra, na vertical, não diferem entre si pelo teste de Tukey a 1% de probabilidade. c) Altura na cernelha de um animal e o comprimento do pescoço do mesmo animal. Analisa-se dados para vários animais; A associação, entretanto, pode se manifestar por uma dependência clara de uma variável em relação à outra. Neste caso, quando a variação de uma variável ocasiona, pela própria ação, uma variação flagrante na outra variável, dizemos que a segunda depende da primeira. Aqui o efeito causativo da primeira, chamada de variável independente (X), atua sobre a variação da segunda, a variável dependente (Y). Para estes casos, trabalha-se com análises de regressão. Exemplos para regressão: a) Um experimento envolvendo 3 drogas (DA, DB e DC) foi conduzido para estudar cada efeito de droga no batimento cardíaco (bpm) dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos (T1 = 5; T2 = 10; T3 = 15; T4 = 20). Veja: 154 Os dados representam um experimento em DIC num esquema em parcelas subdivididas no tempo. As parcelas eram constituídas das drogas e as subparcelas eram os tempos para medir o batimento cardíaco. Os tratamentos drogas são qualitativos e os tratamentos tempo são quantitativos. Caso apenas a fonte de variação tempo dê significativa pelo teste F, procede-se a avaliação desta variável por análise de regressão, em que batimento cardíaco (Y) depende do tempo (X) de aplicação das drogas. Caso a interação dê significativa, há necessidade de se estudar o tempo dentro de cada droga. b) Índice de área foliar (IAF) e idade das plantas, em dias, em feijão ‘Jalo Precoce’ (ZIMMERMANN, 2004, p. 272): Idade (X) IAF (Y) 16 0,16115 23 0,38815 30 0,71196 36 1,16696 43 2,06033 57 2,20084 64 1,96282 71 1,87116 155 c) Número de brotações/explante e nível de floroglucinol durante multiplicação in vitro de internódios de laranja pêra (SCHMILDT et al., 2000). d) Porcentagem de brotações enraizadas e nível de floroglucinol durante enraizamento in vitro de ramos de laranja pêra (SCHMILDT et al., 2000). 2. CORRELAÇÃO A correlação entre duas variáveis poderá ser calculada quando se deseja saber se a variação de uma delas acompanha proporcional ou inversamente a variação da outra. O termo correlação significa associação entre duas variáveis aleatórias. Na análise de correlação, se procura determinar o grau de associação entre duas v. a. ou seja, se procura medir a covariabilidade entre elas. A correlação pode ser positiva, negativa ou aproximadamente nula e estará sempre dentro do intervalo –1 ≤ r ≤ 1. Outras características de r: 1) Um relacionamento positivo (r é +) entre duas variáveis indica que os valores altos (baixos) de uma das variáveis correspondem valores altos (baixos) da outra; 2) Um relacionamento negativo (r é -) entre duas variáveis indica que os valores altos (baixos) de uma das variáveis correspondem valores baixos (altos) da outra; 156 3) Um relacionamento zero (r≈0) indica que alguns valores altos estão em correspondência com valores baixos e outros estão em correspondência com valores altos; 4) O sinal de r é sempre o mesmo sinal de b1, o coeficiente angular de uma reta imaginária ajustada aos dados, que será visto em regressão. Vimos que o seu valor varia de –1,00 a +1,00. Pode-se classificar a correlação, conforme segue: Valor de r Interpretação - 1,00 Correlação negativa perfeita - 0,95 até < - 1,00 Correlação negativa forte - 0,50 até < - 0,95 Correlação negativa moderada - 0,10 até < - 0,50 Correlação negativa fraca > - 0,10 até < + 0,10 Ausência de Correlação + 0,10 até < + 0,50 Correlação positiva fraca + 0,50 até < + 0,95 Correlação positiva moderada + 0,95 até < + 1,00 Correlação positiva forte + 1,00 Correlação positiva perfeita Fonte: Adaptado de Levin (1987). Na prática é quase impossível encontrar correlação perfeita positiva, perfeita negativa ou correlação exatamente igual a zero. No entanto, para efeitos didáticos, apresentamos a seguir valores que nos levarão a encontrá-las, quando calculados pela correlação de Pearson. -1 0 +1 Perfeita Negativa Não Correlação Perfeita Positiva Xi Yi Xi Yi Xi Yi 1 7 1 2 1 3 2 6 2 4 2 4 3 5 3 3 3 5 4 4 4 4 4 6 5 3 5 2 5 7 157 Coeficiente r de Pearson (1894) Nome em homenagem ao matemático que a desenvolveu, Karl Pearson. Tanto as variáveis X quanto Y devem ser contínuas e apresentarem distribuição normal. Em correlações mede-se a associação entre duas variáveis, pela análise de suas medidas. Como não existe causa ou efeito, qualquer das duas variáveis pode ser designada de X. Uma vez que uma das variáveis se identifica como X, a outra passa a ser variável Y. Para cálculo de forma mais prática, a correlação de Pearson é dada por: Vˆ (X) Vˆ (Y) rX,Y Coˆ v (X,Y) = , onde: Obs.: Para correlação de Spearman, vide anexo T. 1 n n Y) X)( ( XY Coˆv(X,Y) − ∑ ∑ ∑ − = 1 n n Xi)2 ( X2i Vˆ (X) − ∑ − ∑ = , 1 n n Yi)2 ( Y2i Vˆ (Y) − ∑ − ∑ = Assim, ( ) ( ) − − ∑ ∑ ∑ − = ∑ ∑ ∑ ∑ n . n n Y) X)( ( XY 2 2 2 2 , Y Y X X r X Y , avaliado com n-2 graus de liberdade. ou ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = − − − = n 1 i n 1 i 2 i 2 i n 1 i 2 n i 1 i 2 i n 1 i n i 1 i i i i P Y ) ( Y n X ) ( X n Y ) X )( ( X Y n r 159 No R: X<-c(1, 2, 3, 4, 5) Y<-c(7, 6, 5, 4, 3) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação Para o exemplo da correlação perfeita positiva: Xi Yi Xi Yi Xi2 Yi2 1 3 3 1 9 2 4 8 4 16 3 5 15 9 25 4 6 24 16 36 5 7 35 25 49 Σ 15 25 85 55 135 160 ,100 50 50 50 (5 135) (25) 55) (15) (5 85) 15(25) (5 Y ) ( Y n X ) ( X n Y ) X )( ( X Y n r 2 2 n 1 i n 1 i 2 i 2 i n 1 i 2 n i 1 i 2 i n 1 i n i 1 i i i i = = − − − = − − − = ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = No R: X<-c(1, 2, 3, 4, 5) Y<-c(3, 4, 5, 6, 7) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação Para o exemplo da correlação igual a zero: Xi Yi Xi Yi Xi2 Yi2 1 2 3 1 9 2 4 8 4 16 3 3 15 9 25 4 4 24 16 36 5 2 35 25 49 Σ 15 25 85 55 135 161 No R: X<-c(1, 2, 3, 4, 5) Y<-c(2, 4, 3, 4, 2) correlação<-cor.test(X, Y, conf.level = 0.95, method="pearson") correlação No exemplo à p. 152, sobre notas de alunos no secundário e universitário, a r = 0,90. A solução é apresentada a seguir: Ho: ρ = 0 contra Ha: ρ ≠ 0 No R: Secundário<-c(80, 82, 84, 85, 87, 88, 88, 89, 90, 91, 91, 92, 94, 96, 98) Universitário<-c(1, 1, 2.1, 1.4, 2.1, 1.7, 2, 3.5, 3.1, 2.4, 2.7, 3, 3.9, 3.6, 4) 162 correlação<-cor.test(Secundário, Universitário, conf.level = 0.95, method="pearson") correlação O valor da correlação de Pearson entre duas variáveis torna-se insuficiente para tomada de decisões. Um valor de correlação associado a 10 pares de dados possui interpretação diferente de um valor de correlação associado a outro tamanho de amostra. Como a correlação é amostral, é preciso saber se a associação obtida na amostra entre X e Y existe de fato na população, e não resulta meramente de erro amostral. Para tal é necessário que o valor da correlação seja submetido a teste de significância. Teste de significância para o coeficiente de correlação de Pearson (1894) Usado para verificar se o valor do r obtido difere estatisticamente de zero, valor que deveria assumir, teoricamente, na ausência de correlação. Para fazer inferência estatística a respeito de ρ, partindo do coeficiente de correlação r da amostra, pressupomos que as variáveis X e Y apresentam uma distribuição normal bidimensional (bivariada). Para testar a hipótese de nulidade Ho: ρ = 0 contra Ha: ρ ≠ 0 utilizamos a estatística F, dada por: r 1 2) r (n F 2 2 − − = , com 1 e n-2 graus de liberdade Pode ser verificado que o valor do F obtido por essa fórmula, é igual ao valor de F da análise de variância de regressão. Portanto, testar Ho: ρ xy = 0 eqüivale a testar β1 = 0, ou seja, testar a significância de regressão linear simples. Podemos, também, testar Ho: ρ X,Y = 0 pelo teste t, onde: 163 Hipóteses H0: ρ = 0 2 1 2 r n r t − − = com n-2 graus de liberdade Ha: ρ ≠ 0 Pode-se notar que no caso de regressão linear simples, onde p = 1, t2 = F, o que pode ser visto para o exemplo das notas de secundário e universitário, onde r = 0,90 com n = 15: 55,42 ,0 90 1 90 (13) ,0 r 1 2) r (n F 2 2 2 2 = − = − − = ,7 44453 ,0 90 1 90 13 ,0 r 1 2 r n t 2 2 = − = − − = 55,42 ,7 44453 t 2 2 = = F ∴ Abaixo estão alguns diagramas de dispersão e seus respectivos coeficientes de correlação. A) r = -1 B) -1< r <0 C) r ≅ 0 D) 0 <r < 1 E) r = 1 Se X e Y forem correlacionados positiva e perfeitamente, r = 1, os pontos estarão alinhados em uma mesma direção ascendente (Fig. E). O mesmo acontece na Fig A, correlação negativa e r = -1, pontos em direção descendente. Se X e Y forem levemente correlacionados, por ex. r = 0,30, a dispersão dos pontos não é tão abrangente no quadrante nem tão estreita em torno de uma linha (Fig. D). Se duas variáveis X e Y não estão correlacionadas, r = 0, os valores de X variam independentemente de Y e vice-versa. Graficamente, se cada eixo representar uma variável, os pontos se encontrarão dispersos por todo o quadrante (Fig. C). Uma correlação alta e negativa (r = - 0,95) mostrará uma dispersão inversa entre X e Y, os maiores valores de X correspondendo aos menores de Y, concentrados em torno de uma diagonal fictícia (Fig. B). O valor de t calculado é comparado com o t tabelado, com graus de liberdade igual a n – 2. Vide parte da tabela de t, a seguir. A Tabela comleta é apresentada ao final da apostila. 164 Tabela – Valores críticos de t, bilateral, para nível de significância de 5% e 1% g.l. α = 0,05 α = 0,01 1 12,706 63,657 2 4,303 9,925 11 2,201 3,106 12 2,179 3,055 13 2,160 3,012 14 2,145 2,977 ... ... ... 28 2,048 2,763 29 2,045 2,756 30 2,042 2,750 40 2,021 2,704 60 2,000 2,660 120 1,980 2,617 ∞ 1,960 2,576 Para o exemplo das notas dos estudantes (p. 152), com 15 pares de dados e tendo as hipóteses H0: ρ = 0; Ha: ρ ≠ 0 : 7,444 (0,90) 1 2 ,90 15 0 1 2 2 2 = − − = − − = r n r t Considerando que t calculado é maior que t tabelado, rejeita-se a hipótese de nulidade (α < 0,01) e conclui-se que alunos que tiram as maiores notas no secundário também tiram as maiores notas no universitário. A tabela seguinte é outra maneira de apresentar a significância do valor da correlação. Observa-se que ao nível de significância de 1% com 15 pares de dados, a correlação só não será significativa se for menor que 0,641. 165 Tabela – Valores críticos de correlação de Pearson para nível de significância de 5% e 1%, baseado no teste t n α = 0,05 α = 0,01 4 0,950 0,999 5 0,878 0,959 6 0,811 0,917 7 0,754 0,875 8 0,707 0,834 9 0,666 0,798 10 0,632 0,765 11 0,602 0,735 12 0,576 0,708 13 0,553 0,684 14 0,532 0,661 15 0,514 0,641 16 0,497 0,623 17 0,482 0,606 18 0,468 0,590 19 0,456 0,575 20 0,444 0,561 25 0,396 0,505 30 0,361 0,463 35 0,335 0,430 40 0,312 0,402 45 0,294 0,378 50 0,279 0,361 60 0,254 0,330 70 0,236 0,305 80 0,220 0,286 90 0,207 0,269 100 0,196 0,256 H0: ρ = 0; Ha: ρ ≠ 0; n = nº de pares de dados. Como se chegou ao valor crítico para r** = 0,641 na Tabela de valores críticos? Veja: 167 A Equação simplificada para rS é dada por: ãä = 1 − 6 ∑ 02 å ¨á4 æ(æ2 − 1) rs = coeficiente de correlação de postos; d = diferença entre postos (relativa ao mesmo sujeito em ambas as variáveis); n = nº de pares de dados. Abordando exemplos para responder à pergunta anterior de quando usar a correlação de Spearman. 1) Quando os dados se referem a variável qualitativa ordinal Exemplos: a) Corrida em duas modalidades Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1,0 )1 5(5 6(22) 1 2 = − − − = 200 m 500 m João 3º 1º 2 4 Marcos 1º 3º -2 4 Pedro 4º 2º 2 4 Valdir 2º 5º -3 9 Paulo 5º 4º 1 1 ∑ 2 d 22 b) Corrida em duas modalidades/ correlação perfeita positiva Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1 1 0 )1 5(5 6(0) 1 2 = = − − = − 200 m 500 m João 3º 3º 0 0 Marcos 1º 1º 0 0 Pedro 4º 4º 0 0 Valdir 2º 2º 0 0 Paulo 5º 5º 0 0 ∑ 2 d 0 168 c) Corrida em duas modalidades/ correlação perfeita negativa. Corredor Posição d d2 )1 ( 6 1 2 1 2 − = − ∑ = n n d r n i s 1 1 2 )1 5(5 6(40) 1 2 = − = − − = − 200 m 500 m João 3º 3º 0 0 Marcos 1º 5º -4 16 Pedro 4º 2º 2 4 Valdir 2º 4º -2 4 Paulo 5º 1º 4 16 ∑ 2 d 40 2) Porque optei por usar, independente de pressuposições estatísticas Aqui, no entanto, convém lembrar que, se estão satisfeitas as exigências para uso da correlação de Pearson, esta é mais eficiente que a correlação de Spearman. Portanto, dá-se preferência ao uso da correlação de Pearson. A taxa de eficiência da correlação de Spearman é de 0,91 em relação à correlação de Pearson (ZAR, 2010, p.400; TRIOLA et al.,2018, p.563 e 595). Ex.: Notas de alunos em duas matérias, Biologia e Química Aluno João Maria José Pedro Alex Marta Erli Matéria Biologia 7,0 3,0 10,0 7,7 4,5 2,2 9,0 Química 8,0 4,0 9,5 8,2 5,2 5,7 9,2 R.: ,0 8929 sr = A correlação de Spearman é a correlação de Pearson aplicada aos postos. A equação apresentada anteriormente para a correlação de Spearman somente é utilizável quando não há empate nos postos. Veja que a utilização das duas equações nos permite chegar ao mesmo valor. Para ilustrar, tomemos o exemplo das notas de alunos em biologia e em química, como segue. 170 Conclusão: Alunos que tiram as melhores notas em Biologia, também tiram as melhores notas em química. Quando há empate em postos, como proceder? A solução é o uso do ponto médio entre os postos empatados. Neste caso, no entanto, terá que ser usada a equação de Pearson a partir dos postos. Vejamos um exemplo a seguir, das notas de cálculo e estatística dos mesmos alunos mostrados anteriormente. Aluno Nota Posto – cálculo (Xi) Posto – estatística (Yi) Postos Cálculo Estatística Xi2 Yi2 Xi Yi João 10,0 9,4 7 7 49 49 49 Maria 8,0 9,1 5 6 25 36 30 José 7,0 7,3 3,5 3 12,25 9 10,5 Pedro 7,0 7,5 3,5 4 12,25 16 14,0 Alex 5,0 4,0 1 1 1 1 1 Marta 6,0 6,4 2 2 4 4 4 Erli 8,5 9,0 6 5 36 25 30 Total 28 28 139,5 140 138,5 172 3) Quando pelo menos uma das duas variáveis não apresenta distribuição normal No genes, o exemplo da correlação entre ENR e CR de mamão, citado à página 153 desta apostila (FERREIRA et al., 2011): No R (R CORE TEAM, 2021), para o mesmo caso de ENR e CR, pela correlação de Spearman: ENR<-c(93.34, 70, 53.33, 46.67, 46.67, 43.33, 40, 36.67, 33.33, 30) CR<-c(6.12, 4.17, 1.87, 2.5, 0.97, 1.37, 0.6, 1.6, 0.53, 0.87) H0: ρS = 0; Ha: ρS ≠ 0 correlação<-cor.test(ENR, CR, method="spearman") correlação 173 Conclusão: Há correlação estatística significativa entre entre o crescimento e o enraizamento de ramos de mamoeiro. Exemplo retirado de Triola et al. (2018, p.598): H0: ρS = 0; Ha: ρS ≠ 0 Cigarretes<-c(60,10,4,15,10,1,20,8,7,10,10,20) Nicotina<-c(179,283,75.6,174,209,9.51,350,1.85,43.4,25.1,408,344) 174 correlação<-cor.test(Cigarretes, Nicotina, conf.level = 0.95, method="spearman") correlação Conclusão: Há correlação válida significativa a 5% de probabilidade pelo coeficiente de Spearman, mostrando que há correlação entre o número de cigarretes fumados e o nível de Nicotina no corpo humano. 4) Quando não há relação linear entre os dados e no entanto a relação é monotônica Vejamos um exemplo segundo Triola et al. (2018, p.595), referente ao crescimento de população de bactérias ao longo do tempo: H0: ρS = 0; Ha: ρS ≠ 0 Tempo<-c(6, 107, 109, 125, 126, 128, 133, 143, 177, 606) Tamanho<-c(2, 3, 4, 10, 16, 29, 35, 38, 41, 45) par(mar=c(6,6,4,2)) plot(Tamanho~Tempo, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 175 Verifica-se pelo gráfico que não há relação linear, no entanto há relação monotônica e pode-se aplicar a correlação de Spearman. Confira a seguir a partir do ranqueamento. Veja: 176 rankTempo<-c(1,2,3,4,5,6,7,8,9,10) rankTamanho<-c(1,2,3,4,5,6,7,8,9,10) par(mar=c(6,6,4,2)) plot(rankTamanho~rankTempo, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") correlação<-cor.test(Tempo, Tamanho, conf.level = 0.95, method="spearman") correlação Conclusão: Há correlação estatística significativa pelo teste de Spearman entre população de bactérias e o tempo. 178 Tabela 3 – Valores críticos para o coeficiente de correlação de Spearman (H0: ρ = 0; Ha: ρ ≠ 0) 179 Para o exemplo das notas em duas matérias, biologia e química, com n = 7 pares de dados e r calculado = 0,8929 (r tabelado = 0,786 a 5%), existe diferença estatística significativa entre as médias das notas em biologia e química. Relembrando que as hipóteses para teste de significância de r de Spearman são dadas por: Hipóteses H0: ρS = 0 Ha: ρS ≠ 0 Erros a se evitar na interpretação de correlação 1) Na relação a seguir não existe correlação linear de Pearson significativa e isto não quer dizer que não existe associação entre as variáveis. Percebe-se nitidamente que existe relação, apenas não é linear. Percebe-se também que há uma relação de dependência e nesse caso, o estudo é feito por regressão. Provavelmente a relação será bem ajustada por uma equação de regressão de segundo grau onde se determinaria o ponto de máxima eficiência técnica. 2) A significância estatística está em função do tamanho da amostra. Consideremos a correlação de Perason e a Tabela da página 162 (valores críticos para significância estatística pela correlação de Pearson), verifica-se que a 5% de probabilidade com uma amostra de tamanho 10 a correlação será significativa se ã ≥ 0,632. No entanto, se sua amostra tiver tamanho 100, para ser significativo, ã ≥ 0,196. Aqui temos um problema pois deu significativo a 5% mas se elevarmos ao quadrado, r2 = 0,0384, ou seja, a variável X estaria explicando a variável Y na RLS em apenas 3,84%. Desta forma, além de olhar a significância estatística, alguns autores consideram uma correlação ideal de ã ≥ 0,7, pois nesse caso o coeficiente de determinação daria em torno de 50% ou mais, o que seria uma explicação razoável. 180 3) Um terceiro erro comum e que deve ser evitado é que não existe relação causa-efeito na correlação. Veja um exemplo, muito apropriado, mostrado em vídeo (https://www.youtube.com/watch?v=x0Qi2EFAtL4) pelo professor Alcinei Mestico Azevedo e adaptado a seguir. Cidade Habitantes (N°) Policiais (N°) Furtos mensais (N°/mês) A 30000 350 30 B 65000 800 45 C 90000 1100 86 D 120000 1650 120 Um gráfico pode ser gerado para a relação entre policiais e furtos. Policiais<-c(350, 800, 1100, 1650) Furtos<-c(30, 45, 86, 120) plot(Policiais, Furtos, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 181 Se fizermos a correlação de Pearson, r = 0,9768. No entanto, está errado. Pense. O gráfico e a correlação mostram que ao aumentarmos o número de policiais por cidade, aumenta também o número de furtos, mas a causa do aumento não é o número de policiais. Existe uma outra variável que está acarretando este aumento e que não apareceu até agora. O aumento dos furtos está em função do número de habitantes por cidade, com r = 0,9730. Veja: Habitantes<-c(30000, 65000, 90000, 120000) Furtos<-c(30, 45, 86, 120) plot(Habitantes, Furtos, cex=2, lwd=2, cex.lab=1.5, cex.axis=1.5, col="blue") Como relatado, nem sempre que uma coisa que acontece ao mesmo tempo que outra forma uma relação de causa e consequência. É isso que nos ensina o estudo das chamadas correlações espúrias. Correlação espúria é o nome que se dá para a existência de relação estatística entre duas ou mais variáveis, mas sem significado teórico. O pesquisador precisa saber a natureza das variáveis em estudo para saber que tipo de correlação usar e como interpretar. Pode ser necessário estudar análise de trilha por exemplo. 182 Exercícios: 1- Calcular e analisar o coeficiente de correlação de Pearson da amostra abaixo, de forma manual e usando o R: X 0 2 4 6 8 r = 0,9608** Y 2 3 14 15 26 2- Interpretar as correlações de Pearson abaixo, considerando a análise de 10 plantas, colocando um ou dois asteriscos na frente do valor da correlação. Altura de Planta Nº de vagens Nº de sementes Rendimento Altura de Planta 1,00 0,30 -0,50 0,00 Nº de vagens 1,00 0,95 0,30 Nº de sementes 1,00 0,80 Rendimento 1,00 3 – Apresenta-se ao lado os dados de comprimento e largura das oito folhas de uma muda de eucalipto do clone CO1407. Faça a correlação adequada, de forma manual e usando o R. Comprimento Largura Comprimento<-c(3.5, 6.9, 7, 4.6, 7, 5.3, 6.5, 6) Largura<-c(0.7, 2.9, 2.3, 1.7, 2.5, 1.8, 2.5, 2.4) 3.5 0.7 6.9 2.9 7.0 2.3 4.6 1.7 7.0 2.5 5.3 1.8 6.5 2.5 6.0 2.4 4 – Faça buscas na literatura, encontre e apresente pelo menos uma análise na área agronômica que usou a correlação de Pearson. 5 – Faça buscas na literatura, encontre e apresente pelo menos uma análise na área agronômica que usou a correlação de Spearman. 6 – Consulte o artigo publicado por Nascimento et al. (2018) com mamoeiro e faça a análise de correlação apropriada (Pearson ou Spearman) entre as características altura de plantas (PH) e produtividade (PROD) das cultivares. Responda de forma prática se a produtividade em cultivares de mamoeiro está relacionada ao porte das plantas. 183 3. REGRESSÃO LINEAR SIMPLES (RLS) 3.1 - INTRODUÇÃO A análise de regressão consiste na realização de uma análise estatística com o objetivo de verificar a existência de uma relação funcional entre uma variável dependente com uma ou mais variáveis independentes. Em outras palavras, consiste na obtenção de uma equação que tenta explicar a variação da variável dependente pela variação dos níveis das variáveis independente. As variáveis independentes são classificadas como quantitativas, cujos níveis representam diferentes quantidades de um mesmo fator. 3.2 - ESCOLHA DO MODELO PARA EQUACIONAR O FENÔMENO EM ESTUDO Para tentar estabelecer uma equação que representa o fenômeno em estudo, pode-se plotar um diagrama de dispersão para verificar como se comporta os valores da variável dependente (Y) em função da variação da variável independente (X). Vejamos o exemplo citado por Zimmermann (2014), citado à página 154 desta apostila. Adaptamos usando apenas duas casas decimais. Idade<-c(16, 23, 30, 36, 43, 57, 64, 71) IAF<-c(0.16, 0.39, 0.71, 1.17, 2.06, 2.2, 1.96, 1.87) par(mar=c(6,6,4,2)) plot(IAF~Idade, cex=2, lwd=2, cex.lab=2, cex.axis=2, col="blue") 184 Pode-se observar, neste caso, que X explica grande parte da variação em Y, provavelmente por um modelo quadrático. A parte da variação de Y não explicado é atribuída ao acaso e constitui a variação residual. Isto acontece, devido ao fato do fenômeno em estudo, não ser um fenômeno matemático e sim um fenômeno que está sujeito a influências que acontecem ao acaso. Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos valores observados de Y em função da variação dos níveis da variável X. Vejamos outro exemplo, sobre mudas de eucalipto clone CO147. Considere as nove folhas de uma muda, conforme segue: Folha Comprimento x Largura = CL Área foliar Observada (AFO, em cm2) 1 1.74 1.92 2 2.24 1.90 3 5.04 3.96 4 15.93 11.77 5 19.5 13.89 6 23.45 16.76 7 15.6 11.15 8 19.17 14.06 9 17.75 13.70 CL<-c(1.74, 2.24, 5.04, 15.93, 19.5, 23.45, 15.6, 19.17, 17.75) AFO<-c(1.92, 1.9, 3.96, 11.77, 13.89, 16.76, 11.15, 14.06, 13.7) par(mfrow=c(1,1)) par(mar=c(6,6,4,2)) plot(AFO~CL, xlab="CL (cm²)",ylab="AFO (cm²)",cex=2, lwd=2, cex.lab=1.5, cex.axis=1.5, col="blue") Pelo diagrama de dispersão ao lado parece que ajusta bem uma regressão linear simples. 185 3.3 – MÉTODO PARA OBTER A EQUAÇÃO ESTIMADA NA RLS Os dados do diagrama de dispersão anterior, sobre AFO em função de CL, podem ser assim representados, após ajuste da equação adequada: CL<-c(1.74, 2.24, 5.04, 15.93, 19.5, 23.45, 15.6, 19.17, 17.75) AFO<-c(1.92, 1.9, 3.96, 11.77, 13.89, 16.76, 11.15, 14.06, 13.7) RLSCL<-lm(AFO~CL) summary(RLSCL) AFECL<-predict(RLSCL, data.frame(x=CL)) par(mfrow=c(1,1)) par(mar=c(6, 6, 4, 2)) plot(CL, AFO,type="n",xlab="CL (cm²)", ylab="AFO (cm²)", cex.axis="1", xlim=c(0,25),ylim=c(0,20), cex.axis="1.5", cex.lab="1.5") lines(CL[1:9], AFO[1:9], type="p", pch=19,cex=1.5, col="blue") lines(CL[1:9], AFECL[1:9], type="l", lwd=2, col="black") legend(-1.2,20,c("AFE = 0,5139 + 0,7016CL","R² = 0,9967"), col=c("black","black","black"), cex=1.5,title = "", inset = 0.00,bty="n") 186 Como visto, os pontos do diagrama de dispersão ficam um pouco distante da curva do modelo escolhido. Um dos métodos que se pode utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos das curvas do modelo, no todo, sejam as menores possíveis. Este método é denominado de Método dos Mínimos Quadrados (MMQ). Mais especificamente, na estimação dos parâmetros do modelo admitido, usaremos o método dos mínimos quadrados ordinários, que pressupõem: a) A relação entre X e Y é linear. b) Os valores de X são fixos. c) E(ei) = 0, ou seja, E(ε) = φ, onde φ representa um vetor de zeros. d) Os erros são homocedásticos, isto é, apresentam a mesma variância. e) Os erros são não-correlacionados entre si, isto é, E(ei.ej) = 0 para i ≠j. f) Os erros tem distribuição normal (necessários para os testes de hipóteses). 3.4 – MODELO LINEAR DE 1O GRAU O modelo estatístico para esta situação seria: Yi = β0 + β1Xi + ei , em que: Yi = valor observado para a variável dependente Y no nível i da variável independente X. β0 = Constante da regressão. Representa o intercepto da reta com o eixo dos y. β1 = Coeficiente de regressão. Representa a variação Y em função da variação de uma unidade da variável X. Xi = é o nível i da variável independente X (i = 1,2,...,n) ei = erro associado à distância entre o valor observado Yi e o correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X. Para se obter a equação estimada, vai se utilizar o MMQ, visando a minimização dos erros. Assim, ei = Yi – β0 - β1Xi elevando ambos os membros da equação ao quadrado ei2 = [Yi – β0 - β1Xi]2 aplicando somatório Σ ei2 = Σ[Yi – β0 - β1Xi]2 (I) Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação à variável de interesse e igualá-la a zero. Derivando então a expressão 1 em relação a β0 e β1 e igualando-as a zero, chegaremos as seguintes equações. 187 ∑ ∑ ∑ ∑ ∑ − − = n ) ( n ) )( ( 2 i 2 i i i i i 1 X X Y X Y X βˆ ou ∑ ∑ ∑ ∑ ∑ = = = = = − − = β n 1 i 2 n 1 i i 2 i n 1 i n 1 i i n 1 i i i i 1 ) X ( X n Y ) )( X ( Y X n ˆ b X Y ˆ 1 0 − = β Onde: n Y Y n i 1 ∑ i = = e n X X n i 1 i ∑ = = Uma vez obtida estas estimativas, podemos escrever a equação estimada: i i X Y 1 0 ˆ ˆ ˆ = β + β Exemplo:1: O modelo linear abaixo foi proposto para explicar a relação entre a quantidade de ração fornecida e produção de leite por cabras. Pede-se por meio dos dados, determinar a equação de regressão. Níveis de ração (g) (X) 50 75 100 125 150 Produção de leite (L/dia) (Y) 1,2 1,7 2,0 2,1 2,5 Solução: 188 i X iY XiYi i2 X 2 iY iYˆ ( ) 2 ˆ Yi −Y 50 1,2 60 2500 1,44 1,3 0,36 75 1,7 127,5 5625 2,89 1,6 0,09 100 2,0 200,0 10000 4,0 1,9 0,00 125 2,1 262,5 15625 4,41 2,2 0,09 150 2,5 375,0 22500 6,25 2,5 0,36 500 9,5 1025 56250 18,99 0,90 100 1,9 ( )( ) ,0 012 6250 75 5 250000 56250 5 5,9 500 1025 n ) ( n ) )( ( 2 i 2 i i i i i 1 X X Y X X Y βˆ = = − − = − − = ∑ ∑ ∑ ∑ ∑ ( ) 7,0 2,1 9,1 ,0 012 100 9,1 b X Y ˆ 1 0 = − = − = − = β A equação de regressão linear simples será: i i i 1 0 i ,0 012X 7,0 Yˆ ˆ X ˆ Yˆ + = ∴ = β + β Solução usando o R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 190 3.5 – ANÁLISE DE VARIÂNCIA DA REGRESSÃO LINEAR SIMPLES A equação estimada obtida, apenas estabelece uma relação entre a variável dependente e a variável independente, para representar o fenômeno em estudo. A simples obtenção, da equação estimada não responde se a variação da variável independente influencia significativamente na variação da variável dependente. Para verificar a resposta a esta pergunta, é necessário realizar um teste estatístico para as estimativas dos coeficientes da equação da regressão estimada. Um teste que pode ser realizado para verificar tal fato é o teste F da análise de variância. Portanto, é necessária uma análise de variância dos dados observados, em função do modelo proposto. O quadro para a análise de variância para a regressão é, considerando inexistência de informações sobre a anova do experimento: FV GL SQ QM F Regressão p SQRegr. QMRegr. QMRegr/QMDesvio Desvio n-p-1 SQDesvio QMDesvio - TOTAL n-1 SQTotal - - Onde: p = no de coeficientes da regressão (não inclui o β0) n = no de observações As fórmulas para a obtenção das somas de quadrados são: ( ) ∑ − ∑ = n Y Y SQtotal i i 2 2 ou ( ) Y 2 Y SQtotal i − =∑ ou ∑ = − = n i i nY Y SQT 1 2 2 191 ∑ ∑ ∑ ∑ ∑ − − = n ) ( n ) )( ( SQRegr. 2 i 2 i 2 i i i i X X Y X X Y ou ( )( ) − = ∑ ∑ ∑ ∑ i i i i Y Y X X Y b 1 1 SQRegr. ou ( ) 2 ˆ Re Y Y gr SQ i − =∑ ou ∑ ∑ = = − + = n i n i i i i nY X Y b Y b gr SQ 1 1 2 1 0 . Re ( ) 2 ˆ i i Y Y SQDesvio − =∑ ou SQDesvio = SQTotal - SQRegr. As hipóteses estatísticas para o teste F são as seguintes: Ho: β1 = 0, o que significa dizer que a variável independente não exerce influência na variável dependente, segundo o modelo proposto. Ha: β1 ≠ 0, o que significa dizer que a variável independente exerce influência na variável dependente, segundo o modelo proposto. O valor de F da análise de variância deve ser comparado com o valor de F tabelado, onde Ftab = F(α; p; n-p-1). A regra decisória para o teste F é: Se Fcalc ≥ Ftab. ⇒ Rejeita-se Ho e pode-se inferir que o modelo proposto é adequado para descrever o fenômeno em estudo. Se Fcalc < Ftab. ⇒ Não se Rejeita Ho e pode-se inferir que o modelo proposto não é adequado para descrever o fenômeno em estudo. As SQRegr., SQtotal e SQDesvio podem ser ilustradas na Figura a seguir, que representa hipoteticamente o gasto mensal de manutenção de um trator em função de seu tempo de uso: 192 Exemplo: Fazer a análise de variância da regressão do exemplo da produção de leite de cabras (página 187 da apostila): ( ) ( ) ,0 94 5 5,9 ,99 18 2 2 2 = − = − = ∑ ∑ n Y Y SQtotal i i ou ( ) ( ) ( ) ,0 94 9,1 5,2 ... 9,1 2,1 2 2 2 = − + + − = − =∑ Y Y SQtotal i Gasto de manutenção em função do tempo de uso 0 10 20 30 40 50 60 0 2 4 6 8 10 12 14 Tempo de uso (anos) Gasto mensal na manutenção (R$) ˆ )2 ( exp i i Y Y quadrados licada dos não Soma − i 1 0 i b X b Yˆ + = )2 ˆ ( exp Y Y quadrados licada dos Soma i − )2 ( Y Y total dos quadrados Soma i − Y 193 ( )( ) ,0 90 5 5,9 500 ,0 012 1025 SQRegr. 1 1 = − = − = ∑ ∑ ∑ x n Y X X Y b i i i ou ( ) ( ) ( ) ,0 90 9,1 5,2 ... 9,1 3,1 ˆ Re 2 2 2 = − + + − = − =∑ Y Y gr SQ i ( ) ( ) ( ) ,0 04 5,2 5,2 ... 3,1 2,1 ˆ 2 2 2 = − + + − = − =∑ i i Y Y SQDesvio ou SQDesvio = 0,94 – 0,90 = 0,04 FV GL SQ QM F Regr. 1 0,90 0,90 67,5** Desvio 3 0,04 0,0133 Total 4 0,94 ** Significativo a 1% pelo teste F, F(1%, 1, 3) = 34,12 Conclusão: a variável nível de ração exerce influência sobre a produção de leite em cabras. No Genes: Arquivo Excel®: regressao LS.prn 50 1.2 75 1.7 100 2 125 2.1 150 2.5 194 ========================================================== Programa GENES REGRESSÃO LINEAR SIMPLES Arquivo de dados D:\AAtuais\Est Exp Pós\Aulas\Unidade VI - Regressão e Correlação\regressao LS.prn Número de variáveis 2 Data 05-22-2010 ========================================================== REGRESSÃO LINEAR SIMPLES Variável independente : nivel racao Variável dependente : produção de leite __________________________________________________________________________________ FV GL SQ QM F Probabilidade(%) ____________________________________________________________________________________ REGRESSÃO 1 .9 .9 67.5 .377424 DESVIO 3 .04 .013333 TOTAL 4 .94 ____________________________________________________________________________________ ESTIMATIVAS E VARIÂNCIAS DOS COEFICIENTES DE REGRESSÃO ___________________________________________________________________________________ INTERCEPTO ß0 = .7 INCLINAÇÃO ß1 = .012 V(ß0) = .024 V(ß1) = .000002 t (Ho:ß1=0) = 8.215838 Probab(Ho:ß1=0) = .284314 % Cov(ß0,ß1) = ..000213 COEFICIENTE DE DETERMINAÇÃO (%) = 95.744681 ___________________________________________________________________________________ nivel racao (X) produção de leite (Y) produção de leite estimado ___________________________________________________________________________________ 50.0 1.2 1.3 75.0 1.7 1.6 100.0 2.0 1.9 125.0 2.1 2.2 150.0 2.5 2.5 ___________________________________________________________________________________ 195 Resolução no R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 196 O procedimento do R libera parte dos resultados da Anova, sendo que DP do desvio = 0,1155 e o valor de Fcal = 67,5. Desta forma podemos compor a Tabela da Anova da RLS do caso do leite de cabra. Veja: FV GL SQ QM F RLS 1 0,90 0,90 67,5** Desvio 3 0,04 0,01334 ** Significativo a 1% pelo teste F. 3.6 - COEFICIENTE DE DETERMINAÇÃO O coeficiente de determinação, representado por r2 na RLS, fornece uma informação auxiliar ao resultado da análise de variância da regressão, para verificar se o modelo proposto é adequado ou não para descrever o fenômeno. Também pode ser representado por R2. O r2 é obtido por: 197 SQtotal gr SQ Variação total licada Variação r . Re exp 2 = = O valor de r2 varia no intervalo de 0 a 1 e também pode ser representado em porcentagem. Valores próximos de 1 indicam que o modelo proposto é adequado para descrever o fenômeno. O r2 indica ainda, o quanto da SQTotal é explicada pela regressão, ou seja, o quanto da variação na variável dependente Y está sendo explicada pela variação independente X. Exemplo: Calcular o r2 do exemplo dado sobre produção de leite de cabras da página 187 da apostila: 95,74% ,0 9574 ,0 94 ,0 90 . Re 2 = = = = SQtotal gr SQ r O r2 ajustado (r2aj.) Para interpretar o coeficiente de determinação, alguns pesquisadores sugerem que seja calculado um r2 ajustado para refletir também o tamanho da amostra. É dado por: − − − − = 2 n 1 r ) n 1( 1 r 2 2 aj. Para o exemplo em questão, do leite de cabras, com n = 5: ,0 9432 2 5 1 ,0 9574 ) 5 1( 1 2 . = − − − − = ajr 198 3.7 – COEFICIENTE DE VARIAÇÃO NA RLS Um outro indicador da qualidade do ajustamento obtido é o coeficiente de variação, dado por: Y QMDesvio CV (%) = 100 O CV mede a dispersão relativa das observações. O resultado é tanto melhor quanto menor for o CV. Exemplo: Calcular o CV do exemplo dado, de leite de cabras: ,6 08% 9,1 ,0 01333 100 100 (%) = = = Y QMDesvio CV 3.8 – TESTE DE HIPÓTESE A RESPEITO DOS PARÂMETROS E RESPECTIVOS INTERVALOS DE CONFIANÇA Os dados amostrais usados para calcular uma reta de regressão podem ser encarados como um número relativamente pequeno de observações possíveis de pares de valores. Nesse sentido, a reta de regressão calculada pode ser encarada como uma estimativa da relação real, porém desconhecida, que existe entre as duas variáveis na população. Como dito anteriormente, 0ˆβ e 1ˆβ servem como estimativas dos dois parâmetros populacionais correspondentes, β0 e β1 e a equação i 1 0 i ˆ X ˆ Yˆ = β + β é uma reta estimada da relação populacional i i 1 0 i X Y + ε = β + β Vimos também que iε representa o erro aleatório em Y para a observação i ou a dispersão na população. A Figura a seguir ilustra a dispersão em uma população. 0 20 40 60 80 100 120 0 200 400 600 800 População de possíveis valores para equação de regressão 199 Por que existe dispersão? Porque há outras variáveis que influenciam os valores da variável dependente. A dispersão significa que as estatísticas amostrais tendem a diferir dos parâmetros efetivos da população. Assim, poderiam ser obtidas diversas equações de regressão diferentes a partir dessa população, conforme ilustra a Figura ao lado: A dispersão na população significa que, para qualquer valor de X, haverá muitos possíveis valores de Y. 200 A análise de regressão supõe que, para cada valor possível de X, há uma distribuição de valores de Y e que segue a lei normal. Considerando que há dispersão na população, pergunta-se: que precisão tem as estimativas da regressão? Sabe-se que quanto maior a dispersão, menor a precisão das estimativas. A quantidade de dispersão na população pode ser estimada com base na dispersão das observações amostrais em relação à reta de regressão calculada, mediante a fórmula: QMDesvio n SQDesvio n Y Y S n i i i = − = − − = ∑ = 2 2 ˆ ) ( 1 2 sendo S o desvio padrão ou erro-padrão da estimativa. Este desvio padrão possui n-2 no denominador, ao invés de n-1. Este n-2 é o número de graus de liberdade que é devido a dois parâmetros (β0 e β1) que se devem estimar para se calcular a SQDesvio. Para o exemplo da produção de leite de cabras (página 187 da apostila): ,0 11547 ,0 01333 = = = QMDesvio S Este valor (0,11547) é o desvio padrão de pontos em torno da reta de regressão. Este cálculo é útil para a determinação do ajustamento e do intervalo de confiança para o coeficiente angular. O ajustamento do coeficiente angular é feito pelo teste t. a) Teste t para o coeficiente angular O modelo de regressão linear simples é i i 1 0 i X Y + ε + β = β . Se X e Y estão linearmente relacionados, devemos ter β1 ≠ 0. O objetivo do teste t é ver se podemos usar os dados da amostra para concluir que β1 ≠ 0. Testaremos a hipótese sobre β1 como segue: H0: β1 = 0 Ha: β1 ≠ 0 Sendo H0 a hipótese de nulidade e Ha a hipótese alternativa. Lembramos que se β1 = 0, não há relacionamento válido estatisticamente entre as duas variáveis. 201 Para calcular t teremos: 1 ˆ 1 1 s ˆ t β = β − β sendo 1ˆsβ o erro padrão para o coeficiente angular 1ˆβ . Considerando a hipótese H0: β1 = 0, a equação acima se resume a: 1 ˆ 1 s ˆ t β = β sendo Sb1 o erro padrão, dado por: ∑ ∑ = = β − = n 1 i 2 n i 1 i 2 i ˆ / n X X s s 1 Para o exemplo base de produção de leite de cabras, erro padrão é: ,0 0014605 79,057 11547 ,0 (500) /5 56250 ,011547 s 2 ˆ 1 = = − β = e t: ,8 22 0,0014605 0,012 s ˆ t 1 ˆ 1 = = β = β Como mencionado anteriormente, no caso de regressão linear simples, onde p = 1, t2 = F da anova da regressão: 202 67,50 ,8 22 t 2 2 = = F ∴ 67,42 ,0 0426 ,2 8722 ,0 9574 1 9574(3) ,0 r 1 2) r (n F 2 2 = = − = − − = ,8 2111221 ,0 2063076 6947565 ,1 ,0 9574 1 9784681 3 ,0 r 1 2 r n t 2 = = − = − − = Na tabela de t bilateral com 3 graus de liberdade para o desvio e significância de 0,01, t tabelado é 5,841. Como t calculado é maior que t tabelado, rejeita-se H0 ao nível de 1% de significância e, portanto, concluímos que temos uma relação significante entre o nível de ração e a produção de leite. Veja o valor do erro padrão do coeficiente angular obtido pelo R: ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) modelo_linear=lm(leite~ração) summary(modelo_linear) 203 Resumindo os passos do teste t para uma relação entre duas variáveis: a1) Estabelecimento das hipóteses H0: β1 = 0 Ha: β1 ≠ 0 a2) Estatística do teste 1 ˆ 1 s ˆ t β = β a3) Regra de rejeição em um nível de significância α (normalmente 0,05 ou 0,01) Rejeita-se H0 se t < - tα ou se t > tα, onde tα é baseado em uma distribuição t bilateral com n-2 graus de liberdade. b) Intervalo de confiança para o coeficiente angular Podemos também obter intervalos de confiança para o parâmetro β1. [ ] ) .s(βˆ t βˆ β .s(βˆ ) t : βˆ IC(β ) 1 tab 1 1 1 tab 1 1 1 α + ≤ ≤ − − Exemplo: Fazer o teste de hipótese e Intervalo de Confiança para β1, com base no exemplo dado sobre alimentação de cabras. [ ,3182.0,0014605 ] ,0 012 β ,3182.0,0014605 : 0,012 IC(β ) 1 1 ,0 95 + ≤ ≤ − [ ,0 01664 ] β : 0,00735 IC(β ) 1 1 ,0 95 ≤ ≤ Isto significa que o verdadeiro valor do coeficiente angular populacional deva estar entre 0,00735 e 0,01664 com 95% de confiança. 204 c) Intervalo de confiança e intervalo de previsão na RLS Intervalo de confiança e intervalo de previsão no R Parte gráfica a partir de https://www.youtube.com/watch?v=SIxQ4haNiC8 ração<-c(50, 75, 100, 125, 150) leite<-c(1.2, 1.7, 2, 2.1, 2.5) dados<-data.frame(X=ração, Y=leite) #coloca na forma de banco de dados dados RLS<-lm(dados$Y~dados$X) summary(RLS) pred.int<-predict(RLS, interval="prediction") pred.int #libera os valores do intervalo de previsão mydata<-cbind(dados, pred.int) mydata require(ggplot2) p<-ggplot(mydata,aes(x=X, y=Y))+ geom_point()+ stat_smooth(method=lm)+ylab("Leite")+ xlab("Ração") p #até aqui com o IC p+geom_line(aes(y=lwr),color="red", linetype="dashed")+ geom_line(aes(y=upr),color="red", linetype="dashed") #adiciona o intervalo de previsão 208 EXERCÍCIOS ENVOLVENDO RLS 1) Obter a equação de regressão, o coeficiente de determinação e a análise de variância da regressão para o modelo ie 1Xi 0 Yi + + β = β X 2,0 4,0 6,0 8,0 10,0 12,0 Y 10,2 12,8 16,1 18,5 21,0 24,5 Resp. ,0 9972 r 1440,93 F ,1 407X ,7 33 Yˆ 2 ** RL i i = = + = 2) Dada à amostra abaixo, estimar: a) A equação da regressão; b) Anova da Regressão; c) Coeficiente de determinação; d) Coeficiente de variação; e) Testar as hipóteses: H0: β1 = 0 versus Ha: β1 ≠ 0 para α = 5% ; f) Estimar o intervalo de confiança para previsão quando X = 10, ao nível de confiança de 95%; X 0 2 4 6 8 Y 2 3 14 15 26 3) Para o seguinte conjunto de valores de X (variável independente) e Y (variável dependente), faça a análise de regressão segundo o modelo linear de 1º grau e obtenha a equação de regressão estimada e o coeficiente de determinação. X 2 4 6 8 10 12 14 16 18 20 Y 10,3 18,2 25,1 35,6 43,0 50,0 59,1 67,8 75,2 85,0 4) Anova Regressão sem repetição para enraizamento ramos mamão in vitro AIB (mg/L) % Enr. Yˆ ( ) Yi −Y 2 ( ) 2 ˆ Yi −Y ( ) 2 ˆ i i Y −Y Xi Yi 0,0 14 20.4 1866.24 1354.24 40.96 0,1 44 38.8 174.24 338.56 27.04 0,2 62 57.2 23.04 0.00 23.04 0,3 76 75.6 353.44 338.56 0.16 0,4 90 94.0 1075.84 1354.24 16.00 1,0 286 3492.80 3385.60 107.2 209 57 2. 5 Y = 286 = ( ) 8. 3492 1 2 = − = ∑ = n i i Y Y SQTotal ( ) 3385.60 ˆ . Re 2 1 = − = ∑ = Y Y g SQ i n i ( ) 107 2. ˆ 2 1 = − = ∑ = i i n i Y Y SQDesvio FV GL SQ QM F Regressão 1 3385.60 3385.60 94.75** Desvio 3 107.20 35.73 Total 4 3492.80 F significativo, ou seja, o enraizamento pode ser explicado pela equação linear ajustada. Pede-se: a) Determinar a equação de ajuste linear e explicar o significado dos coeficientes; b) Obter o coeficiente de determinação e interpretá-lo corretamente. c) O enraizamento previsto (pontual e o IC a 95%) para nível de 0,25 mg/L de AIB. d) Observa-se que o ponto de máximo enraizamento é obtido com maior nível de AIB. Qual sua sugestão para o próximo experimento deste trabalho? 4. POLINÔMIOS ORTOGONAIS 4.1 INTRODUÇÃO Polinômios ortogonais são usados quando se tem um conjunto de tratamentos quantitativos (ou os níveis do fator são quantitativos) e nos interessa saber a tendência da resposta. Esta tendência pode ser linear simples, quadrática, cúbica. Na análise de polinômios ortogonais, a SQT se decompõe em t – 1 soma de quadrados, cada um com um GL. Cada SQ representa um efeito: linear, quadrático, etc. A tendência para partição da SQT é igual a dos contrastes ortogonais. 4.2 REQUISITOS DA APLICAÇÃO DE POLINÔMIOS ORTOGONAIS, SEM COMPUTADOR a-) Tratamentos equidistantes; b-) Mesmo número de repetições por tratamento; c-) Cuidados com extrapolações; d-) Nem sempre é conveniente o uso do nível zero; e-) Utilização de coeficientes dos polinômios ortogonais, que são apresentados em tabelas. Atente que os coeficientes variam apenas em função do número de tratamentos. Veja a seguir coeficientes de polinômios ortogonais para fatores até seis tratamentos igualmente espaçados e com mesmo número de repetições. 210 4.3 ANOVA O quadro a seguir refere-se à análise de variância para o exemplo citado em Figura à página 155 (SCHMILDT et al., 2000). Observe-o bem. 211 Pode-se notar que os requisitos anteriores foram satisfeitos: a) Os níveis de floroglucinol foram equidistantes (0; 30; 60; 90; 120 mg/L – p. 155, na Figura); b) O número de repetições foi o mesmo para todos os tratamentos. Pelo quadro 2, observa-se que foi DIC e 5 repetições; c) Não se dispunha de trabalhos com Citrus usando floroglucinol, por isto os autores usaram os mesmos níveis usados em outros trabalhos com macieira; d) Achou-se conveniente usar o nível zero de floroglucinol por não se dispor de trabalhos anteriores que apontassem resposta para Citrus; e) Foi possível desmembrar a SQT em SQ para regressão até nível de quarto grau, que corresponde ao número de GL para tratamentos (níveis de floroglucinol). Convêm lembrar que para fenômenos biológicos se torna difícil explicá-los quando apresenta resposta além da quadrática (vide uma exceção, com acúmulo de amido em raízes tuberosas de mandioca, no artigo de Oliveira et al., Acta Scientiarum – Agronomy, v. 32, n. 1, p. 99-108, 2010. Desta forma, na prática, desdobra-se a SQT até a de terceiro grau e os demais graus de liberdade e SQ passam a ser computados para o desvio. No exemplo citado, os GL ficariam: FV GL Floroglucinol (4) Regressão Linear 1 Regressão Quadrática 1 Regressão Cúbica 1 Desvio 1 Resíduo 20 Desta forma, quando se montarem os experimentos deste tipo, usar no mínimo 5 níveis (I ≥ 5). E assim, os GL ficariam: FV GL Tratamentos (I - 1) Regressão Linear 1 Regressão Quadrática 1 Regressão Cúbica 1 Desvio I – 4 Resíduo GLE 212 Se não se considera GL para desvio, a curva ajustada será exatamente nos pontos obtidos e o R2 será 100%. Isto nunca deve ser feito. O grau de ajuste máximo será I - 2. Desta forma, se usarmos 3 níveis (I = 3), o nível máximo de ajuste será o linear. Veja ilustração a seguir: Correto Errado Note no quadro 2 (p.210) que o valor de F é obtido pela divisão do QMReg. Pelo QME e não pelo QMDesvio. A divisão pelo QMDesvio só é feita para dados sem repetição, como mencionado para RLSimples no item 3 desta unidade. A equação a ser ajustada, será a de maior grau significativo até o grau 3, mesmo que os anteriores sejam não significativos. Veja: y = 0.135x + 47.003 R² = 0.1377 y = -0.0175x2 + 2.4748x - 17.99 R² = 1 213 As SQ serão obtidas: K / J Cˆ K J Cˆ SQ 2 i 2 i Re g. = = Sendo: QRReg. Linear, quadrática ou cúbica; 2 i Cˆ a estimativa do contraste obtida; K é o = ∑ ia2 K , sendo ai os coeficientes para polinômios ortogonais, como citado à página 210; J o número de repetições. Assim: SQLinear SQQuadrática SQCúbica K J C SQ RLinear 2 1ˆ = K J Cˆ SQ 2 2 RQuadrátic a = K J Cˆ SQ 2 3 RCúbica = De acordo com o modelo completo, as hipóteses que podem ser testadas são: a) 0 : 1 0 β = H versus 0 : 1 1 β ≠ H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito linear de X sobre Y é significativo em nível α de erro. b) 0 : 2 0 = β H versus 0 : 2 1 ≠ β H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito quadrático de X sobre Y é significativo em nível α de erro. Em outras palavras, o 20 grau ajustou uma porção significativa de variação a mais que 10 grau. c) 0 : 3 0 β = H versus 0 : 3 1 β ≠ H , rejeita-se H0 se Fcal > Ftab e concluiu-se que o efeito cúbico de X sobre Y é significativo em nível α de erro. Em outras palavras, o 30 grau ajustou uma porção significativa de variação a mais daquela ajustada pelos 10 e 20 graus. Exemplo: Considere os dados a seguir e realize a ANOVA pelos polinômios ortogonais. Foi um DIC com 5 repetições e a SQE = 436,80 e Xi é kg/ha de NPK e Yi é dado em t/ha: i i X i Y 1 0 10 2 20 14 3 40 17 4 60 17,4 5 80 17,6 6 100 16 214 Solução: I i X .i Y 1ia 2 ia 3 ia . 1 ai Yi . 2 ai Yi . 3 ai Yi 1 0 10 -5 5 -5 -50 50 -50 2 20 14 -3 -1 7 -42 -14 98 3 40 17 -1 -4 4 -17 -68 68 4 60 17,4 1 -4 -4 17,4 -69,6 -69,6 5 80 17,6 3 -1 -7 52,8 -17,6 -123,2 6 100 16 5 5 5 80 80 80 ∑ 300 92 0 0 0 1ˆC = 41,2 2ˆC = -39,2 3ˆC = 3,2 K=∑ 2 ia 70 84 180 As SQ: 121,246 / 5 70 2, 41 / ˆ 2 12 = = = J K C SQ RLinear 91,467 16 8, 1536 ,64 84 / 5 39 2, K / J Cˆ SQ 2 2 2 RQuadrátic a = = = − = ,0 284 36 ,24 10 / 5 180 2,3 K / J Cˆ SQ 2 2 3 RCúbica = = = = 214,267 5 6 460 5 80 88 87 85 70 50 2 2 2 2 2 2 2 = − + + + + + = x SQT ,1 269 ,0 284 91,467 121,246 214,264 = − − − = − − − = RC RQ RL T D SQ SQ SQ SQ SQ 215 Anova da regressão FV GL SQ QM F Tratamentos (5) 214,267 Regressão Linear 1 121,246 121,246 6,66* Regressão Quadrática 1 91,467 91,467 5,02* Regressão Cúbica 1 0,284 0,284 0,01ns Desvio 2 1,269 0,634 0,03ns Resíduo 24 436,800 18,200 ns; * Não significativo e significativo a 5% pelo teste F [F(5%, 1, 24) = 4,26]. 4.4 O COEFICIENTE DE DETERMINAÇÃO O r2 ou R2 será obtido pela divisão da SQReg pela SQT. Desta forma, de acordo com o modelo ajustado: Linear: SQT SQ r Linear 2 = Quadrático: SQT SQ SQ R Quadrática Linear + 2 = Cúbica: SQT SQ SQ SQ R Cúbica Quadrática Linear + + 2 = Assim verifica-se que quanto maior o grau de ajuste, maior será o R2. Neste ponto chamamos a atenção para um detalhe que tem levado muitos a se equivocarem. O modelo a ser ajustado deve ser em função da significância da análise de variância e não do maior valor do R2. Para o exemplo em questão: 99,20% ,0 992 214,267 91,467 121,246 SQT SQ SQ R Quadrática Linear 2 = = + = + = 216 4.5 ESTIMATIVA DA EQUAÇÃO O modelo geral para estimar uma equação quando se usa o método dos polinômios ortogonais é: e B M P B M P B M P Y Y k k k + + + + + = ... 2 2 2 1 1 1 .. Para estimar uma equação, usa-se parte da equação geral, de acordo com o modelo determinado pelos testes de hipóteses das regressões. Considerando até o terceiro grau, a escolha é feita assim: 3 3 3 2 2 2 1 1 1 .. ˆ B M P B M P B M P Y Y + + + = Equação linear Equação quadrática Equação cúbica K C B 1 1 ˆ = K C B 2 2 ˆ = K C B 3 3 ˆ = M1, M2 e M3 são obtidos nas tabelas de polinômios ortogonais, como mostrado abaixo: 217 P1, P2 e P3 são obtidos da seguinte forma: P = x 1 ( ) 12 1 2 2 2 − − = I x P ( ) 20 7 3 2 3 3 − − = I x x P Para o exemplo em questão, com grau 2 ajustado: ,0 5886 70 41 2, ˆ 1 1 = = = K C B ,0 4667 84 39 2, ˆ 2 2 = − = − = K C B ( ) ( ) 35 /12 12 1 6 12 1 2 2 2 2 2 2 − = − − = − − = x x I x P ( )( ) ( )( )( 35 /12) 3 / 2 ,0 4667 2 ,0 5886 15,333 ˆ 2 2 2 2 1 1 1 .. − + − + = + + = x x B M P B M P Y Y ,2 042 ,0 70005 ,11772 15,333 ˆ 2 + − + = x x Y 2 ,0 70005 ,11772 17,375 ˆ x x Y − + = É necessário despadronizar x e x2, ou seja, obter X e X2, onde X refere-se aos níveis de NPK, no exemplo em questão: h X X x i i − = sendo h a distância entre os níveis. 218 20 − 50 = − = i i i X h X X x 2 20 50 ,0 70005 20 50 ,11772 17,375 ˆ − − − + = i i X X Y 2 ,0 00175 ,0 2338 10,0565 ˆ i i X X Y − + = Solução pelo R, sem delineamento experimental: NPK<-c(0, 20, 40, 60, 80, 100) PROD<-c(10, 14, 17, 17.4, 17.6, 16) modelo_quadrático=lm(PROD~NPK+I(NPK^2)) anova(modelo_quadrático) summary(modelo_quadrático) 219 NPK<-c(0, 20, 40, 60, 80, 100) PROD<-c(10, 14, 17, 17.4, 17.6, 16) modelo_quadrático=lm(PROD~NPK+I(NPK^2)) anova(modelo_quadrático) summary(modelo_quadrático) #Até aqui para achar a equação par(mfrow=c(1,1)) par(mar=c(6, 6, 4, 2)) par(mgp=c(2.5, 0.75, 0)) windowsFonts(A = windowsFont("Times New Roman")) plot(NPK, PROD,type="p", xlab = expression(NPK (kg.ha^-1)), ylab= expression(Produtividade (t.ha^-1)), xlim=c(0,100),ylim=c(0,20), cex.axis="1.5", cex.lab="1.5", pch=19, cex=1.5, col="blue", axes=FALSE, family="A",) axis(1,cex.axis=1.5, family="A") axis(2, cex.axis=1.5, family="A") box(bty="L",lwd=3) curve(10.0565 + 0.2338*(x) -0.00175*x^2,from = 0, to = 100, lwd=2, lty=1,add=TRUE) #lty=1 = curva contínua; lty = 3 = curva tracejada text(50, 6, cex=1.5, family="A", expression(hat(Y)[i]==10.0565+0.2338*X[i]-0.00175*X[i]^2)) text(50, 4, cex=1.5, family="A", expression(R^2==0.9920))l 220 Solução pelo Genes, com delineamento experimental: Arquivo Excel: polinomial.prn 0 10 20 14 40 17 60 17.4 80 17.6 100 16 O QME é digitado no próprio Genes 221 ========================================================== Programa GENES REGRESSÃO POLINOMIAL Arquivo de dados D:\AAtuais\Est Exp Pós\Aulas\Unidade VI - Regressão e Correlação\polinomial.prn Número de variáveis 2 Arquivo com QMR Grau do polinômio 3 Número de repetições 5 GL do resíduo 24 Data 05-25-2010 ========================================================== ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 1 ________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) ________________________________________________________________________________ ß0 12.39047619 3.08760965 4.01296718 .0005752 ß1 .05885714 .0509902 1.15428354 .25894104 ________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 2 __________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) __________________________________________________________________________________ ß0 10.05714286 3.86652299 2.60108187 .01503989 ß1 .23385714 .18184815 1.28600231 .20835415 ß2 ..00175 .00174553 .1.00256082 .32775567 __________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO - modelo com grau 3 __________________________________________________________________________________ NOME COEFICIENTE(ß) DESVIO t PROBABILIDADE(*) _________________________________________________________________________________ ß0 9.96825397 4.18064323 2.38438284 .02418058 ß1 .25415344 .40602617 .62595334 .5441087 ß2 ..00230556 .01008901 ..22852141 .81590853 ß3 .0000037 .00006625 .05590852 .95451321 _________________________________________________________________________________ (*)Teste t bilateral - S²/r =3.64 Graus de liberdade = 24 r = 5 222 ANÁLISE DE REGRESSÃO POLINOMIAL - GRAU: 3 __________________________________________________________________________________ FV GL SQ QM F PROBAB __________________________________________________________________________________ TOTAL 5 214.26666667 REGRESSÃO 3 212.9968254 70.9989418 3.90104076 .02108973 GRAU 1 1 121.24571429 121.24571429 6.66185243 .01638829 GRAU 2 1 91.46666667 91.46666667 5.02564103 .0344833 GRAU 3 1 .28444445 .28444445 .01562882 100.0 DESVIO 2 1.26984127 .63492063 .03488575 100.0 RESÍDUO 24 436.8 18.2 _________________________________________________________________________________ Modelo R²(%) R²(ajustado)(%) __________________________________________________________________________________ Grau 1 56.58636323 45.73295404 Grau 2 99.27460219 98.79100364 Grau 3 99.40735473 98.51838682 __________________________________________________________________________________ 4.6 PONTO DE MÁXIMO E DE MÍNIMO No caso da equação quadrática existirá um ponto de máximo ou ponto de mínimo. Este ponto é obtido pela derivada segunda da equação de segundo grau obtido. Se o sinal for positivo, existirá ponto de mínimo. Se o sinal for negativo, existirá ponto de máximo. Para obtenção do ponto de máximo ou mínimo, basta obter a derivada primeira da equação de segundo grau e igualar a zero. Desta forma se obtêm Xi que será 2 1 2b b X i = − . A partir deste Xi na equação estimada se obtêm o ponto de máximo para i Yˆ . Para o exemplo em questão, ( ) ( ) 66 8, kg / ha NPK ,0 00175 2 ,0 2338 2b b PM de máximo Ponto 2 1 = − = − = − = que corresponde a um valor máximo de ˆ = 18,09 Yi . 4.7 EXERCÍCIOS 1) Um experimento envolvendo 3 drogas (DA, DB e DC) foi conduzido para estudar cada efeito de droga no batimento cardíaco (bpm) dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos (T1 = 5; T2 = 10; T3 = 15; T4 = 20). Veja: 223 Os dados representam um experimento em DIC num esquema em parcelas subdivididas no tempo. As parcelas eram constituídas das drogas e as subparcelas eram os tempos para medir o batimento cardíaco. Os tratamentos drogas são qualitativos e os tratamentos tempo são quantitativos. Pede-se: a) Fazer a anova para o experimento; b) Determinar os CV; c) Fazer as análises apropriadas após teste F. 2) Se realizou um experimento em DBC, com objetivo de comparar 4 níveis de água aplicados semanalmente em banana ‘Cavendish gigante’, a saber: T1: 20 mm semanais T2: 40 mm semanais T3: 60 mm semanais T4: 80 mm semanais Os dados de rendimento final foram: Tratamentos Repetições I II III IV 1 38,3 37,8 38,1 38,4 2 69,2 65,6 67,8 69,1 3 53,7 52,8 54,1 55,6 4 45,6 44,3 46,1 44,8 Pede-se: a) Proceder à anova do experimento; b) Fazer anova para regressão; 224 c) Obter a equação ajustada; d) Achar o coeficiente de determinação; e) Obter o ponto de máximo ou mínimo; f) Fazer análise crítica sobre o dimensionamento do experimento; g) Fazer o gráfico correspondente e identificar o ponto de máximo ou mínimo. 5 - LITERATURA CITADA: CRUZ, C. D. Programa GENES: estatística experimental e matrizes. Viçosa (MG): Editora UFV, 2006. 285 p. FERREIRA, J. P. et al. Enraizamento in vitro de clones de mamoeiro ‘Tainung 01’. Revista Ciência Agronômica, v. 42, n. 2, p. 563-566, 2011. LEVIN, J. Estatística aplicada a ciências humanas. 2. ed. São Paulo: Harbra, 1987. Tradução de Sérgio Francisco Costa. NASCIMENTO, A.L. et al. Obtaining and evaluating new hybrids of papaya tree. Journal of Agricultural Science, v.10, n.7, p.146-155, 2018. https://doi.org/10.5539/jas.v10n7p146 PEARSON, K. Contribution to the mathematical theory of evolution. Philosophical Transactions of the Royal Society A., v.185, p.71-110, 1894. R CORE TEAM (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:<http://www.R-project.org/>, Acesso: 13 de fevereiro de 2021. SCHMILDT, E. R. et al. Efeito do floroglucinol na reação morfogênica in vitro de segmentos internodais de Citrus sinensis (Linn.) Osbeck cv. Pêra. Revista Ceres, v. 47, n. 269, p. 113-120, 2000. SPEARMAN, C. The proof and measurement of association between two things. The American Journal of Psychology, v.15, n.1, p.72-101, 1904. STEVENSOM, W. J. Estatística aplicada à administração. Tradução de Alfredo Alves de Farias. São Paulo: Harbra, 2001. ZIMMERMANN, F. J. P. Estatística aplicada à pesquisa agrícola. Santo Antônio de Goiás: Embrapa Arroz e feijão, 2004. 400 p. ISBN: 85-7437-020-7. 225 Tabela t bil α = 10% α = 5% α = 2% α = 1% α = 10% α = 5% α = 2% α = 1% α = 10% α = 5% α = 2% α = 1% uni α = 5% α = 2,5% α = 1% α = 0,5% α = 5% α = 2,5% α = 1% α = 0,5% α = 5% α = 2,5% α = 1% α = 0,5% GL erro 1 6.314 12.706 31.821 63.657 GL erro 20 1.725 2.086 2.528 2.845 GL erro 39 1.685 2.023 2.426 2.708 2 2.920 4.303 6.965 9.925 21 1.721 2.080 2.518 2.831 40 1.684 2.021 2.423 2.704 3 2.353 3.182 4.541 5.841 22 1.717 2.074 2.508 2.819 41 1.683 2.020 2.421 2.701 4 2.132 2.776 3.747 4.604 23 1.714 2.069 2.500 2.807 42 1.682 2.018 2.418 2.698 5 2.015 2.571 3.365 4.032 24 1.711 2.064 2.492 2.797 43 1.681 2.017 2.416 2.695 6 1.943 2.447 3.143 3.707 25 1.708 2.060 2.485 2.787 44 1.680 2.015 2.414 2.692 7 1.895 2.365 2.998 3.499 26 1.706 2.056 2.479 2.779 45 1.679 2.014 2.412 2.690 8 1.860 2.306 2.896 3.355 27 1.703 2.052 2.473 2.771 46 1.679 2.013 2.410 2.687 9 1.833 2.262 2.821 3.250 28 1.701 2.048 2.467 2.763 47 1.678 2.012 2.408 2.685 10 1.812 2.228 2.764 3.169 29 1.699 2.045 2.462 2.756 48 1.677 2.011 2.407 2.682 11 1.796 2.201 2.718 3.106 30 1.697 2.042 2.457 2.750 49 1.677 2.010 2.405 2.680 12 1.782 2.179 2.681 3.055 31 1.696 2.040 2.453 2.744 50 1.676 2.009 2.403 2.678 13 1.771 2.160 2.650 3.012 32 1.694 2.037 2.449 2.738 60 1.671 2.000 2.390 2.660 14 1.761 2.145 2.624 2.977 33 1.692 2.035 2.445 2.733 70 1.667 1.994 2.381 2.648 15 1.753 2.131 2.602 2.947 34 1.691 2.032 2.441 2.728 80 1.664 1.990 2.374 2.639 16 1.746 2.120 2.583 2.921 35 1.690 2.030 2.438 2.724 90 1.662 1.987 2.368 2.632 17 1.740 2.110 2.567 2.898 36 1.688 2.028 2.434 2.719 100 1.660 1.984 2.364 2.626 18 1.734 2.101 2.552 2.878 37 1.687 2.026 2.431 2.715 110 1.659 1.982 2.361 2.621 19 1.729 2.093 2.539 2.861 38 1.686 2.024 2.429 2.712 120 1.658 1.980 2.358 2.617 Valores de t obtidos pelo software R, originalmente com seis casas decimais, com o script para valores bilaterais: qt(1-α/2,GLerro) 226 Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GLerro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.65 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 continua ... 227 Tabela F 5% - limites unilaterais de F ao nível de 5% de probabilidade GL do numerador GLerro 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 200 1 248.3 248.6 248.8 249.1 249.3 249.5 249.6 249.8 250.0 250.1 250.7 251.1 251.5 251.8 252.2 252.5 252.7 252.9 253.0 253.7 2 19.45 19.45 19.45 19.45 19.46 19.46 19.46 19.46 19.46 19.46 19.47 19.47 19.47 19.48 19.48 19.48 19.48 19.48 19.49 19.49 3 8.65 8.65 8.64 8.64 8.63 8.63 8.63 8.62 8.62 8.62 8.60 8.59 8.59 8.58 8.57 8.57 8.56 8.56 8.55 8.54 4 5.79 5.79 5.78 5.77 5.77 5.76 5.76 5.75 5.75 5.75 5.73 5.72 5.71 5.70 5.69 5.68 5.67 5.67 5.66 5.65 5 4.55 4.54 4.53 4.53 4.52 4.52 4.51 4.50 4.50 4.50 4.48 4.46 4.45 4.44 4.43 4.42 4.41 4.41 4.41 4.39 6 3.86 3.86 3.85 3.84 3.83 3.83 3.82 3.82 3.81 3.81 3.79 3.77 3.76 3.75 3.74 3.73 3.72 3.72 3.71 3.69 7 3.43 3.43 3.42 3.41 3.40 3.40 3.39 3.39 3.38 3.38 3.36 3.34 3.33 3.32 3.30 3.29 3.29 3.28 3.27 3.25 8 3.14 3.13 3.12 3.12 3.11 3.10 3.10 3.09 3.08 3.08 3.06 3.04 3.03 3.02 3.01 2.99 2.99 2.98 2.97 2.95 9 2.93 2.92 2.91 2.90 2.89 2.89 2.88 2.87 2.87 2.86 2.84 2.83 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.73 10 2.76 2.75 2.75 2.74 2.73 2.72 2.72 2.71 2.70 2.70 2.68 2.66 2.65 2.64 2.62 2.61 2.60 2.59 2.59 2.56 11 2.64 2.63 2.62 2.61 2.60 2.59 2.59 2.58 2.58 2.57 2.55 2.53 2.52 2.51 2.49 2.48 2.47 2.46 2.46 2.43 12 2.53 2.52 2.51 2.51 2.50 2.49 2.48 2.48 2.47 2.47 2.44 2.43 2.41 2.40 2.38 2.37 2.36 2.36 2.35 2.32 13 2.45 2.44 2.43 2.42 2.41 2.41 2.40 2.39 2.39 2.38 2.36 2.34 2.33 2.31 2.30 2.28 2.27 2.27 2.26 2.23 14 2.38 2.37 2.36 2.35 2.34 2.33 2.33 2.32 2.31 2.31 2.28 2.27 2.25 2.24 2.22 2.21 2.20 2.19 2.19 2.16 15 2.32 2.31 2.30 2.29 2.28 2.27 2.27 2.26 2.25 2.25 2.22 2.20 2.19 2.18 2.16 2.15 2.14 2.13 2.12 2.10 16 2.26 2.25 2.24 2.24 2.23 2.22 2.21 2.21 2.20 2.19 2.17 2.15 2.14 2.12 2.11 2.09 2.08 2.07 2.07 2.04 17 2.22 2.21 2.20 2.19 2.18 2.17 2.17 2.16 2.15 2.15 2.12 2.10 2.09 2.08 2.06 2.05 2.03 2.03 2.02 1.99 18 2.18 2.17 2.16 2.15 2.14 2.13 2.13 2.12 2.11 2.11 2.08 2.06 2.05 2.04 2.02 2.00 1.99 1.98 1.98 1.95 19 2.14 2.13 2.12 2.11 2.11 2.10 2.09 2.08 2.08 2.07 2.05 2.03 2.01 2.00 1.98 1.97 1.96 1.95 1.94 1.91 20 2.11 2.10 2.09 2.08 2.07 2.07 2.06 2.05 2.05 2.04 2.01 1.99 1.98 1.97 1.95 1.93 1.92 1.91 1.91 1.88 21 2.08 2.07 2.06 2.05 2.05 2.04 2.03 2.02 2.02 2.01 1.98 1.96 1.95 1.94 1.92 1.90 1.89 1.88 1.88 1.84 22 2.06 2.05 2.04 2.03 2.02 2.01 2.00 2.00 1.99 1.98 1.96 1.94 1.92 1.91 1.89 1.88 1.86 1.86 1.85 1.82 23 2.04 2.02 2.01 2.01 2.00 1.99 1.98 1.97 1.97 1.96 1.93 1.91 1.90 1.88 1.86 1.85 1.84 1.83 1.82 1.79 Valores de F obtidos pelo software R, originalmente com seis casas decimais, com o script: qf(1-α,GLnumerador,GLdenominador) 228 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GL erro GL do numerador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 1539 6170 6181 6192 6201 6209 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 49.43 99.44 99.44 99.44 99.45 99.45 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.13 27.05 26.98 26.92 16.66 26.83 26.79 26.75 26.72 26.69 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 9.78 14.15 14.11 14.08 14.05 14.02 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 7.12 9.68 9.64 9.61 9.58 9.55 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 5.76 7.52 7.48 7.45 7.42 7.40 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 4.95 6.28 6.24 6.21 6.18 6.16 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 4.42 5.48 5.44 5.41 5.38 5.36 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.04 4.92 4.89 4.86 4.83 4.81 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 3.76 4.52 4.49 4.46 4.43 4.41 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 3.54 4.21 4.18 4.15 4.12 4.10 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 3.37 3.97 3.94 3.91 3.88 3.86 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.23 3.78 3.75 3.72 3.69 3.66 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.11 3.62 3.59 3.56 3.53 3.51 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.02 3.49 3.45 3.42 3.40 3.37 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 2.93 3.37 3.34 3.31 3.28 3.26 17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 2.86 3.27 3.24 3.21 3.19 3.16 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 2.80 3.19 3.16 3.13 3.10 3.08 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 2.74 3.12 3.08 3.05 3.03 3.00 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 2.70 3.05 3.02 2.99 2.96 2.94 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.24 3.17 3.12 3.07 2.65 2.99 2.96 2.93 2.90 2.88 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.07 3.02 2.61 2.94 2.91 2.88 2.85 2.83 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 3.02 2.97 2.58 2.89 2.86 2.83 2.80 2.78 continua ... 229 Tabela F 1% - limites unilaterais de F ao nível de 1% de probabilidade GL erro GL do numerador 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 200 1 6216 6223 6229 6235 6240 6245 6249 6253 6257 6261 6276 6287 6296 6303 6313 6321 6326 6331 6334 6350 2 99.45 99.45 99.46 99.46 99.46 99.46 99.46 99.46 99.46 99.47 99.47 99.47 99.48 99.48 99.48 99.48 99.49 99.49 99.49 99.49 3 26.66 26.64 26.62 26.60 26.58 26.56 26.55 26.53 26.52 26.50 26.45 26.41 26.38 26.35 26.32 26.29 26.27 26.25 26.24 99.49 4 13.99 13.97 13.95 13.93 13.91 13.89 13.88 13.86 13.85 13.84 13.79 13.75 13.71 13.69 13.65 13.63 13.61 13.59 13.58 99.49 5 9.53 9.51 9.49 9.47 9.45 9.43 9.42 9.40 9.39 9.38 9.33 9.29 9.26 9.24 9.20 9.18 9.16 9.14 9.13 99.49 6 7.37 7.35 7.33 7.31 7.30 7.28 7.27 7.25 7.24 7.23 7.18 7.14 7.11 7.09 7.06 7.03 7.01 7.00 6.99 99.49 7 6.13 6.11 6.09 6.07 6.06 6.04 6.03 6.02 6.00 5.99 5.94 5.91 5.88 5.86 5.82 5.80 5.78 5.77 5.75 99.49 8 5.34 5.32 5.30 5.28 5.26 5.25 5.23 5.22 5.21 5.20 5.15 5.12 5.09 5.07 5.03 5.01 4.99 4.97 4.96 99.49 9 4.79 4.77 4.75 4.73 4.71 4.70 4.68 4.67 4.66 4.65 4.60 4.57 4.54 4.52 4.48 4.46 4.44 4.43 4.41 99.49 10 4.38 4.36 4.34 4.33 4.31 4.30 4.28 4.27 4.26 4.25 4.20 4.17 4.14 4.12 4.08 4.06 4.04 4.03 4.01 99.49 11 4.08 4.06 4.04 4.02 4.01 3.99 3.98 3.96 3.95 3.94 3.89 3.86 3.83 3.81 3.78 3.75 3.73 3.72 3.71 99.49 12 3.84 3.82 3.80 3.78 3.76 3.75 3.74 3.72 3.71 3.70 3.65 3.62 3.59 3.57 3.54 3.51 3.49 3.48 3.47 99.49 13 3.64 3.62 3.60 3.59 3.57 3.56 3.54 3.53 3.52 3.51 3.46 3.43 3.40 3.38 3.34 3.32 3.30 3.28 3.27 99.49 14 3.48 3.46 3.44 3.43 3.41 3.40 3.38 3.37 3.36 3.35 3.30 3.27 3.24 3.22 3.18 3.16 3.14 3.12 3.11 99.49 15 3.35 3.33 3.31 3.29 3.28 3.26 3.25 3.24 3.23 3.21 3.17 3.13 3.10 3.08 3.05 3.02 3.00 2.99 2.98 99.49 16 3.24 3.22 3.20 3.18 3.16 3.15 3.14 3.12 3.11 3.10 3.05 3.02 2.99 2.97 2.93 2.91 2.89 2.87 2.86 99.49 17 3.14 3.12 3.10 3.08 3.07 3.05 3.04 3.03 3.01 3.00 2.96 2.92 2.89 2.87 2.83 2.81 2.79 2.78 2.76 99.49 18 3.05 3.03 3.02 3.00 2.98 2.97 2.95 2.94 2.93 2.92 2.87 2.84 2.81 2.78 2.75 2.72 2.70 2.69 2.68 99.49 19 2.98 2.96 2.94 2.92 2.91 2.89 2.88 2.87 2.86 2.84 2.80 2.76 2.73 2.71 2.67 2.65 2.63 2.61 2.60 99.49 20 2.92 2.90 2.88 2.86 2.84 2.83 2.81 2.80 2.79 2.78 2.73 2.69 2.67 2.64 2.61 2.58 2.56 2.55 2.54 99.49 21 2.86 2.84 2.82 2.80 2.79 2.77 2.76 2.74 2.73 2.72 2.67 2.64 2.61 2.58 2.55 2.52 2.50 2.49 2.48 99.49 22 2.81 2.78 2.77 2.75 2.73 2.72 2.70 2.69 2.68 2.67 2.62 2.58 2.55 2.53 2.50 2.47 2.45 2.43 2.42 99.49 23 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.64 2.63 2.62 2.57 2.54 2.51 2.48 2.45 2.42 2.40 2.39 2.37 99.49 Valores de F obtidos pelo software R, originalmente com seis casas decimais, com o script: qf(1-α,GLnumerador,GLdenomanador) 230 Tabela Tukey 5% - valores de q I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B GLerro 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 6.08 8.33 9.80 10.88 11.73 12.43 13.03 13.54 13.99 14.40 14.76 15.09 15.39 15.67 15.92 16.16 16.38 16.59 16.78 3 4.50 5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.52 10.69 10.84 10.98 11.11 11.24 4 3.93 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.66 8.79 8.91 9.03 9.13 9.23 5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21 6 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 6.79 6.92 7.03 7.14 7.24 7.34 7.43 7.51 7.59 7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.10 7.17 8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87 9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 5.98 6.09 6.19 6.28 6.36 6.44 6.51 6.58 6.64 10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.11 6.19 6.27 6.34 6.40 6.47 11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.06 6.13 6.20 6.27 6.33 12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 5.61 5.71 5.80 5.88 5.95 6.02 6.09 6.15 6.21 13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86 5.93 5.99 6.05 6.11 14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.71 5.79 5.85 5.91 5.97 6.03 15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72 5.78 5.85 5.90 5.96 16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66 5.73 5.79 5.84 5.90 17 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.54 5.61 5.67 5.73 5.79 5.84 18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57 5.63 5.69 5.74 5.79 19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.31 5.39 5.46 5.53 5.59 5.65 5.70 5.75 20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.49 5.55 5.61 5.66 5.71 continua ... 231 Tabela Tukey 5% - valores de q I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B GLerro 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2.94 3.56 3.94 4.21 4.42 4.60 4.74 4.87 4.98 5.08 5.17 5.25 5.33 5.40 5.46 5.52 5.58 5.63 5.68 22 2.93 3.55 3.93 4.20 4.41 4.58 4.72 4.85 4.96 5.06 5.14 5.23 5.30 5.37 5.43 5.49 5.55 5.60 5.65 23 2.93 3.54 3.91 4.18 4.39 4.56 4.70 4.83 4.94 5.03 5.12 5.20 5.27 5.34 5.41 5.46 5.52 5.57 5.62 24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38 5.44 5.49 5.55 5.59 25 2.91 3.52 3.89 4.15 4.36 4.53 4.67 4.79 4.90 4.99 5.08 5.16 5.23 5.30 5.36 5.42 5.47 5.52 5.57 26 2.91 3.51 3.88 4.14 4.35 4.51 4.65 4.77 4.88 4.98 5.06 5.14 5.21 5.28 5.34 5.40 5.45 5.50 5.55 27 2.90 3.51 3.87 4.13 4.33 4.50 4.64 4.76 4.86 4.96 5.04 5.12 5.19 5.26 5.32 5.38 5.43 5.48 5.53 28 2.90 3.50 3.86 4.12 4.32 4.49 4.62 4.74 4.85 4.94 5.03 5.11 5.18 5.24 5.30 5.36 5.41 5.46 5.51 29 2.89 3.49 3.85 4.11 4.31 4.47 4.61 4.73 4.84 4.93 5.01 5.09 5.16 5.23 5.29 5.34 5.40 5.44 5.49 30 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.47 40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 4.90 4.98 5.04 5.11 5.16 5.22 5.27 5.31 5.36 50 2.84 3.42 3.76 4.00 4.19 4.34 4.47 4.58 4.68 4.77 4.85 4.92 4.98 5.04 5.10 5.15 5.20 5.24 5.29 60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06 5.11 5.15 5.20 5.24 70 2.82 3.39 3.72 3.96 4.14 4.29 4.42 4.53 4.62 4.71 4.78 4.85 4.91 4.97 5.03 5.08 5.12 5.17 5.21 80 2.81 3.38 3.71 3.95 4.13 4.28 4.40 4.51 4.60 4.69 4.76 4.83 4.89 4.95 5.00 5.05 5.10 5.14 5.18 90 2.81 3.37 3.70 3.94 4.12 4.27 4.39 4.50 4.59 4.67 4.75 4.81 4.88 4.93 4.98 5.03 5.08 5.12 5.16 100 2.81 3.36 3.70 3.93 4.11 4.26 4.38 4.48 4.58 4.66 4.73 4.80 4.86 4.92 4.97 5.02 5.07 5.11 5.15 110 2.80 3.36 3.69 3.92 4.10 4.25 4.37 4.48 4.57 4.65 4.72 4.79 4.85 4.91 4.96 5.01 5.05 5.10 5.14 120 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95 5.00 5.04 5.09 5.13 Valores de q obtidos pelo software R, originalmente com seis casas decimais, com o script: qtukey(1-α,ntratamentos,glresíduo) 232 Tabela Duncan 5% - valores de z GLerro I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 6.08 5.81 5.56 5.33 5.13 4.96 4.80 4.66 4.54 4.42 4.32 4.22 4.13 4.05 3.98 3.90 3.84 3.77 3.71 3 4.50 4.52 4.47 4.41 4.34 4.27 4.21 4.14 4.08 4.02 3.97 3.91 3.86 3.81 3.77 3.72 3.68 3.64 3.60 4 3.93 4.01 4.03 4.03 4.00 3.97 3.94 3.91 3.87 3.84 3.80 3.77 3.73 3.70 3.67 3.64 3.61 3.58 3.55 5 3.64 3.75 3.80 3.81 3.81 3.81 3.79 3.77 3.75 3.73 3.71 3.68 3.66 3.64 3.62 3.59 3.57 3.55 3.53 6 3.46 3.59 3.65 3.68 3.69 3.70 3.69 3.69 3.67 3.66 3.65 3.63 3.61 3.60 3.58 3.56 3.55 3.53 3.51 7 3.34 3.48 3.55 3.59 3.61 3.62 3.63 3.62 3.62 3.61 3.60 3.59 3.58 3.57 3.56 3.54 3.53 3.52 3.50 8 3.26 3.40 3.48 3.52 3.55 3.57 3.58 3.58 3.58 3.58 3.57 3.56 3.56 3.55 3.54 3.53 3.52 3.51 3.49 9 3.20 3.34 3.42 3.47 3.50 3.52 3.54 3.54 3.55 3.55 3.55 3.54 3.54 3.53 3.52 3.52 3.51 3.50 3.49 10 3.15 3.29 3.38 3.43 3.47 3.49 3.51 3.52 3.52 3.52 3.53 3.52 3.52 3.52 3.51 3.51 3.50 3.49 3.49 11 3.11 3.26 3.34 3.40 3.44 3.46 3.48 3.49 3.50 3.51 3.51 3.51 3.51 3.51 3.50 3.50 3.49 3.49 3.48 12 3.08 3.23 3.31 3.37 3.41 3.44 3.46 3.47 3.48 3.49 3.50 3.50 3.50 3.50 3.50 3.49 3.49 3.49 3.48 13 3.06 3.20 3.29 3.35 3.39 3.42 3.44 3.46 3.47 3.48 3.48 3.49 3.49 3.49 3.49 3.49 3.49 3.48 3.48 14 3.03 3.18 3.27 3.33 3.37 3.40 3.43 3.44 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 3.48 3.48 3.48 15 3.01 3.16 3.25 3.31 3.36 3.39 3.41 3.43 3.45 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 3.48 3.48 16 3.00 3.14 3.23 3.30 3.34 3.38 3.40 3.42 3.44 3.45 3.46 3.46 3.47 3.47 3.48 3.48 3.48 3.48 3.48 17 2.98 3.13 3.22 3.28 3.33 3.37 3.39 3.41 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.48 3.48 3.48 18 2.97 3.12 3.21 3.27 3.32 3.36 3.38 3.40 3.42 3.43 3.45 3.45 3.46 3.47 3.47 3.47 3.47 3.47 3.47 19 2.96 3.11 3.20 3.26 3.31 3.35 3.37 3.40 3.41 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 3.47 20 2.95 3.10 3.19 3.25 3.30 3.34 3.37 3.39 3.41 3.42 3.44 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 continua ... 233 Tabela Duncan 5% - valores de z GLerro I Tratamentos de experimento em DIC, DBC ou DQL; K níveis do fator A; L níveis do fator B 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 2.94 3.09 3.18 3.25 3.30 3.33 3.36 3.38 3.40 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 3.47 22 2.93 3.08 3.17 3.24 3.29 3.33 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 3.47 23 2.93 3.07 3.17 3.23 3.28 3.32 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 24 2.92 3.07 3.16 3.23 3.28 3.31 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 3.47 25 2.91 3.06 3.15 3.22 3.27 3.31 3.34 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 26 2.91 3.05 3.15 3.22 3.27 3.31 3.34 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.45 3.46 3.46 3.47 3.47 27 2.90 3.05 3.14 3.21 3.26 3.30 3.33 3.36 3.38 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 28 2.90 3.04 3.14 3.21 3.26 3.30 3.33 3.35 3.38 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 29 2.89 3.04 3.13 3.20 3.25 3.29 3.33 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.46 3.47 3.47 30 2.89 3.04 3.13 3.20 3.25 3.29 3.32 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.45 3.46 3.47 3.47 40 2.86 3.01 3.10 3.17 3.22 3.27 3.30 3.33 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.46 3.46 3.47 50 2.84 2.99 3.08 3.15 3.21 3.25 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.47 60 2.83 2.98 3.07 3.14 3.20 3.24 3.28 3.31 3.33 3.35 3.37 3.39 3.41 3.42 3.43 3.44 3.45 3.46 3.47 70 2.82 2.97 3.06 3.14 3.19 3.23 3.27 3.30 3.33 3.35 3.37 3.39 3.40 3.42 3.43 3.44 3.45 3.46 3.47 80 2.81 2.96 3.06 3.13 3.18 3.23 3.27 3.30 3.32 3.35 3.37 3.38 3.40 3.41 3.43 3.44 3.45 3.46 3.47 90 2.81 2.96 3.05 3.13 3.18 3.23 3.26 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.43 3.44 3.45 3.46 3.47 100 2.81 2.95 3.05 3.12 3.18 3.22 3.26 3.29 3.32 3.34 3.36 3.38 3.40 3.41 3.42 3.44 3.45 3.46 3.47 110 2.80 2.95 3.05 3.12 3.17 3.22 3.26 3.29 3.32 3.34 3.36 3.38 3.39 3.41 3.42 3.44 3.45 3.46 3.47 120 2.80 2.95 3.04 3.12 3.17 3.22 3.25 3.29 3.31 3.34 3.36 3.38 3.39 3.41 3.42 3.44 3.45 3.46 3.47 Valores de z obtidos pelo software R, originalmente com seis casas decimais, com o script: qtukey(1-α^I-1,ntratamentos,glresíduo) 234 Tabela Dunnett a 5%, unilateral GLerro I Tratamentos de experimento em DIC, DBC ou DQL, comparados com a testemunha 2 3 4 5 6 7 8 9 10 15 20 10 2.1507 2.3376 2.4657 2.5624 2.6398 2.7042 2.7591 2.8070 2.8493 3.0082 3.1173 11 2.1273 2.3100 2.4350 2.5293 2.6048 2.6675 2.7211 2.7677 2.8089 2.9636 3.0696 12 2.1081 2.2874 2.4099 2.5023 2.5762 2.6376 2.6900 2.7356 2.7759 2.9271 3.0307 13 2.0922 2.2686 2.3890 2.4798 2.5524 2.6126 2.6641 2.7088 2.7484 2.8967 2.9984 14 2.0786 2.2526 2.3713 2.4608 2.5322 2.5916 2.6422 2.6862 2.7251 2.8710 2.9710 15 2.0670 2.2390 2.3562 2.4445 2.5150 2.5735 2.6234 2.6668 2.7052 2.8490 2.9475 16 2.0570 2.2272 2.3431 2.4303 2.5000 2.5579 2.6072 2.6501 2.6880 2.8300 2.9272 17 2.0482 2.2168 2.3316 2.4180 2.4870 2.5442 2.5930 2.6354 2.6729 2.8133 2.9095 18 2.0404 2.2077 2.3215 2.4071 2.4754 2.5321 2.5804 2.6225 2.6596 2.7987 2.8938 19 2.0335 2.1996 2.3125 2.3974 2.4652 2.5214 2.5693 2.6110 2.6478 2.7856 2.8799 20 2.0274 2.1923 2.3044 2.3888 2.4560 2.5118 2.5594 2.6007 2.6372 2.7739 2.8674 30 1.9890 2.1473 2.2546 2.3351 2.3993 2.4524 2.4977 2.5370 2.5718 2.7017 2.7904 40 1.9704 2.1254 2.2303 2.3090 2.3717 2.4236 2.4677 2.5061 2.5400 2.6665 2.7529 50 1.9593 2.1124 2.2160 2.2936 2.3554 2.4065 2.4500 2.4878 2.5212 2.6458 2.7307 60 1.9520 2.1039 2.2065 2.2834 2.3446 2.3952 2.4383 2.4757 2.5088 2.6320 2.7161 70 1.9469 2.0978 2.1998 2.2762 2.3370 2.3872 2.4300 2.4672 2.4999 2.6223 2.7057 80 1.9430 2.0932 2.1947 2.2708 2.3313 2.3813 2.4238 2.4608 2.4934 2.6151 2.6980 90 1.9400 2.0897 2.1909 2.2666 2.3268 2.3767 2.4190 2.4558 2.4883 2.6094 2.6920 100 1.9376 2.0869 2.1877 2.2633 2.3233 2.3730 2.4152 2.4519 2.4842 2.6049 2.6872 120 1.9340 2.0827 2.1831 2.2583 2.3180 2.3674 2.4095 2.4459 2.4781 2.5982 2.6801 Determinado no R, com seis casas decimais, usando o pacote nCDunnett (BROCH; FERREIRA, 2014).