·

Agronomia ·

Estatística Experimental

· 2023/2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

QUESTÃO 1 - DADOS FICTÍCIOS: Um pesquisador, em um estudo sobre adubação nitrogenada na cultura de arroz irrigado, testou quatro formas de aplicação desse adubo: 1. Aplicação 1: 80 kg/ha no plantio; 2. Aplicação 2: 40 kg/ha no plantio e 40 kg/ha 40 dias após a emergência (DAE); 3. Aplicação 3: 13,2 kg/ha no plantio e 66,8 kg/ha aos 40 DAE; 4. Aplicação 4: 13,2 kg/ha no plantio e 33,4 aos 40 e 60 DAE. O experimento tinha oito repetições, e os dados de produção de grãos em kg/ha encontram-se na tabela a seguir. Tabela 1: Dados de produção de grãos de arroz irrigado, em kg/ha, no delineamento inteiramente casualizado, com quatro tratamentos e oito repetições | TRATAMENTOS | REPTEÇÕES | |--------------------|-----------------------------------------------------------------| | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | | Aplicação 1 | 6196 | 6135 | 6350 | 6330 | 6221 | 6146 | 6251 | 6191 | | Aplicação 2 | 7000 | 6890 | 6856 | 7049 | 6657 | 6912 | 6622 | 6393 | | Aplicação 3 | 6457 | 6176 | 6756 | 7049 | 6777 | 5856 | 6498 | 6860 | | Aplicação 4 | 6365 | 7173 | 7169 | 6969 | 6444 | 6540 | 6370 | 7270 | Considere os dados apresentados na Tabela 1. (a) Faça um possível croqui de instalação para um novo experimento com o mesmo número de tratamentos e de repetições; (b) Faça a análise exploratória dos dados; (c) Faça a análise de variância e interprete o resultado do teste F. (d) Faça a análise gráfica dos resíduos; (e) Aplique um teste de homogeneidade de variâncias e conclua (f ) Aplique um teste de normalidade e conclua. (g) Se possível, faça o teste de comparações múltiplas. Notas: • Todos os itens deverão ser feitos no R, sendo que os itens c) e g) deverão ser feitos, também, manualmente. • Deve-se elaborar um relatório contendo os gráficos, resultados dos testes e respectivas interpretações. A organização na apresentação da questão também será considerada. QUESTÃO 2. Um Engenheiro Agrícola, com o objetivo de verificar qual tipo de pneu que proporciona menor consumo de combustível, para trabalhar em terrenos encharcados, testou 4 diferentes tipos de pneus. Como a área que dispunha para realizar o experimento era heterogênea com relação à declividade, subdividiu a área total em 5 sub-áreas de tal forma que dentro de cada uma delas existia uniformidade com relação à declividade. Após isto, dentro de cada sub-área realizou um sorteio ao acaso, dos tipos de pneus às unidades experimentais. Com a realização da pesquisa, obteve-se, Tabela 2, os seguintes resultados de consumo expressos em litros/hora trabalhadas. Tabela 2: Consumo em litros/hora trabalhadas para diferentes tipos de pneus | Sub-áreas | Tipo 1 | Tipo 2 | Tipo 3 | Tipo 4 | TOTAIS | |----------------|---------|---------|----------|---------|-----------| | 1 | 30 | 32 | 33 | 35 | 130 | | 2 | 28 | 33 | 30 | 31 | 122 | | 3 | 29 | 30 | 31 | 32 | 122 | | 4 | 30 | 31 | 32 | 30 | 123 | | 5 | 24 | 27 | 34 | 19 | 96 | | TOTAIS | 141 | 144 | 161 | 164 | 605 | Por meio das informações fornecidas acima, pede-se (use o nível de 5% de significância, quando necessário). (a) Quais foram os Princípios Básicos da Experimentação utilizados neste experimento? Justifique sua resposta. (b) Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro Agrícola? Justifique sua resposta. (c) Verificar se existe diferença entre os tipos de pneus com relação ao consumo. Faça a ANOVA e aplique o teste de TUKEY, se necessário, concluindo corretamente. (Este item deve ser desenvolvido à mão e no R.) QUESTÃO 3 (PARA SER RESOLVIDA NO R E A MÃO). Os dados a seguir correspondem a duas variáveis X e Y, em que: X = concentração conhecida de ácido lático e Y = concentração de ácido lático registrada pelo instrumento | X | Y | |-----|-----| | 1,1 | 0,7 | | 1,7 | 1,0 | | 1,8 | 0,4 | | 0,4 | 0,3 | | 1,3 | 3,0 | | 3,4 | 2,0 | | 4,0 | 3,1 | | 4,4 | 3,9 | | 4,5 | 4,1 | Admite-se que as variáveis X e Y estão relacionadas conforme o modelo Y_i = β_0 + β_1X_i + ε_i em que β_0 e β_1 são parâmetros e os ε_i são variáveis aleatórias independentes com distribuição normal de média zero e variância σ^2. Ajuste um modelo de regressão linear simples e faça uma análise completa ao nível de significância de 5% e apresente um relatório. QUESTÃO 4 (ESTA QUESTÃO DEVE SER RESOLVIDA APENAS NO R): Os dados da Tabela 4 referem-se a produções de milho (Y), em kg/parcela, de um experimento casualizado em blocos de adubação de milho com diferentes doses (X) de P2O5. Tabela 3: Produção de milho em kg/parcela, de um experimento de adubação de milho | TRATAMENTOS | REPETIÇÕES | TOTAIS| |-------------------|------------------------------------------------|--------| | | I | II | III | IV | | 1 - 0 | 7,38 | 6,77 | 6,90 | 6,54 | 27,59 | | 2 - 25 | 8,15 | 9,20 | 9,25 | 9,80 | 36,70 | | 3 - 50 | 7,10 | 9,30 | 9,95 | 8,92 | 35,27 | | 4 - 75 | 9,40 | 10,48 | 8,89 | 8,54 | 37,31 | | 5 - 100 | 8,00 | 8,25 | 8,98 | 7,20 | 32,34 | Fonte: Dados adaptados com base em Pimentel Gomes (2000). Considere os dados apresentados na Tabela 3. (a) Obter a equação de regressão polinomial mais adequada e o seu respectivo coeficiente de determinação. (b) Faça o gráfico associado a equação ajustada no item (a) com os valores médios observados e a curva ajustada. (c) Qual é a dose que permite encontrar a produção máxima? RELATÓRIO DAS QUESTÕES DE ESTATÍSTICA COM SOLUÇÕES DO PROGRAMA R QUESTÃO 1 Questão 1: DADOS FICTÍCIOS: Um pesquisador em um estudo sobre adubação nitrogenada na cultura de arroz irrigado, testou quatro formas de aplicação desse adubo: 1. Aplicação 1: 80 kg/ha no plantio; 2. Aplicação 2: 40 kg/ha no plantio e 40 kg/ha após a emergência (DAE); 3. Aplicação 3: 13,2 kg/ha no plantio e 66,8 kg/ha aos 40 DAE; 4. Aplicação 4: 13,2 kg/ha no plantio e 33,4 aos 40 e 60 DAE. O experimento tinha oito repetições, e os dados de produção de grãos em kg/ha encontram se na tabela a seguir. Tabela 1: Dados de produção de grãos de arroz irrigado, em kg/ha, no delineamento inteiramente casualizado, com quatro tratamentos e oito repetições: A) Faça um possível croqui de instalação para um novo experimento com o mesmo número de tratamentos e de repetições; B) Faça a análise exploratória dos dados; C) Faça a análise de variância e interprete o resultado do teste F; D) Faça a análise gráfica dos resíduos; E) Aplique um teste de homogeneidade de variâncias e conclua; F) Aplique um teste de normalidade e conclua; G) Se possível, faça o teste de comparações múltiplas. PÁGINA 1 SOLUÇÃO: A) Faça um possível croqui de instalação para um novo experimento com o mesmo número de tratamentos e de repetições; PÁGINA 2 B) Faça a análise exploratória dos dados; C) Faça a análise de variância e interprete o resultado do teste F; Interpretação do resultado: F value (Valor F): Esta é a razão da média dos quadrados do tratamento para a média dos quadrados dos resíduos. Neste caso, é 6.492. PÁGINA 3 Pr(>F) (p-valor): Este é o valor de probabilidade associado ao valor F estatístico. Neste caso, é 0.00226, que é significativamente menor do que 0.05. Isso significa que a hipótese nula (de que não há diferença entre os tratamentos) é rejeitada, e a hipótese alternativa (de que há uma diferença entre pelo menos dois dos tratamentos) é aceita. Portanto, com base nesses resultados, podemos concluir que há uma diferença estatisticamente significativa entre pelo menos dois dos tratamentos. D) Faça a análise gráfica dos resíduos; PÁGINA 4 E) Aplique um teste de homogeneidade de variâncias e conclua; Interpretação do resultado: Os resultados do teste de Levene indicam que o valor F é 1.6249 e o valor p é 0.2099. Quanto maior o valor F, maior a diferença entre as variâncias dos grupos. A hipótese nula para o teste de Levene é que as variâncias dos grupos são iguais. Neste caso, como o valor p (0.2099) é maior que o nível de significância padrão de 0.05, não rejeitamos a hipótese nula. Isso significa que não há evidências suficientes para concluir que as variâncias entre os grupos são diferentes. Em outras palavras, podemos assumir que as variâncias são iguais (ou seja, homogêneas) para fins de análise. F) Aplique um teste de normalidade e conclua; Interpretação do resultado: O teste de Shapiro-Wilk é utilizado para avaliar a normalidade dos dados. A hipótese nula desse teste é que a população é normalmente distribuída. Portanto, se o valor p for significativo (geralmente considerado menor que 0.05), a hipótese nula é rejeitada e conclui-se que os dados não seguem uma distribuição normal. No presente caso, o valor W (a estatística do teste) é 0.93569 e o valor p é 0.08587. O valor W é uma medida de quão bem os dados se ajustam à distribuição normal. Valores mais próximos de 1 indicam que os dados estão mais próximos de uma distribuição normal. O valor p, por outro lado, é a probabilidade de obter um valor W tão extremo quanto o que você obteve, assumindo que a hipótese nula é verdadeira. Como o valor p é maior que 0.05, não rejeitamos a hipótese nula. Isso significa que não há evidências suficientes para concluir que os dados não seguem uma distribuição normal. Em outras palavras, podemos assumir, com um nível de confiança de 95%, que os dados são normalmente distribuídos. PÁGINA 5 G) Se possível, faça o teste de comparações múltiplas. PÁGINA 6 Manualmente, os cálculos foram desenvolvidos com auxílio da planilha excel, em anexo. Fórmulas: SQTotal = 1178430391 – (181311 2)/28 = 4370437 SQTratamento = (8232124341)/7 – (181311 2)/28 = 1957809 SQResíduo = 4370437 – 1957809 = 2412628 GL (Tratamento) = i – 1 = 4 - 1 = 3 GL (Resíduo) = (ij – 1) – (i – 1) = 27 – 3 = 24 GL (Total) = ij – 1 = 28 - 1 = 27 PÁGINA 7 Regra de decisão: Como Fcalculado > Ftabelado, então, rejeita-se H0, pelo teste F, a 5% de significância!!! Para proceder a análise do teste F da ANOVA, o valor calculado foi comparado com o valor tabelado, isto é, Ftabelado ( 5 %; 3 gl (numerador) e 24 gl (denominador)) = 3,01. Assim sendo como Fcalculado (6,49) > Ftabelado (3,01) então, Rejeita-se H0, pelo teste F, a 5% de significância, ou seja, ao menos um par de tratamentos têm efeitos significativamente diferentes. Agora vamos proceder com o cálculo do teste de Tukey: PÁGINA 8 q(4, 24, 5%) = 3,901 QMR = 100526 r = 7 HSD = 3,901 x √100526/7 = 3,901 x 119,84 = 467,48 (Diferença Mínima Significativa) Conforme o resultado acima, observa-se que somente há diferença estatisticamente significativa entre os seguintes pares de tratamentos: (Aplicação 1 x Aplicação 4) e (Aplicação 3 x Aplicação 4), pois são os únicos em que a diferença entre eles supera o valor de 467,48 (Diferença Mínima Significativa). Os demais pares de tratamentos são estatisticamente iguais, ao nível de probabilidade de 5%. Tabela de amplitude estudentizada (Valor de q para o nível de significância de 5%): PÁGINA 9 QUESTÃO 2 Questão 2: Um Engenheiro Agrícola, com o objetivo de verificar qual tipo de pneu que proporciona menor consumo de combustível, para trabalhar em terrenos encharcados, testou 4 diferentes tipos de pneus. Como a área que dispunha para realizar o experimento era heterogênea com relação a declividade, ele subdividiu a área total em 4 sub-áreas de tal forma que dentro de cada uma delas existia uniformidade em relação à declividade. Após isto, dentro de cada sub-área realizou um sorteio ao acaso, dos tipos de pneus às unidades experimentais. Com a realização da pesquisa, obteve-se, tabela 2, os seguintes resultados de consumo expressos em litros/hora trabalhadas. Tabela 2: Consumo em litros/hora trabalhadas para diferentes tipos de pneus. Por meio das informações fornecidas acima, pede-se (use o nível de 5% de significância, quando necessário). (a) Quais foram os Princípios Básicos da Experimentação utilizados neste experimento? Justifique sua resposta. (b) Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro Agrícola? Justifique sua resposta. (c) Verificar se existe diferença entre os tipos de pneus com relação ao consumo. Faça a ANOVA e aplique o teste de TUKEY, se necessário, concluindo corretamente. (Este item deve ser desenvolvido a mão e no R.) PÁGINA 10 SOLUÇÃO: (a) Quais foram os Princípios Básicos da Experimentação utilizados neste experimento? Justifique sua resposta. Neste experimento, foram utilizados os seguintes Princípios Básicos da Experimentação: Aleatorização: O engenheiro agrícola realizou um sorteio ao acaso dos tipos de pneus às unidades experimentais dentro de cada sub-área. A aleatorização é fundamental para garantir que os grupos de tratamentos sejam comparáveis e que os efeitos de outras variáveis não controladas sejam distribuídos de forma igual entre os grupos. Repetição: Para cada tipo de pneu, foram realizadas medidas de consumo em diferentes sub-áreas. Cada combinação de tipo de pneu e sub-área foi repetida para obter uma amostra representativa dos resultados. A replicação é importante para reduzir a variabilidade dos dados e aumentar a confiabilidade das conclusões do experimento. Controle Local: A subdivisão da área total em sub-áreas de forma que dentro de cada uma delas existia uniformidade em relação à declividade ajuda a controlar essa variável confundidora, permitindo que o foco seja direcionado ao efeito dos diferentes tipos de pneus no consumo de combustível. (b) Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro Agrícola? Justifique sua resposta. O delineamento experimental utilizado pelo Engenheiro Agrícola foi o delineamento em blocos casualizados (DBC) Justificativa: No delineamento em blocos casualizados, as unidades experimentais são agrupadas em blocos, de forma que dentro de cada bloco há uniformidade em relação a uma variável conhecida que pode afetar as respostas do experimento. Neste caso, as subáreas foram utilizadas como blocos, e elas foram escolhidas de forma a apresentar uniformidade em relação à declividade, que é uma variável que pode influenciar o consumo de combustível. Os tratamentos (tipos de pneus) foram então aleatoriamente atribuídos às unidades experimentais (subáreas) dentro de cada bloco. Essa aleatorização permite que as diferenças observadas nos consumos de combustível entre os tipos de pneus sejam mais confiáveis, pois controla os efeitos potenciais da declividade dentro de cada bloco. Portanto, com base nas informações fornecidas, o delineamento experimental utilizado foi o delineamento em blocos casualizados (DBC), onde as subáreas foram os blocos e os diferentes tipos de pneus foram os tratamentos atribuídos aleatoriamente dentro de cada bloco. PÁGINA 11 (c) Verificar se existe diferença entre os tipos de pneus com relação ao consumo. Faça a ANOVA e aplique o teste de TUKEY, se necessário, concluindo corretamente. (Este item deve ser desenvolvido a mão e no R.) Conforme resultado do quando de análise de variância, tanto os blocos como os tratamentos apresentaram diferença estatística, ao nível de probabilidade de 5%, pelo teste F. PÁGINA 12 Conforme resultado do teste de Tukey, pode-se concluir que O tratamento Tipo 4 foi superior e estatisticamente diferente de todos os demais. Em segunda posição do maior para o menor consumo destaca-se o tratamento Tipo 3. E em última posição encontramos os tratamentos Tipo 1 e Tipo 2, como sendo os que apresentaram os menores valores para o consumo, sendo que eles foram estatisticamente iguais entre si, ao nível de probabilidade de 5%, pelo teste de Tukey. PÁGINA 13 Manualmente, os cálculos foram desenvolvidos com auxílio da planilha excel, em anexo. Fórmulas: PÁGINA 14 SQBlocos = 42,5 SQTratamento = 68,5 SQTotal = 119,8 SQResíduo = 119,8 – 42,5 – 68,5 = 8,7 GL (Blocos) = j – 1 = 5 - 1 = 4 GL (Tratamento) = i – 1 = 4 - 1 = 3 GL (Resíduo) = (ij – 1) – (i – 1) – (j - 1) = 19 – 3 – 4 = 12 GL (Total) = ij – 1 = 20 - 1 = 19 Regra de decisão: Como Fcalculado > Ftabelado, então, rejeita-se H0, pelo teste F, a 5% de significância!!! Para proceder a análise do teste F da ANOVA, o valor calculado foi comparado com o valor tabelado: Para blocos -> Ftabelado ( 5 %; 4 gl (numerador) e 12 gl (denominador)) = 3,26. Para tratamentos -> Ftabelado ( 5 %; 3 gl (numerador) e 12 gl (denominador)) = 3,49. Assim, para blocos, sendo como Fcalculado (14,66) > Ftabelado (3,26), então, Rejeita-se H0, pelo teste F, a 5% de significância, ou seja, ao menos um par de blocos têm efeitos significativamente diferentes. Considerando os tratamentos, sendo como Fcalculado (31,52) > Ftabelado (3,49), então, Rejeita-se H0, pelo teste F, a 5% de significância, ou seja, ao menos um par de tratamentos têm efeitos significativamente diferentes. PÁGINA 15 PÁGINA 16 Agora vamos proceder com o cálculo do teste de Tukey: Para blocos: q(5, 12, 5%) = 4,51 QMR = 0,73 r = 4 HSD = 4,51 x √0,73/4 = 4,51 x 0,4272 = 1,927 (Diferença Mínima Significativa) Interpretação: A tabela apresentada indica as diferenças entre as médias para diferentes subáreas(blocos). A interpretação dos resultados é feita comparando essas diferenças com o valor da Diferença Mínima Significativa (DMS) pelo teste de Tukey, que é 1,927 neste caso. Se a diferença entre as médias de duas subáreas for maior do que o DMS, concluímos que há uma diferença significativa entre as duas subáreas. Se a diferença for menor que o DMS, não podemos afirmar que há uma diferença significativa. Analisando a tabela, temos: − SubArea 1 x SubArea 2: A diferença é de 1,75, que é menor do que o DMS. Portanto, não há diferença significativa entre as SubAreas 1 e 2. − SubArea 1 x SubArea 3: A diferença é de 4,50, que é maior do que o DMS. Portanto, há uma diferença significativa entre as SubAreas 1 e 3. − SubArea 1 x SubArea 4: A diferença é de 2,25, que é maior do que o DMS. Portanto, há uma diferença significativa entre as SubAreas 1 e 4. − SubArea 1 x SubArea 5: A diferença é de 2,75, que é maior do que o DMS. Portanto, há uma diferença significativa entre as SubAreas 1 e 5. − SubArea 2 x SubArea 3: A diferença é de 2,75, que é maior do que o DMS. Portanto, há uma diferença significativa entre as SubAreas 2 e 3. PÁGINA 17 − SubArea 2 x SubArea 4: A diferença é de 0,50, que é menor do que o DMS. Portanto, não há diferença significativa entre as SubAreas 2 e 4. − SubArea 2 x SubArea 5: A diferença é de 1,00, que é menor do que o DMS. Portanto, não há diferença significativa entre as SubAreas 2 e 5. − SubArea 3 x SubArea 4: A diferença é de 2,25, que é maior do que o DMS. Portanto, há uma diferença significativa entre as SubAreas 3 e 4. − SubArea 3 x SubArea 5: A diferença é de 1,75, que é menor do que o DMS. Portanto, não há diferença significativa entre as SubAreas 3 e 5. − SubArea 4 x SubArea 5: A diferença é de 0,50, que é menor do que o DMS. Portanto, não há diferença significativa entre as SubAreas 4 e 5. Em resumo, há diferenças significativas entre algumas subáreas (1 e 3, 1 e 4, 1 e 5, 2 e 3, e 3 e 4), enquanto para outras comparações (1 e 2, 2 e 4, 2 e 5, 3 e 5, e 4 e 5) não foram encontradas diferenças significativas, ao nível de probabilidade de 5%. Para tratamentos: q(4, 12, 5%) = 4,20 QMR = 0,73 r = 5 HSD = 4,20 x √0,73/5 = 4,20 x 0,3821 = 1,60 (Diferença Mínima Significativa) Interpretação: Os valores na tabela representam as diferenças entre as médias dos tratamentos. Para interpretar os resultados, devemos comparar essas diferenças com o valor tabelado do Diferença Mínima Significativa (DMS) pelo teste de Tukey, que é de 1,60. Se a diferença entre as médias de dois tratamentos for maior do que o DMS, podemos concluir que há uma diferença significativa entre os dois tratamentos. Caso contrário, não podemos afirmar que há uma diferença significativa. Analisando a tabela, temos: − Tipo 1 x Tipo 2: A diferença é de 0,60, que é menor do que o DMS. Portanto, não há diferença significativa entre os tratamentos Tipo 1 e Tipo 2. − Tipo 1 x Tipo 3: A diferença é de 3,00, que é maior do que o DMS. Portanto, há uma diferença significativa entre os tratamentos Tipo 1 e Tipo 3. PÁGINA 18 − Tipo 1 x Tipo 4: A diferença é de 4,60, que é maior do que o DMS. Portanto, há uma diferença significativa entre os tratamentos Tipo 1 e Tipo 4. − Tipo 2 x Tipo 3: A diferença é de 2,40, que é maior do que o DMS. Portanto, há uma diferença significativa entre os tratamentos Tipo 2 e Tipo 3. − Tipo 2 x Tipo 4: A diferença é de 4,00, que é maior do que o DMS. Portanto, há uma diferença significativa entre os tratamentos Tipo 2 e Tipo 4. − Tipo 3 x Tipo 4: A diferença é de 1,60, que encontra na condição de ser igual ao DMS. Portanto, há uma diferença significativa entre os tratamentos Tipo 3 e Tipo 4. Em resumo, todas as comparações entre os tratamentos mostraram diferenças significativas, exceto a comparação entre o Tipo 1 e Tipo 2. Tabela de amplitude estudentizada (Valor de q para o nível de significância de 5%): PÁGINA 19 QUESTÃO 3 Questão 3: (PARA SER RESOLVIDA NO R E A MÃO). Os dados a seguir correspondem a duas variáveis X e Y, em que: X = concentração conhecida de ácido lático e; Y = concentração de ácido lático registrada pelo instrumento. Admite-se que as variáveis X e Y estão relacionadas conforme o modelo Yi = B0 + B1Xi + Ei em que B0 e B1, são parâmetros e os Ei são variáveis aleatórias independentes com distribuição normal de média zero e variância sigma 2. Ajuste um modelo de regressão linear simples e faça uma análise completa ao nível de significância de 5% e apresente um relatório. PÁGINA 20 SOLUÇÃO: PÁGINA 21 PÁGINA 22 Interpretação: Os resultados do modelo de regressão linear são os seguintes: - Intercepto (Intercept): O valor do intercepto é 0,15948. Isso significa que quando a variável independente (X) é zero, o valor esperado da variável dependente é 0,15948. No entanto, o p-valor associado ao intercepto é 0,692, que é maior que 0,05. Isso indica que o intercepto não é estatisticamente significativo no nível de 5%. - O coeficiente para X é 1,22769. Isso indica que, para cada aumento unitário em X, o valor esperado da variável dependente aumenta em 1,22769, mantendo todas as outras variáveis constantes. O p-valor associado a X é muito pequeno (9.28e-16), indicando que X é um preditor estatisticamente significativo da variável dependente. - Erro padrão (std_err): 0.047. Isso dá uma indicação da precisão (ou incerteza) em torno da estimativa do coeficiente da inclinação. - Erro padrão residual: O erro padrão residual é 1,079, que é uma medida da variação dos resíduos (diferença entre os valores observados e os valores previstos pela modelo). - R-quadrado e R-quadrado ajustado: O R-quadrado é 0,9743 e o R-quadrado ajustado é 0,9728, indicando que o modelo explica aproximadamente 97,43% da variância na variável dependente que pode ser explicada pela variável independente X. O R-quadrado ajustado, que leva em conta o número de preditores no modelo, também é bastante alto. - F-estatística e p-valor associado: A F-estatística é 681,5 e o p-valor associado é extremamente pequeno (9.278e- 16). Isso indica que há uma diferença significativa entre as médias dos grupos. PÁGINA 23 - O gráfico de regressão linear mostra uma clara relação linear positiva entre X e Y, com a linha de regressão ajustada capturando essa relação. - O gráfico de resíduos mostra a diferença entre os valores observados e os valores previstos pelo modelo de regressão. O ideal seria que os resíduos fossem distribuídos aleatoriamente em torno de zero, sem padrões aparentes. Neste caso, não parece haver nenhum padrão distinto nos resíduos, sugerindo que o modelo de regressão linear é apropriado para esses dados. Em resumo, o modelo de regressão linear simples ajusta-se bem aos dados e explica uma grande proporção da variação em Y (aproximadamente, 97,43%). Em outras palavras, os resultados sugerem que a variável independente X é um bom preditor da variável dependente e que o modelo de regressão ajustado explica uma grande proporção da variância na variável dependente. PÁGINA 24 Desenvolvimento dos Cálculos de Forma Manual. (O excel foi utilizado como apoio para a realização dos cálculos manuais. Ver planilha em anexo.) A fórmula para o coeficiente de inclinação (b1) em uma regressão linear simples é: Onde: A fórmula para o intercepto (b0) é: Vamos agora calcular os coeficientes de regressão usando essas fórmulas. b1 = ( 646,01 ) / ( 526,20 ) = 1,23 b0 = 8,39 – 1,23 x 6,7 = 0,16 Os coeficientes da equação de regressão linear calculados manualmente são: - Inclinação (b1): 1.227. Isso significa que, para cada aumento unitário em X, espera-se que Y aumente em cerca de 1.23, mantendo todas as outras variáveis constantes. - Intercepto (b0): 0.159. Isso significa que quando X é 0, o valor esperado de Y é 0.16. Portanto, a equação da linha de regressão é: Y = 0.16 + 1.23X PÁGINA 25 Cálculo do Coeficiente de Determinação: R2 = 796,09 / 814,05 = 0,97 PÁGINA 26 QUESTÃO 4 Questão 4: (ESTA QUESTÃO DEVE SER RESPONDIDA APENAS NO R): Os dados da tabela 4 referem-se a produções de milho (Y), em kg/parcela, de um experimento casualizado em blocos de adubação de milho com diferentes doses (X) de P2O5. Tabela 3: Produção de milho em kg/parcela, de um experimento de adubação de milho. Considere os dados apresentados na tabela: (a) Obter a equação de regressão polinomial mais adequado e o seu respectivo coeficiente de determinação: (b) Faça um gráfico associado a equação ajustada no item (a), com os valores médios observados e a curva ajustada. (c) Qual é a dose que permite encontrar a produção máxima. PÁGINA 27 SOLUÇÃO: (a) Obter a equação de regressão polinomial mais adequado e o seu respectivo coeficiente de determinação: PÁGINA 28 Modelo de Regressão Polinomial Gerado: Y = b0 + b1.X + b2.X2 A equação com os valores dos coeficientes do modelo calculados fica assim: Y = 8,62 + 0,77.X – 2,10.X2 O valor do coeficiente de determinação (R2) é igual a 0,9786 ou 97,86%. (b) Faça um gráfico associado a equação ajustada no item (a), com os valores médios observados e a curva ajustada. PÁGINA 29 (c) Qual é a dose que permite encontrar a produção máxima. O valor que corresponde a dose que maximiza a produção é igual a, aproximadamente, 55,45.