·

Engenharia de Alimentos ·

Estatística Experimental

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Profa. Dra. Giovana Fumes Ghantous Universidade de São Paulo - USP Faculdade de Zootecnia e Engenharia de Alimentos Curso de Engenharia de Alimentos ZAB 0363 - Estatística Experimental 22 de Junho de 2021. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Correlacao Linear e Recorde que um problema de correlacado surge quando deseja-se sa- ber se existe alguma relacdo entre um par de variaveis quantitativas, deseja-se quantificar o possivel relacionamento entre elas. e Uma medida do grau de relacionamento entre duas variaveis quanti- tativas X e Y, é obtida através do Coeficiente de Correlacdo Linear de Pearson, que é definido por: cov(X, Y) A(X, Y) = —————., / Var(X) Var(Y) que pode assumir valores entre -1 e 1, ou seja, -l1 <p <1. Correlação Linear Figura: Grácos de dispersão e coecientes de correlação. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Correlacao Linear Como geralmente ndo tem-se acesso a todos os resultados possiveis das duas variaveis X e Y, pode-se sortear uma amostra de n pares de valores (x,y) e estimar o coeficiente de correlacdo linear de Pearson através da férmula: n = - _4(x} — X)(yi — r(X, Y) _— Dizi I yi y) _— VV einai — X)?(vi — ¥)? _ an XiVi — Cohea *M iat a) no Ooh xi)? no Ooh yi)? \/ (xia x 7 ) (ia Ji 7 ) O grafico de dispersdo é amplamente utilizado para visualizacdo de uma relacdo funcional entre duas varidveis quantitativas. Variáveis quantitativas: Gráco de dispersão Exemplo: Calcule o coeciente de correlação entre as variáveis Absor- bância (Y) e concentração de nitrito (X, em mg/100ml) em amostras de mortadela. X 0,5 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Y 0,040 0,078 0,145 0,215 0,300 0,340 0,395 0,460 0,560 0,715 Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressão Linear Simples 2 4 6 8 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Quantidade de nitrito (mg/ml) Absorbância Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Variaveis quantitativas: Correlacao Linear Para estimar o coeficiente de correlaco, usa-se: 571°, x; = 45,5; S772, x? = 285, 25; S779, yi = 3,248; S779, y? = 1, 472984; 3779) xiy; = 20, 438; n (oie Ol Yi) XY (X,Y) = ee i = Ee n xj)? n ny)? f (hax? — SE) (DL, yp — See’) 20. 438 — (45.5)(3.248) (45,5)? (3,248)? \/ [285.25 — “82 | [1, 472084 — 2289 | 5, 6596 = 5 7184 ~ 0, 9897. Existe uma dependéncia linear positiva e relativamente alta entre a concentracao de nitrito e a absorbancia, significando que quanto maior a concentra¢do de nitrito, maior sera a absorbancia. Regressão Linear Simples • Existem situações em que desejamos estudar o comportamento con- junto de duas ou mais variáveis; • Quando o interesse está em procurar expressar essa relação sob a forma de uma equação matemática, tem-se uma análise de regressão; • Essa equação de regressão pode ser um polinômio (uma reta, pará- bola ou um polinômio de grau mais elevado), uma função do tipo exponencial (curva logística, de Gompertz) etc. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressão Linear Simples Dados n pares de valores: (X1, Y1), (X2, Y2), . . . , (Xn, Yn) podemos esta- belecer uma regressão linear simples através do modelo: Yi = β0 + β1Xi + ϵi em que β0 e β1 são os parâmetros da reta e ϵi é o erro associado a Yi. Ao estabelecer este modelo, pressupomos que: 1. a relação entre X e Y é linear; 2. os valores da variável X não são sujeitos a erros (são xos); 3. a média dos erros é nula, isto é, E(ϵi) = 0; 4. para um dado valor Xi, a variância do erro é constante e igual a σ2, denominada variância residual, isto é, Var(ϵi) = σ2; 5. o erro de uma observação não é correlacionado com o erro de qualquer outra observação, isto é, Corr(ϵi, ϵj) = 0, para i ̸= j; 6. os erros têm distribuição normal, isto é, ϵi ∼ N(0, σ2). Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Ajuste de uma reta 2 4 6 8 0.1 0.2 0.3 0.4 0.5 0.6 0.7 x y Figura: Suposições do modelo de regressão. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Ajuste de uma reta Modelo Estatístico Y = β0 + β1X + ϵ Reta ajustada: ˆy = ˆβ0 + ˆβ1x, em que ˆβ0 e ˆβ1 são as estimativas dos parâmetros β0 e β1. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Ajuste de uma reta Estimativas pelo método dos minimos quadrados: Vi = Bo + Bix) + Isolando e; tem-se: ej = Yi — (Bo + 1x;) Para obter a reta com o menor erro (residuo) possivel em relacdo ao con- junto de dados, devemos minimizar a soma de quadrados dos erros (resi- duos) n n n Q=S oF = Soi — (80 + Six)? = So(vi = Bo — Baxi)? i=1 i=1 i=1 Ajuste de uma reta: Estimativa pelo método dos minimos CURR TRA OQ ° A A 3h 02S “(yi — Bo — A1xi)(-1) =0 (I) 0 i=l OQ “ aA a aa, = 02S °(vi — Bo — frxi)(—xi) = 0 (II) 1 i=1 Isolando 9 em (I) tem-se: n n Yo vi — 190 — A S$) xi = 0 i=1 i=1 n n So yi — B1 S2 x = no i=1 i=1 oi Vi og Dnt Xi_ Bs By = iat — fate _ 5 _ x Ajuste de uma reta:Estimativas pelo método dos minimos CURR TRA Substituindo (I) em (Il), tem-se: n So xi(vi — (¥ — 1X) — Bixi) = 0 i=1 n n n n dxvi— DIX + HY MX — Hr Dx? = 0 i=1 i=1 i=1 i=1 n n n n n n i= Yi A i— xX a DXi - Yow =f Yow + By »* i=1 i=1 i=1 i=1 n n 2 n n n By (so Out i) = xi - i 1 ina 17! i=1 i=1 4 _ 4 XiVi — doit Mies Yi ~ (ores Xi)? ie Xf — a Ajuste de uma reta Estimativas pelo método dos minimos quadrados: As estimativas de Go e 3; sdo dadas por: 4 _ 4 XiVi — doit eae Yi ~ nm 2 (oa xi)? Via1 7 — ST e nan n n , ia Vi Pr ja Xi gS By = iat dia _ 5 Ag n em que n corresponde ao tamanho da amostra. Regressão Linear Simples Exemplo: Determinar a reta que relaciona a Absorbância (Y) com a con- centração de nitrito (X, em mg/100ml) em amostras de mortadela. Os dados experimentais são: X 0,5 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Y 0,040 0,078 0,145 0,215 0,300 0,340 0,395 0,460 0,560 0,715 Para calcular o que o exemplo solicita, devemos encontrar a equação da reta de regressão, dada por yi = ˆβ0 + ˆβ1xi. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressdo Linear Simples Para os calculos, utiliza-se: a x; = 45,5; ye x? = 285, 25; a yi= 3, 248; yi y? = 1,473 e ey xi¥i = 20,438. Com esses valores, as estimativas dos parametros da reta de regressdo sdo calculadas: 10 wt, xi PS yi 45,5x3,248 6 Via XiVi — 0. 20, 438 — to 5, 6596 0.07235 1 = TO = rr a — ; ; 0 10, xi (45,5) (xi, x2 - Qi ) ) 285,25 — “sk 78, 2250 > wea 5s Dex 3,248 = eh tah = 2 4 = 44. Bo Ti Pr 10 10 (0,07235)(4, 55) 0,00: Regressão Linear Simples 2 4 6 8 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Quantidade de nitrito (mg/ml) Absorbância Figura: Reta ajustada: ˆyi = −0, 0044 + 0, 07235xi. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressão Linear Simples A reta que melhor se ajusta aos dados é: ˆyi = −0, 0044 + 0, 07235xi. O coeciente angular da reta (0,07235) pode ser entendido como o nú- mero de unidades que será acrescido a Y, quando x sofrer um acréscimo de 1 mg/100ml, já o intercepto (-0,0044) pode ser entendido como a ab- sorbância de uma concentração nula de nitrito. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressdo Linear Simples A qualidade do ajuste de uma regressdo pode ser avaliada através de gra- ficos de residuos e do coeficiente de determinacao, o qual pode ser calculado através da férmula: » "(xX —-X/ R? = (9,)2 eel = AY com 0<R? <1, vin(% — Y) e€ quanto mais proximo de 1 (um) estiver o valor de R, melhor é a qualidade do ajuste. Regressão Linear Simples No Exemplo: ¯x = 4, 55 xi (xi − ¯x) (xi − ¯x)2 0,5 (0,5-4,55)=-4,05 (0, 5 − 4, 55)2 = (−4, 05)2 = 16, 4025 1,0 (1,0-4,55)=-3,55 (1, 0 − 4, 55)2 = (−3, 55)2 = 12, 6025 2,0 (2,0-4,55)=-2,55 (2, 0 − 4, 55)2 = (−2, 55)2 = 6, 5025 3,0 (3,0-4,55)=-1,55 (3, 0 − 4, 55)2 = (−1, 55)2 = 2, 4025 4,0 (4,0-4,55)=-0,55 (4, 0 − 4, 55)2 = (−0, 55)2 = 0, 3025 5,0 (5,0-4,55)= 0,45 (5, 0 − 4, 55)2 = 0, 452 = 0, 2025 6,0 (6,0-4,55)= 1,45 (6, 0 − 4, 55)2 = 1, 452 = 2, 1025 7,0 (7,0-4,55)= 2,45 (7, 0 − 4, 55)2 = 2, 452 = 6, 0025 8,0 (8,0-4,55)= 3,45 (8, 0 − 4, 55)2 = 3, 452 = 11, 9025 9,0 (9,0-4,55)= 4,45 (9, 0 − 4, 55)2 = 4, 452 = 19, 8025 Total 78,2250 Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressão Linear Simples No Exemplo: ¯y = 0, 3248 yi (yi − ¯y) (yi − ¯y)2 0,040 (0,040-0,3248)=-0,2848 (0, 040 − 0, 3248)2 = (−0, 2848)2 = 0, 08111104 0,078 (0,078-0,3248)=-0,2468 (0, 078 − 0, 3248)2 = (−0, 2468)2 = 0, 06091024 0,145 (0,145-0,3248)=-0,1798 (0, 145 − 0, 3248)2 = (−0, 1798)2 = 0, 03232804 0,215 (0,215-0,3248)=-0,1098 (0, 215 − 0, 3248)2 = (−0, 1098)2 = 0, 01205604 0,300 (0,300-0,3248)=-0,0248 (0, 300 − 0, 3248)2 = (−0, 0248)2 = 0, 00061504 0,340 (0,340-0,3248)=0,0152 (0, 340 − 0, 3248)2 = (0, 0152)2 = 0, 00023104 0,395 (0,395-0,3248)=0,0702 (0, 395 − 0, 3248)2 = (0, 0702)2 = 0, 00492804 0,460 (0,460-0,3248)=0,1352 (0, 460 − 0, 3248)2 = (0, 1352)2 = 0, 01827904 0,560 (0,560-0,3248)=0,2352 (0, 560 − 0, 3248)2 = (0, 2352)2 = 0, 05531904 0,715 (0,715-0,3248)= 0,3902 (0, 715 − 0, 3248)2 = (0, 3905)2 = 0, 15225604 Total 0,41803360 Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Regressdo Linear Simples Como 5772, (x; — X)? = 78, 2250, 377°, (y; — y)? = 0,41803360 e 3, = 0, 07235, temos que: x a x;—X 2 : . R2 = (AY Sey = (0,07235)? 782260 — 0,9795, 0 que indica que a relacdo entre a concentracdo de nitrito e a absorbancia esta muito bem explicada pela reta. Relacado importante: R? = (r(x, y))?. No Exemplo: R? = (r(x, y))? = (0, 9897)? = 0, 9795. Andlise de Varidncia - Regressao Linear Simples A Analise de Variancia busca particionar a Soma de Quadrados Total (SQ- Total) em diversos componentes que podem explicar o fendmeno em ques- tao. No caso da Regressdo Linear Simples, pode-se particionar a SQTotal em Soma de Quadrados da Regressdo (SQReg) e Soma de Quadrados dos Residuos (SQRes). SQTotal = SQReg + SQRes n n n di — VP? = DOUG IP + DEH — Hi? i=1 i=1 i=1 Análise de variância - Regressão Linear Simples Desta forma, pode-se vericar estatisticamente se as variáveis X e Y apresentam a suposta relação linear por meio da análise de variância, o que equivale a testar a hipótese: yi = β0 + β1xi + ϵi H0 : β1 = 0 H1 : β1 ̸= 0 Para isso, as seguintes quantidades são obtidas: Causa de variação Graus de liberdade Soma de quadrados Quadrado médio F Regressão linear 1 SQReg QMReg Fcal Resíduo n-2 SQRes QMRes Total n-1 SQTotal Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. / tlae y WA 7 aes 0 _ a q Andlise de varidncia - Regressao Linear Simples Causa de variacao Graus de liberdade Soma de quadrados Quadrado médio F Regressao linear 1 SQReg QMReg Foal Residuo n-2 SQRes QMRes Total n-1 SQTotal Em que n n (oh, 2 saTotal = S>(y; — 7)? = Soy? — (Cia vi i=1 i=1 a n Dra Xx wha Xi 2 n > re SQReg = 9° (¥; — ¥) = A - (OP_, x;)2 n SQRes = (yj — ¥)* = SQTotal-SQReg i=1 SQReg SQRes QMReg = ~~ QMRes = - 1 n—-2 QMReg Foal = QMRee Frap(4i n— 2;a) Se Fo; > Fiap, rejeita-se a hipdtese nula. Análise de variância - Regressão Linear Simples Exemplo: Retomando o exemplo da Absorbância (Y) e concentração de nitrito (X, em mg/100ml) em amostras de mortadela, os dados são: X 0,5 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Y 0,040 0,078 0,145 0,215 0,300 0,340 0,395 0,460 0,560 0,715 Teste se o modelo linear é adequado por meio da análise de variância (use α = 5%). Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples. Analise de variancia - Regressao Linear Simples Para estimar o calculo das somas de quadrados, usa-se: an xj = 45,5; an x? = 285, 25; So}, y; = 3,248; 3729, y? = 1,472984; 779, xiy; = 20, 438; n n 2 T |= 2 _ cia yi) _ SQTota dy — 2 = 1, 472984 — Baer = 0, 41803 (oh XiVi — Ui Ui )" SQReg = Oo Via x? — = = 20, 438 _ 45,5X3,248 \2 = (20,488 =) = 0,40947 285,25 — “85? SQRes = SQTotal-SQReg = 0, 00856 Análise de variância - Regressão Linear Simples SQTotal = 0, 41803 SQReg = 0, 40947 SQRes = 0, 00856 H0 : β1 = 0 vs H1 : β1 ̸= 0 Causa de variação Graus de liberdade Soma de quadrados Quadrado médio Fcal Ftab Regressão linear 1 0,40947 0,40947 382, 69∗ 5,32 Resíduo 8 0,00856 0,00107 Total 9 0,41803 Rejeita-se H0, logo, ao nível de 5% de signicância, conclui-se que as variáveis X e Y apresentam uma relação linear. O Coeciente de determinação R2 também pode ser calculado por R2 = SQRegressão SQTotal = 0,40947 0,41803 = 0, 9795. Ghantous, G.F. 10. Análise de Variação de Regressão. Correlação e Regressão Linear Simples.