·
Agronomia ·
Estatística Experimental
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
34
Questões - R - 2023-2
Estatística Experimental
UFRRJ
3
Questões - 2024-1
Estatística Experimental
UFRRJ
1
Lista 1 - Teste de Hipóteses - 2023-2
Estatística Experimental
UFRRJ
1
Questão - Teste de Hipóteses - 2023-2
Estatística Experimental
UFRRJ
1
Lista 4 - Estatística Experimental - 2024-1
Estatística Experimental
UFRRJ
3
Exercício - 2023-2
Estatística Experimental
UFRRJ
1
Exercício - Teste T - Estatística Experimental 2023 1
Estatística Experimental
UFRRJ
3
P1 - Estatística Experimental 2021 2
Estatística Experimental
UFRRJ
2
Lista - 2023-2
Estatística Experimental
UFRRJ
7
Questões - 2023-2
Estatística Experimental
UFRRJ
Texto de pré-visualização
1 m Estatística Experimental 2021-2 Módulo I Roteiro (revisão); previsão de alguns acréscimos durante a exposição. ●População-Conjunto de quaisquer elementos (valores, pessoas, objetos, etc... .). ● Amostra-É um subconjunto de uma população. ● Amostra aleatória- ● Estatística descritiva- ● Estatística inferencial- ●Estudo observacional- verificamos e medimos características específicas, não tentamos modificar os elementos a serem estudados. Ex: Local da floresta onde os passáros se alimentam. Estação do ano Árvores Arbusto Chão Total Primavera 30 20 9 59 Outono 13 22 26 61 Total 43 42 35 120 Fonte: 2 Dado que estamos na primavera, qual a proporção dos que se alimentam no chão? Dado que os pássaros se alimentam no arbusto, qual a proporção na primavera? ●Estudo experimental- Aplicamos determinado tratamento e passamos, então a observar seus efeitos sobre a variável dos elementos a serem estudados. Ex 1: Comparação do peso de 4(quatro) variedades (tratamento) de uma planta (experimento inteiramente ao acaso ou inteiramente casualizado); Esquema do experimento. Sorteio aleatório das variedades nas 20 parcelas; Princípio da repetição + aleatorização. A B C D 31 24 59 54 23 19 74 46 22 42 43 61 45 33 42 37 29 33 57 52 Modelo matemático: 𝑦𝑖𝑗 = µ + 𝛼𝑖 + Є𝑖𝑗 F= ∑ 𝑛𝑖(𝑦̅𝑖− 𝑦̿)2 /(𝑘−1) 𝑘 𝑖 ∑ ∑ (𝑦𝑖𝑗−𝑦̅𝑖) 2 𝑛𝑖 𝑗=1 𝑘 𝑖=1 /(𝑛−𝑘) = 𝑆𝑄𝑇𝑅/(𝑘−1) 𝑆𝑄𝐸/(𝑛−𝑘) = 𝑀𝑆𝑅 𝑀𝑆𝐸 A C D C A B D A B C D A B D B B C D C A 3 Modelo matemático (experimento em blocos ao acaso): 𝑦𝑖𝑗 = µ + 𝛼𝑖 + ℬ𝑖 + Є𝑖𝑗 Hipóteses: Ex 2: Comparação do efeito de 3 (adubos), A, B e C, sobre o crescimento de algum tipo de arbusto. Exercício: Uma pesquisadora deseja estimar o tamanho da população de FUNÁRIOS RUFUS (João de Barro) em uma localidade. Num primeiro levantamento, a pesquisadora capturou 31 pássaros e marcou a todos com uma anilha. No segundo, capturou 47 pássaros dos quais 12 tinham a anilha referente ao primeiro levantamento. Qual a estimativa do tamanho da população de FUNÁRIOS RUFUS nessa localidade? ● Tipos de variáveis Qualitativa Quantitativa Nominal: Espécies de arbóreas numa floresta; Classificação dos solos. Discreta: Nº de árvores com fungo(s) em uma amostra de 10. Ordinal: Julgamentos do tipo: Bom/médio/ruim; Resistência à ferrugem. Contínua: Taxa de mortalidade das árvores xє(0,1); Ângulo de dispersão das sementes de Ipê roxo. 4 ● Medidas associadas a variáveis quantitativas e gráficos Percentis- divide uma série de dados em 100 grupos (1% cada grupo). Posição (ordem) do percentil de ordem K: L= ( 𝐾 100) × 𝑛 + 0,5 Ex: 1 2 3 4 5 K=50-L=( 50 100) × 5 + 0,5 =3º valor da série ordenada ►𝑃50=3 (percentil de ordem 50)=mediana;𝑃25 = 1,75(1º𝑞𝑢𝑎𝑟𝑡𝑖𝑙);𝑃75 = 4,25(3º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙). Limites de discrepância: 𝑃25- 1,5(𝑃75 − 𝑃25); 𝑃75 + 1,5(𝑃75 − 𝑃25) Valores discrepantes ou outliers: < 𝑃25- 1,5(𝑃75 − 𝑃25); > 𝑃75 + 1,5(𝑃75 − 𝑃25) Diagrama em caixas (Box Plot): Ex 1: 1 2 3 4 5 5 Fonte: BioEstat 5.3 Comentários: Para revelar tendências centrais, dispersão, tipo de distribuição e a presença de outliers (valores extremos). Exercício : Elaborar o Box Plot do Ex 1, 6 A B C D Comentar: Assimetria: 𝑥̅ < mediana<moda ►assimétrica negativa 𝑥̅ = mediana = moda ►simétrica moda< mediana< 𝑥̅ ►assimétrica positiva 7 Aproximadamente simétrica Gráfico ramo – e – folhas: Exercício 1: Crescimento médio de um cultivar em 33 regiões agrícolas. 81 94 116 108 74 79 101 87 93 105 109 93 106 103 100 93 100 78 101 101 95 90 94 90 91 92 100 87 89 90 89 86 85 Solução: Para fazer o ramo- e- folhas, começamos com uma linha vertical ou horizontal com a seguinte escala: Divide-se cada valor por 10 (10 gramas por classe) a partir de 74g. O ramo será a parte inteira e as folhas a fracionária (Boxplot: abrir planilha, clicar em: gráficos, caule e folhas,>>; marcar: Unidade; 2 linhas e exibir diagrama. 8 CAULE FOLHA Escores = 33 1 7 4 2 7 8 9 1 8 1 6 8 5 6 7 7 9 9 10 9 0 0 0 1 2 3 3 3 4 4 1 9 5 7 10 0 0 0 1 1 1 3 4 10 5 6 8 9 0 11 1 11 6 Exercício 2: Construir a representação Ramo e Folhas para o experimento, abaixo. Suponhamos um experimento para decidir sobre a eficácia de 2 tipos de adubo A e B em relação ao crescimento de um cultivar. Cada um aplicado a 18 e 21 cultivares, respectivamente. Adubo A Adubo B 45 60 54 57 55 58 62 55 70 50 52 59 38 48 64 59 55 56 55 56 55 61 52 53 54 59 48 57 57 50 65 55 60 55 58 54 - - - 59 51 56 9 Somatório: Exercício: Mostrar: ∑ (𝒙𝒊 − 𝒚𝒊) = ∑ 𝒙𝒊 𝒏 𝒊=𝟏 − ∑ 𝒚𝒊 𝒏 𝒊=𝟏 𝒏 𝒊=𝟏 Aplicar: X =( 3,4,1,4,3,3,2) é o número de brotos por cepa de eucalipto; Y=( 10,1 11,1 10,7 13,1 14,5, 13,5 12,5) é a altura das cepas. (1) Variância e (2) Desvio padrão: média e raiz quadrada das distâncias de cada valor da série em relação à média, respectivamente. (1) Populacional:𝝈𝟐 = ∑ (𝑿𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝑵 ; (1) Amostral: 𝒔𝟐 = ∑ (𝒙𝒊−𝒙̅)𝟐 𝒏 𝟏 𝒏−𝟏 ; (2) Desvio Padrão Populacional: 𝝈 = √∑ (𝒙𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝑵 ; (2) Desvio Padrão Amostral: √∑ (𝒙𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝒏−𝟏 . Comentários: Exercício1: Determinar o peso médio e a variância de uma cana de certa variedade no canavial de uma usina de uma amostra aleatória, em diversos pontos da lavoura. Pesos em quilogramas, como mostrado a seguir: 1,58 1,32 1,76 1,51 1,38 1,55 1,71 1,54 1,50 1,67 𝑥̅ = 1,55; 𝑆2 = 24,26 − 240,87 10 9 = 0,02 10 Exercício 2: Mostrar que 𝒔𝟐 = ∑ (𝒙𝒊−𝒙̅)𝟐 𝒏 𝒊=𝟏 𝒏−𝟏 = ∑ 𝑥2− (∑ 𝑥𝑖 𝑛 𝑖=1 )2 𝑛 𝑛 𝑖=1 𝑛−1 Exercício 3: Suponhamos um experimento para decidir sobre a eficácia de 2 tipos de adubo A e B em relação ao crescimento de um cultivar. Cada um aplicado a 18 e 21 cultivares, respectivamente. Adubo A Adubo B 45 60 54 57 55 58 62 55 70 50 52 59 38 48 64 59 55 56 55 56 55 61 52 53 54 59 48 57 57 50 65 55 60 55 58 54 - - - 59 51 56 a) Para verificar a homogeneidade das duas populações, um pesquisador sugeriu que se usasse o quociente 𝐹 = 𝑣𝑎𝑟(𝑋/𝐴) 𝑣𝑎𝑟(𝑋/𝐵) , mas não disse qual decisão tomar baseado nesse valor. Que regra de decisão você adotaria? b) Faça um box plot para os dados referentes aos adubos A e B. Compare os dois conjuntos de dados por meio desses desenhos. c) Para decidir se os resultados dos dois adubos são semelhantes ou não, adotou-se o seguinte teste: sejam 11 𝑡 = 𝑥̅𝐴 − 𝑥̅𝑏 𝑆𝑝√ 1 𝑛𝐴 − 1 𝑛𝐵 , 𝑆𝑝 = (𝑛𝐴 − 1)𝑣𝑎𝑟(𝑋/𝐴) + (𝑛𝐵 − 1)𝑣𝑎𝑟(𝑥/𝐵) 𝑛𝐴 − 𝑛𝐵 − 2 𝑛𝐴 𝑒 𝑛𝐵, 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎𝑠 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠. Caso |𝑡| <2, os resultados são semelhantes, caso contrário, são diferentes. Qual seria a sua conclusão? 12 ● Alguns conceitos de probabilidade Experimento Aleatório- apresenta mais de um resultado possível. EX 1: O nº de árvores com cancro numa floresta de eucalipto (seleção, p.ex, de 10 árvores); EX 2: A produtividade de diferentes áreas de floresta de Pinus que receberam adubação; EX 3: As espécies de aves que são capturadas numa rede de uma floresta nativa; EX 4: Face, voltada para cima, no lançamento de uma moeda 3 vezes. Espaço amostral (S)- conjunto dos resultados possíveis de um experimento aleatório. EX 1: S=(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10); EX4:S=(ca,ca,ca; ca,ca,co; ca,co,ca; co,ca,ca; ca,co,co; co,ca,co; co,co,ca; co,co,co). ca=cara; co=coroa Evento A,B... .)- subconjunto de um espaço amostral. EX 1: A=(2,5,9 ); EX 2: B= (Prod/Prod≥0). Prod=Produtividade. Obs- se o resultado é um elemento de A, dizemos que o evento A ocorre. Eventos mutuamente exclusivos ou excludentes- não podem ocorrer mesmo tempo. OBS1: Complementar de A=𝑨̅ A e B são complementares se P(A) + P(B) = P(S) = 1 13 Conceito de probabilidade- é um nº P є [ 0, 1], associado a ,ocorrência de um evento. i) 0 ≤ P(A) ≤ 1; ii) P(S)= 1; iii) Se A e B são eventos mutuamente exclusivos ou excludentes, isto é, A∩B=Φ, então P(AUB)= P(A) + P(B). Obtenção da probabilidade- conceito frequencial ou empírico- P(A)= 𝑁º 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝐴 𝑛º 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠 𝑑𝑜 𝑒𝑟𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜; conceito clássico- P(A)= 𝑁º 𝑑𝑒 𝑚𝑎𝑛𝑒𝑖𝑟𝑎𝑠 𝑐𝑜𝑚𝑜 𝐴 𝑝𝑜𝑑𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑛º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑆 . Lei dos grandes números- se repetimos um experimento um grande nº de vezes, a probabilidade pela frequência relativa (conceito frequencial) de um evento tende para a probabilidade teórica (conceito clássico). Regra da Adição (06-04-2021) P (A ou B) = P (ocorrência de A, ou B, ou ambos) P(AUB)= P(A)+P(B) – P(A∩B) P(A∩B) P(A) P(B) Ss Definição: Os eventos A e B dizem-se mutuamente excludentes ou exclusivos se não podem ocorrer simultaneamente. AA 14 P(AUB)= P(A)+P(B) P(A) P(B) Probabilidade condicional- A BBB B P(A/B)= 𝑃(𝐴∩B) 𝑃(𝐵)>0 EX: Num levantamento em floresta de Pinus oocarpa (espécie de pinheiro) foram observadas 830 árvores, segundo a tabela abaixo: Idade Bifurcada (C) Tortas Rabo de raposa Sem defeito Total Jovem (B) 24 91 78 181 374 Madura (A) 36 74 76 270 456 Total 60 165 154 451 830 15 Calcular: a) P(AUB)=P(A)+P(B) - P(A∩B) = 456 830 + 374 830 − 0 0 = 1 ; P(A/B) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) = 0 0,451 = 0; P(C/A) = 𝑃(𝐶∩𝐴) 𝑃(𝐴) = 36 830 456 830 = 0,079 Eventos independentes: Sejam A e B eventos de S. Intuitivamente, A e B são independentes ►P(A/B) = P(A) e P(B/A)= P(B). Exercício 1: Sejam A e B eventos tais que P(A)=0,2, P(B)=p e P(AUB)= 0,6. Calcular p considerando A e B: a) Mutuamente exclusivos; P(AUB)= P(A) + P(B) ⇒ 0,6 = 0,2 + p ⇒ p= 0,4 b) Independentes. P(AUB) = P(A) + P(B) - P(A).P(B) ⇒ 0,6 = 0,2 + p - 0,2p ⇒ P=0,5. Exercício 2: Uma empresa de consultoria participa de duas concorrências para realizar estudos de impacto ambiental. A probabilidade de vencer a primeira concorrência é de 50% e de vencer a segunda é de 70%, enquanto que a probabilidade de vencer ambas concorrências é 40%. A= (vence a 1ª concorrência); B=(vence a 2ª concorrência) C=(vence ambas as concorrências). Qual a probabilidade de vencer a segunda concorrência dado que ela venceu a primeira? P(B/A) = 𝑃(B∩A) 𝑃(𝐴) = 𝑃(𝐶) 𝑃(𝐴) = 0,4 0,5 =0,8 OBS: A e B são eventos independentes se P(A∩B) = P(A). P(B) Teorema de Bayes- Partição de um espaço amostral S (i=1,2,3,4) se: Ai∩Aj=Ǿ, B é um evento arbitrário. 16 A4 B B= A1∩B U A2∩B U A3∩B U A4∩B; P(B)= P(A1∩B) + P (A2∩B) + P(A3∩B) + P(A4∩B); P(B/A1)= 𝑃(𝐴1∩𝐵) 𝑃(𝐴1) ► P(A1∩B)=P(A1).P(B/A1); P(A1/B)= 𝑃(𝐴1∩𝐵) 𝑃(𝐵) = P(A1).P(B/A1) ∑ P(Ai).P(B/Ai) 4 𝑖=1 . Sejam A1, A2,............,An eventos que formam uma partição de S. Seja B contido em S. Sejam conhecidas P(Ai) e P(B/Ai), i=1,.....n. Então: 𝑃(𝐴𝑗/𝐵)= 𝑃(𝐴𝑗.𝑃(𝐵/𝐴𝑗) ∑ 𝑃(𝐴 𝑛 𝑖=1 𝑖).𝑃(𝐵/𝐴𝑖) j=1,......,n Exercício 1: Em uma madeireira, 3 máquinas M1, M2 e M3 produzem 30%, 45% e 25%, dos produtos, respectivamente. Sabe-se por experiências anteriores, que 2%, 3% e 2% dos produtos feitos por cada máquina são, respectivamente defeituosos. Suponha que um produto, já acabado, seja selecionado aleatoriamente. a) Qual é a probabilidade de que tal produto apresente algum defeito? b) Qual a probabilidade que seja da máquina M1, dado que é defeituoso? A1 A3 A2 17 B=D=(o produto está fora da especificação); A1=M1( o produto é proveniente da máquina1), A2=M2 (idem máquina 2), A3 = M3 (idem máquina 3). D D= M1∩D U M2∩D U M3∩D; P(D)= P(M1∩D) + P (M2∩D) + P(M3∩D); P(D/M1) = 𝑃(𝑀1∩𝐷) 𝑃(𝑀1) - P(M1∩D)=P(M1).P(D/M1); P(D/M2) = 𝑃(𝑀2∩𝐷) 𝑃(𝑀2) - P(M2∩D)=P(M2).P(D/M2); P(D/M3) = 𝑃(𝑀3∩𝐷) 𝑃(𝑀3) - P(M3∩D)=P(M3).P(D/M3). P(D)= P(M1). P(D/M1) + P(M2). P(D/M2) + P(M3). P(D/M3) a) P(D)= 0,30 x 0,02 + 0,45 x 0,03 + 0,25 x 0,02 = 0,02450. b) P(M1/D) = 𝑃(M1∩D) 𝑃(𝐷) = 0,30× 0,02 0,02450 = 0,24490 Exercício 2: Uma água é contaminada se forem encontrados bacilos tipo A e/ou bacilos tipo B e C simultaneamente. As probabilidades de se encontrarem bacilos tipo A, B e C são, respectivamente, 0,30; 0,20 e 0,80. Existindo bacilos tipo A não existirão bacilos tipo B. Existindo bacilos tipo B, a probabilidade de existirem bacilos tipo C é reduzida à metade. Calcular: M1 M2 M3 18 a) P(BUC); b) P(água ser contaminada); c) P(B/água contaminada). ● Variável aleatória X- é uma função que associa a cada, elemento de um espaço amostral um número real. EX1: Considere uma amostra de três árvores para verificar a ocorrência de cancro. Então: S= (𝑐𝑐𝑐, 𝑐𝑐𝑐,̅ 𝑐𝑐 ̅𝑐, 𝑐̅𝑐𝑐, 𝑐𝑐̅𝑐̅, 𝑐̅𝑐𝑐̅, 𝑐̅𝑐̅𝑐, 𝑐̅𝑐̅𝑐̅) 𝑐 - cancro; 𝑐̅ – não cancro Seja X o número de árvores com cancro. 𝑋(𝑐𝑐𝑐) = 3; 𝑋(𝑐𝑐𝑐̅) = 2; 𝑋(𝑐𝑐̅𝑐) = 2; 𝑋(𝑐̅𝑐𝑐) = 2; 𝑋(𝑐𝑐̅𝑐̅) = 1; 𝑋(𝑐̅𝑐𝑐̅) = 1; 𝑋(𝑐̅𝑐̅𝑐) = 1; 𝑋(𝑐̅𝑐̅𝑐̅) = 0 Distribuição de probabilidade de X X 𝑋2 P(X) 0 0 1/8 1 1 3/8 2 4 3/8 3 9 1/8 Total - 1 p=1/2, n=3; E(X) – Valor Esperado de X, Expectância de X E(X)= ∑ 𝑋. 𝑃(𝑋)= (0×1/8)+ (1×3/8)+ (2×3/8) +(3×1/8)=1,5. V(X)= E(𝑋2) – (𝐸(𝑋)) 2 = (0×1/8)+ (1×3/8) + (4×3/8) +(9×1/8)- (1,5)2 = 0,75; V(X) – Variância de X 19 APP- Probability Distributions e Calculadora Estatística (João Gondim) ● Distribuição Binomial- As probabilidades são constantes e independentes na repetição da experiência aleatória. 𝑋(𝑐𝑐𝑐̅) = 2; 𝑋(𝑐𝑐̅𝑐) = 2; 𝑋(𝑐̅𝑐𝑐) P(X=2)= 𝐶3 2 ( 1 2) 2 (1 − 1 2) 3−2 = 3/8 E(X)= np; V(X)= np(1-p); 1-p=q. P(X=x)= 𝐶𝑛𝑥(𝑝)𝑥(1 − 𝑝)𝑛−𝑥 ; X= 0,1,…… n (Função de Probabilidade de X) Exercício: Um levantamento florestal mostra que 70% das árvores selecionadas para a indústria moveleira tem diâmetros acima de 60 cm. Seleciona-se uma amostra de 8(oito) árvores. Elaborar a distribuição de probabilidade. Calcular o valor esperado, variância e desvio padrão. P(X=0) = 𝐶8 0 (0,70)0(1 − 0,70)8−0= 0,00007 Na tabela: n=8, p=0,7, x=0. P(X=1) = 𝐶8 1 (0,70)1(1 − 0,70)8−1 = 0,0012. . . . . P(X=8)= Valor esperado= E(X)= np= 8x0,70=5,6 Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68 20 P(X=1) = 𝐶8 1 (0,70)1(1 − 0,70)8−1 = 0,0012. Na tabela: n=8, p=0,7, x=1. Na APP: n= p= x=1 P(X=x)= . . . Valor esperado= E(X)= np= 8x0,70=5,6 Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68 b) Em uma amostra de 10 árvores, qual é a probabilidade de que pelo menos 3 tenham diâmetro abaixo de 60 cm ? 8 0.7 1 0.00122 21 ● MODELO PROBABILÍSTICO NORMAL Definições: 1- Variável Aleatória(v.a) Seja E um experimento e S o conjunto de todos os resultados possíveis associados ao experimento. Uma função X ,que associe a cada elemento sS um número real ,X(s) , é denominada variável aleatória. Ex. Considere o experimento de se jogar uma moeda duas vezes. Consideremos, o espaço S abaixo, associado a este experimento. S=[caracara, caracoroa, coroacara, coroacoroa]; Seja X a v.a que representa o número de caras .Daí, X(caracara)=2,X(caracoroa)=X(coroacara)=1,X(coroacoroa)=0. caracara 2 1 caracoroa 1 coroacara 0 coroacoroa Domínio(S) R x 2- Variável Aleatória Discreta e Contínua Seja X uma variável aleatória. Se o número de valores possíveis de X (contradomínio-R x) for finito ou infinito numerável, denominamos X de variável aleatória discreta. Suponha-se que o 22 contradomínio de X, seja um intervalo, isto é, X possa tomar todos os valores possíveis no intervalo, então, diremos que X é uma variável aleatória contínua. Associadas as variáveis aleatórias temos as suas funções de probabilidades. Seja X uma variável aleatória contínua. A função densidade de probabilidade (fdp), é uma função f, que satisfaz às seguintes condições: f(x) x ,0 R x, RX f x dx 1 ( ) Além disso ,definimos para qualquer c<d (em R x), P(c <X< d) = d c f x dx ( ) ,onde P representa a probabilidade de X está compreendida no intervalo (c,d). 3-O Modelo Normal (a) Definição- A variável aleatória X , que tome todos os valores reais x , com parâmetros e 2 0 tem uma distribuição normal (ou gaussiana), se sua fdp é dada por: x f x e x , 2 1 ) ( 2 2 2 ) ( 23 f(X) (b) Gráfico- X (c) Momentos- Pode-se demonstrar que: E(X)= ; V(X)= 2 ; f(x) quando x ; e são os pontos de inflexão de f(x); x= é o valor para o qual ocorre o máximo da função, isto é, f(x)= 2 1 ; f(x) é simétrica em torno de ,isto é, f( )= f( ), x x 99,73%; 3 95,45%; 2 68,27%; 3 ;0 4 3 curtose Coeficientedemomentodeassimetria 2 ,0 7979 Desviomedio A área total limitada pela curva e pelo eixo dos x é igual a 1; portanto a área sob a curva ,compreendida entre as duas coordenadas X=a e X=b, em que a<b, representa a probabilidade 24 de X estar situado entre a e b, representada por P(a<X<b). Se X tem distribuição normal, média e variância 2 ,escrevemos: X : N( , 2 ). Quando =0 e 2 =1, temos uma normal padrão ou reduzida, e escrevemos N(0,1). Se X : N( , 2 ) então a v.a Z = X , terá uma distribuição N(0,1). Aplicando o operador E(esperança matemática) à variável Z, temos. xf x dx E X ( ) ( ) E(Z)=E( X )= () ) ( E E X = = 0 0 =0 1 ) ( 1 ) ( ) ( 2 2 2 2 2 2 E X E X E Z , isto é, Z tem média 0 e variância 1. (prova-se também a normalidade). 25 3.1- Tabulação da Distribuição Normal (X : N( , 2 ). P(a<X<b)= dx e x b a 2 2 2 ) ( 2 1 A integral não pode ser calculada exatamente, e a probabilidade acima é obtida aproximadamente por métodos numéricos. No entanto ,para cada valor de e cada valor de , teríamos que obter P(a<X<b) para diversos valores de a e b. Isto pode ser contornado reduzindo a variável X nos moldes de Z, gerando desta forma a tabela para a distribuição normal padrão N(0,1), a saber: P(a<X<b)= ( ) ( ) ) ( ) ( a b b Z P a b X P a , onde representa a Função de Distribuição(fdp) da curva normal reduzida, isto é: ) ( 2 1 ) ( 2 2 z P Z dx e z z z ( ) 1 ) ( x x (z) 26 TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO z s ds e z z Z P 2 2 2 1 ( ) ) ( Z 0 1 2 3 4 5 6 7 8 9 - 3,0 0 , 0 0 1 3 0 , 0 0 1 0 0 , 0 0 0 7 0 , 0 0 0 5 0 , 0 0 0 3 0 , 0 0 0 2 0 , 0 0 0 2 0 , 0 0 0 1 0 , 0 0 0 1 0 , 0 0 0 0 - 2,9 0 , 0 0 1 9 0 , 0 0 1 8 0 , 0 0 1 7 0 , 0 0 1 7 0 , 0 0 1 6 0 , 0 0 1 6 0 , 0 0 1 5 0 , 0 0 1 5 0 , 0 0 1 4 0 , 0 0 1 4 - 2,8 0 , 0 0 2 6 0 , 0 0 2 5 0 , 0 0 2 4 0 , 0 0 2 3 0 , 0 0 2 3 0 , 0 0 2 2 0 , 0 0 2 1 0 , 0 0 2 0 0 , 0 0 2 0 0 , 0 0 1 9 - 2,7 0 , 0 0 3 5 0 , 0 0 3 4 0 , 0 0 3 3 0 , 0 0 3 2 0 , 0 0 3 1 0 , 0 0 3 0 0 , 0 0 2 9 0 , 0 0 2 8 0 , 0 0 2 7 0 , 0 0 2 6 - 2,6 0 , 0 0 4 7 0 , 0 0 4 5 0 , 0 0 4 4 0 , 0 0 4 3 0 , 0 0 4 1 0 , 0 0 4 0 0 , 0 0 3 9 0 , 0 0 3 8 0 , 0 0 3 7 0 , 0 0 3 6 - 2,5 0 , 0 0 6 2 0 , 0 0 6 0 0 , 0 0 5 9 0 , 0 0 5 7 0 , 0 0 5 5 0 , 0 0 5 4 0 , 0 0 5 2 0 , 0 0 5 1 0 , 0 0 4 9 0 , 0 0 4 8 - 2,4 0 , 0 0 8 2 0 , 0 0 8 0 0 , 0 0 7 8 0 , 0 0 7 5 0 , 0 0 7 3 0 , 0 0 7 1 0 , 0 0 6 9 0 , 0 0 6 8 0 , 0 0 6 6 0 , 0 0 6 4 - 2,3 0 , 0 1 0 7 0 , 0 1 0 4 0 , 0 1 0 2 0 , 0 0 9 9 0 , 0 0 9 6 0 , 0 0 9 4 0 , 0 0 9 1 0 , 0 0 8 9 0 , 0 0 8 7 0 , 0 0 8 4 - 2,2 0 , 0 1 3 9 0 , 0 1 3 6 0 , 0 1 3 2 0 , 0 1 2 9 0 , 0 1 2 6 0 , 0 1 2 2 0 , 0 1 1 9 0 , 0 1 1 6 0 , 0 1 1 3 0 , 0 1 1 0 - 2,1 0 , 0 1 7 9 0 , 0 1 7 4 0 , 0 1 7 0 0 , 0 1 6 6 0 , 0 1 6 2 0 , 0 1 5 8 0 , 0 1 5 4 0 , 0 1 5 0 0 , 0 1 4 6 0 , 0 1 4 3 - 2,0 0 , 0 2 2 8 0 , 0 2 2 2 0 , 0 2 1 7 0 , 0 2 1 2 0 , 0 2 0 7 0 , 0 2 0 2 0 , 0 1 9 7 0 , 0 1 9 2 0 , 0 1 8 8 0 , 0 1 8 3 - 1,9 0 , 0 2 8 7 0 , 0 2 8 1 0 , 0 2 7 4 0 , 0 2 6 8 0 , 0 2 6 2 0 , 0 2 5 6 0 , 0 2 5 0 0 , 0 2 4 4 0 , 0 2 3 8 0 , 0 2 3 3 - 1,8 0 , 0 3 5 9 0 , 0 3 5 2 0 , 0 3 4 4 0 , 0 3 3 6 0 , 0 3 2 9 0 , 0 3 2 2 0 , 0 3 1 4 0 . 0 3 0 7 0 , 0 3 0 0 0 , 0 2 9 4 - 1,7 0 , 0 4 4 6 0 , 0 4 3 6 0 , 0 4 2 7 0 , 0 4 1 8 0 , 0 4 0 9 0 , 0 4 0 1 0 , 0 3 9 2 0 , 0 3 8 4 0 , 0 3 7 5 0 , 0 3 6 7 - 1,6 0 , 0 5 4 8 0 , 0 5 3 7 0 , 0 5 2 6 0 , 0 5 1 6 0 , 0 5 0 5 0 , 0 4 9 5 0 , 0 4 8 5 0 , 0 4 7 5 0 , 0 4 6 5 0 , 0 4 5 5 - 1,5 0 , 0 6 6 8 0 , 0 6 5 5 0 , 0 6 4 3 0 , 0 6 3 0 0 , 0 6 1 8 0 , 0 6 0 6 0 , 0 5 9 4 0 , 0 5 8 2 0 , 0 5 7 0 0 , 0 5 5 9 - 1,4 0 , 0 8 0 8 0 , 0 7 9 3 0 , 0 7 7 8 0 , 0 7 6 4 0 , 0 7 4 9 0 , 0 7 3 5 0 , 0 7 2 2 0 , 0 7 0 8 0 , 0 6 9 4 0 , 0 6 8 1 - 1,3 0 , 0 9 6 8 0 , 0 9 5 1 0 , 0 9 3 4 0 , 0 9 1 8 0 , 0 9 0 1 0 , 0 8 8 5 0 , 0 8 6 9 0 , 0 8 5 3 0 , 0 8 3 8 0 , 0 8 2 3 - 1,2 0 , 1 1 5 1 0 , 1 1 3 1 0 , 1 1 1 2 0 , 1 0 9 3 0 , 1 0 7 5 0 , 1 0 5 6 0 , 1 0 3 8 0 , 1 0 2 0 0 , 1 0 0 3 0 , 0 9 8 5 - 1,1 0 , 1 3 5 7 0 , 1 3 3 5 0 , 1 3 1 4 0 , 1 2 9 2 0 , 1 2 7 1 0 , 1 2 5 1 0 , 1 2 3 0 0 , 1 2 1 0 0 , 1 1 9 0 0 , 1 1 7 0 - 1,0 0 , 1 5 8 7 0 , 1 5 6 2 0 , 1 5 3 9 0 , 1 5 1 5 0 , 1 4 9 2 0 , 1 4 6 9 0 , 1 4 4 6 0 , 1 4 2 3 0 , 1 4 0 1 0 , 1 3 7 9 - 0,9 0 , 1 8 4 1 0 , 1 8 1 4 0 , 1 7 8 8 0 , 1 7 6 2 0 , 1 7 3 6 0 , 1 7 1 1 0 , 1 6 8 5 0 , 1 6 6 0 0 , 1 6 3 5 0 , 1 6 1 1 - 0,8 0 , 2 1 1 9 0 , 2 0 9 0 0 , 2 0 6 1 0 , 2 0 3 3 0 , 2 0 0 5 0 , 1 9 7 7 0 , 1 9 4 9 0 , 1 9 2 2 0 , 1 8 9 4 0 , 1 8 6 7 - 0,7 0 , 2 4 2 0 0 , 2 3 8 9 0 , 2 3 5 8 0 , 2 3 2 7 0 , 2 2 9 7 0 , 2 2 6 6 0 , 2 2 3 6 0 , 2 2 0 6 0 , 2 1 7 7 0 , 2 1 4 8 - 0,6 0 , 2 7 4 3 0 , 2 7 0 9 0 , 2 6 7 6 0 , 2 6 4 3 0 , 2 6 1 1 0 , 2 5 7 8 0 , 2 5 4 6 0 , 2 5 1 4 0 , 2 4 8 3 0 , 2 4 5 1 - 0,5 0 , 3 0 8 5 0 , 3 0 5 0 0 , 3 0 1 5 0 , 2 9 8 1 0 , 2 9 4 6 0 , 2 9 1 2 0 , 2 8 7 7 0 , 2 8 4 3 0 , 2 8 1 0 0 , 2 7 7 6 - 0,4 0 , 3 4 4 6 0 , 3 4 0 9 0 , 3 3 7 2 0 , 3 3 3 6 0 , 3 3 0 0 0 , 3 2 6 4 0 , 3 2 2 8 0 , 3 1 9 2 0 , 3 1 5 6 0 , 3 1 2 1 - 0,3 0 , 3 8 2 1 0 , 3 7 8 3 0 , 3 7 4 5 0 , 3 7 0 7 0 , 3 6 6 9 0 , 3 6 3 2 0 , 3 5 9 4 0 , 3 5 5 7 0 , 3 5 2 0 0 , 3 4 8 3 - 0,2 0 , 4 2 0 7 0 , 4 1 6 8 0 , 4 1 2 9 0 , 4 0 9 0 0 , 4 0 5 2 0 , 4 0 1 3 0 , 3 9 7 4 0 , 3 9 3 6 0 , 3 8 9 7 0 , 3 8 5 9 - 0,1 0 , 4 6 0 2 0 , 4 5 6 2 0 , 4 5 2 2 0 , 4 4 8 3 0 , 4 4 4 3 0 , 4 4 0 4 0 , 4 3 6 4 0 , 4 3 2 5 0 , 4 2 8 6 0 , 4 2 4 7 - 0,0 0 , 5 0 0 0 0 , 4 9 6 0 0 , 4 9 2 0 0 , 4 8 8 0 0 , 4 8 4 0 0 , 4 8 0 1 0 , 4 7 6 1 0 , 4 7 2 1 0 , 4 6 8 1 0 , 4 6 4 1 0,0 0 , 5 0 0 0 0 , 5 0 4 0 0 , 5 0 8 0 0 , 5 1 2 0 0 , 5 1 6 0 0 , 5 1 9 9 0 , 5 2 3 9 0 , 5 2 7 9 0 , 5 3 1 9 0 , 5 3 5 9 0,1 0 , 5 3 9 8 0 , 5 4 3 8 0 , 5 4 7 8 0 , 5 5 1 7 0 , 5 5 5 7 0 , 5 5 9 6 0 , 5 6 3 6 0 , 5 6 7 5 0 , 5 7 1 4 0 , 5 7 5 3 0,2 0 , 5 7 9 3 0 , 5 8 3 2 0 , 5 8 7 1 0 , 5 9 1 0 0 , 5 9 4 8 0 , 5 9 8 7 0 , 6 0 2 6 0 , 6 0 6 4 0 , 6 1 0 3 0 , 6 1 4 1 0,3 0 , 6 1 7 9 0 , 6 2 1 7 0 , 6 2 5 5 0 , 6 2 9 3 0 , 6 3 3 1 0 , 6 3 6 8 0 , 6 4 0 6 0 , 6 4 4 3 0 , 6 4 8 0 0 , 6 5 1 7 0,4 0 , 6 5 5 4 0 , 6 5 9 1 0 , 6 6 2 8 0 , 6 6 6 4 0 , 6 7 0 0 0 , 6 7 3 6 0 , 6 7 7 2 0 , 6 8 0 8 0 , 6 8 4 4 0 , 6 8 7 9 0,5 0 , 6 9 1 5 0 , 6 9 5 0 0 , 6 9 8 5 0 , 7 0 1 9 0 , 7 0 5 4 0 , 7 0 8 8 0 , 7 1 2 3 0 , 7 1 5 7 0 , 7 1 9 0 0 , 7 2 2 4 0,6 0 , 7 2 5 7 0 , 7 2 9 1 0 , 7 3 2 4 0 , 7 3 5 7 0 , 7 3 8 9 0 , 7 4 2 2 0 , 7 4 5 4 0 , 7 4 8 6 0 , 7 5 1 7 0 , 7 5 4 9 0,7 0 , 7 5 8 0 0 , 7 6 1 1 0 , 7 6 4 2 0 , 7 6 7 3 0 , 7 7 0 3 0 , 7 7 3 4 0 , 7 7 6 4 0 , 7 7 9 4 0 , 7 8 2 3 0 , 7 8 5 3 0,8 0 , 7 8 8 1 0 , 7 9 1 0 0 , 7 9 3 9 0 , 7 9 6 7 0 , 7 9 9 5 0 , 8 0 2 3 0 , 8 0 5 1 0 , 8 0 7 8 0 , 8 1 0 6 0 , 8 1 3 3 0,9 0 , 8 1 5 9 0 , 8 1 8 6 0 , 8 2 1 2 0 , 8 2 3 8 0 , 8 2 6 4 0 , 8 2 8 9 0 , 8 3 1 5 0 , 8 3 4 0 0 , 8 3 6 5 0 , 8 3 8 9 1,0 0 , 8 4 1 3 0 , 8 4 3 8 0 , 8 4 6 1 0 , 8 4 8 5 0 , 8 5 0 8 0 , 8 5 3 1 0 , 8 5 5 4 0 , 8 5 7 7 0 , 8 5 9 9 0 , 8 6 2 1 1,1 0 , 8 6 4 3 0 , 8 6 6 5 0 , 8 6 8 6 0 , 8 7 0 8 0 , 8 7 2 9 0 , 8 7 4 9 0 , 8 7 7 0 0 , 8 7 9 0 0 , 8 8 1 0 0 , 8 8 3 0 1,2 0 , 8 8 4 9 0 , 8 8 6 9 0 , 8 8 8 8 0 , 8 9 0 7 0 , 8 9 2 5 0 , 8 9 4 4 0 , 8 9 6 2 0 . 8 9 8 0 0 , 8 9 9 7 0 , 9 0 1 5 1,3 0 , 9 0 3 2 0 , 9 0 4 9 0 , 9 0 6 6 0 , 9 0 8 2 0 , 9 0 9 9 0 , 9 1 1 5 0 , 9 1 3 1 0 , 9 1 4 7 0 , 9 1 6 2 0 , 9 1 7 7 1,4 0 , 9 1 9 2 0 , 9 2 0 7 0 , 9 2 2 2 0 , 9 2 3 6 0 , 9 2 5 1 0 , 9 2 6 5 0 , 9 2 7 8 0 , 9 2 9 2 0 , 9 3 0 6 0 , 9 3 1 9 1,5 0 , 9 3 3 2 0 , 9 3 4 5 0 , 9 3 5 7 0 , 9 3 7 0 0 , 9 3 8 2 0 , 9 3 9 4 0 , 9 4 0 6 0 , 9 4 1 8 0 , 9 4 3 0 0 , 9 4 4 1 1,6 0 , 9 4 5 2 0 , 9 4 6 3 0 , 9 4 7 4 0 , 9 4 8 4 0 , 9 4 9 5 0 , 9 5 0 5 0 , 9 5 1 5 0 , 9 5 2 5 0 , 9 5 3 5 0 , 9 5 4 5 1,7 0 , 9 5 5 4 0 , 9 5 6 4 0 , 9 5 7 3 0 , 9 5 8 2 0 , 9 5 9 1 0 , 9 5 9 9 0 , 9 6 0 8 0 , 9 6 1 6 0 , 9 6 2 5 0 , 9 6 3 3 1,8 0 , 9 6 4 1 0 , 9 6 4 8 0 , 9 6 5 6 0 , 9 6 6 4 0 , 9 6 7 1 0 , 9 6 7 8 0 , 9 6 8 6 0 , 9 6 9 3 0 , 9 7 0 0 0 , 9 7 0 6 1,9 0 , 9 7 1 3 0 , 9 7 1 9 0 , 9 7 2 6 0 , 9 7 3 2 0 , 9 7 3 8 0 , 9 7 4 4 0 , 9 7 5 0 0 , 9 7 5 6 0 , 9 7 6 2 0 , 9 7 6 7 2,0 0 , 9 7 7 2 0 , 9 7 7 8 0 , 9 7 8 3 0 , 9 7 8 8 0 , 9 7 9 3 0 , 9 7 9 8 0 , 9 8 0 3 0 , 9 8 0 8 0 , 9 8 1 2 0 , 9 8 1 7 2,1 0 , 9 8 2 1 0 , 9 8 2 6 0 , 9 8 3 0 0 , 9 8 3 4 0 , 9 8 3 8 0 , 9 8 4 2 0 , 9 8 4 6 0 , 9 8 5 0 0 , 9 8 5 4 0 , 9 8 5 7 2,2 0 , 9 8 6 1 0 , 9 8 6 4 0 , 9 8 6 8 0 , 9 8 7 1 0 , 9 8 7 4 0 , 9 8 7 8 0 , 9 8 8 1 0 , 9 8 8 4 0 , 9 8 8 7 0 , 9 8 9 0 2,3 0 , 9 8 9 3 0 , 9 8 9 6 0 , 9 8 9 8 0 , 9 9 0 1 0 , 9 9 0 4 0 , 9 9 0 6 0 , 9 9 0 9 0 , 9 9 1 1 0 , 9 9 1 3 0 , 9 9 1 6 2,4 0 , 9 9 1 8 0 , 9 9 2 0 0 , 9 9 2 2 0 , 9 9 2 5 0 , 9 9 2 7 0 , 9 9 2 9 0 , 9 9 3 1 0 , 9 9 3 2 0 , 9 9 3 4 0 , 9 9 3 6 2,5 0 , 9 9 3 8 0 , 9 9 4 0 0 , 9 9 4 1 0 , 9 9 4 3 0 , 9 9 4 5 0 , 9 9 4 6 0 , 9 9 4 8 0 , 9 9 4 9 0 , 9 9 5 1 0 , 9 9 5 2 2,6 0 , 9 9 5 3 0 , 9 9 5 5 0 , 9 9 5 6 0 , 9 9 5 7 0 , 9 9 5 9 0 , 9 9 6 0 0 , 9 9 6 1 0 , 9 9 6 2 0 , 9 9 6 3 0 , 9 9 6 4 2,7 0 , 9 9 6 5 0 , 9 9 6 6 0 , 9 9 6 7 0 , 9 9 6 8 0 , 9 9 6 9 0 , 9 9 7 0 0 , 9 9 7 1 0 , 9 9 7 2 0 , 9 9 7 3 0 , 9 9 7 4 2,8 0 , 9 9 7 4 0 , 9 9 7 5 0 , 9 9 7 6 0 , 9 9 7 7 0 , 9 9 7 7 0 , 9 9 7 8 0 , 9 9 7 9 0 , 9 9 7 9 0 , 9 9 8 0 0 , 9 9 8 1 2,9 0 , 9 9 8 1 0 , 9 9 8 2 0 , 9 9 8 2 0 , 9 9 8 3 0 , 9 9 8 4 0 , 9 9 8 4 0 , 9 9 8 5 0 , 9 9 8 5 0 , 9 9 8 6 0 , 9 9 8 6 3,0 0 , 9 9 8 7 0 , 9 9 9 0 0 , 9 9 9 3 0 , 9 9 9 5 0 , 9 9 9 7 0 , 9 9 9 8 0 , 9 9 9 8 0 , 9 9 9 9 0 , 9 9 9 9 1 , 0 0 0 0 27 Exercício1: Utilizando esta tabela encontre as seguintes probabilidades: a) P(Z > 1,96) = 1-P(Z ≤ 1,96)= 1- 0,9750=0,02500 b) P(Z < 1,96) = 0,9750 c) P(Z < - 1,.96) = 0,02500 ⇒APP: µ= σ= x= p(X<x)= -0.0250 -1,96 0 Z d) P( -2,50 < Z < 2,50 ) = 𝑃(𝑍 < 2,5) − 𝑃(𝑍 < −2,5) = 0,9938 − 0,0062 = 0,9876 𝑜𝑢 98,76%. 98,78% Z -2,5 2,5 APP: µ= σ= X= 𝑃(𝑋 < 𝑥)= X= 𝑃(𝑋 < 𝑥)= 0 1 -1.96 0.0250 0 0 1 2,5 0,99379 -2,5 0,00621 28 P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃(𝑋 < −2,5) = 0,99379 − 0,00621 = 0,98758 e) P( 0,50 < Z < 1,50 ) = f) P( Z < z ) = 0.75 ⇒ z = ? 0,67(tabela); 0,67449 (Probaility Distributios). g) P( -z1 < Z < z1 ) = 0.75 ⇒ z1 = ? 0,750 0,125 0,125 -z1 z1 Z 𝑃(𝑍 < −𝑧1) = 0,125 ⇒ −𝑧1 = −1,15, 𝑑𝑎í 𝑧1 =? APP: µ=0 σ=1 x= P(X<x)=0.125⇒ x=-1.15035 h) P( 0.27 < Z < z2 ) = 0.50 ⇒ z2 = ? Exercício2: A distribuição dos diâmetros de uma floresta de Pinus segue distribuição Normal com média 23 cm e desvio padrão 7 cm. Pede-se: a) Esquematize o gráfico da distribuição. b) Qual a proporção de árvores com diâmetro acima de 28cm? e) Qual a proporção de árvores com diâmetro entre 20 e 25cm? f) Qual a proporção de árvores com diâmetro entre 16 e 30cm? g) Qual a proporção de árvores com diâmetro entre 25 e 30cm? h) Se 25% das menores árvores forem cortadas, qual o diâmetro mínimo das árvores remanescentes? 29 i) Qual o diâmetro mínimo para uma árvore estar entre as 1% maiores árvores? P(X≥x)=0,01⇒P(Z≥ 𝑥−23 7 ) = 0,01 = 1 − 𝑝 (𝑍 ≤ 𝑥−23 7 ) = 0,99 ⇒ 𝑥−23 7 = 2,33 ⇒ 𝑥 = 39,31; APP: µ=23, σ=7, P(x>x)=0,01⇒x=39.284444 Exercício 3: Ao delinear um processo de fabricação para um tipo de produto de madeira, a indústria obteve na etapa inicial um resultado positivo de 16%. Isto é, 16% produtos nesta etapa são aceitáveis, e 84% são defeituosos. Selecionados 12 desses produtos, nesta etapa, qual a probabilidade de obter ao menos 1 que seja bom? Se é de grande importância obter ao menos 1 dispositivo bom para fins de teste, a probabilidade resultante é adequada? ●Distribuição amostral das médias e da variância (13-04-2021) Em uma amostra aleatória os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de elementos, de maneira que toda a amostra de tamanho n possível tenha a mesma chance de ser escolhida). Se amostras aleatórias de tamanho n (com reposição) forem tomadas de uma população com média µ e desvio padrão σ, então a distribuição amostral de 𝑋̅𝑛 tem as seguintes propriedades: 1. 𝑬(𝑿̅) = µ𝑿̅ = µ ⇒ 𝑿̅𝒏 é um estimador não não tendencioso de µ; 2. √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 (𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑒 𝑋̅) 3. 𝑿̅𝒏 ~𝑵 (µ; 𝜎 √𝑛 ); 𝑿̅𝒏 ~𝑵 (µ; 𝑠 √𝑛 ) ; 𝒏 > 𝟑𝟎 30 OBS 1: Na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal (Teorema do Limite central). OBS 2: Se o tamanho da amostra cresce ⇒ o desvio padrão da média 𝜎 √𝑛 ou erro amostral decresce. Exercício 1: Para a população P= (1, 2, 3) n=2 (com reposição), mostrar que 𝑬(𝑿̅) = µ𝑿̅ 𝒆 √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 . Amostragem sem reposição: √𝑉(𝑋̅) = 𝜎𝑋̅ = √𝑁−𝑛 𝑁−1 𝜎 √𝑛 (𝜎 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) √𝑉(𝑋̅) = 𝜎𝑋̅ = √𝑁−𝑛 𝑁 𝑆 √𝑛 (𝜎 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) Se (𝑛 ≤ 5%𝑁 ) podemos usar 𝜎 √𝑛 Para n > 5%N ⇒ usa-se o fator de correção para população finita (amostragem sem reposição). Exercício 2: Mostrar que: 𝐥𝐢𝐦 𝑵→∞ 𝜎𝑋̅ = √𝑁−𝑛 𝑁−1 𝜎 √𝑛 = √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 Comentar: Exercício 3: Seja X o número de árvores de cedro por hectare numa região de floresta tropical. Suponha que X tem média igual a 2.2 e desvio padrão igual a 1.4. Seja 𝑋̅ o número médio de árvores de cedro por hectare numa reserva de 100 ha (n=100). 31 a) Qual a distribuição de 𝑋̅ ? Desenhe um gráfico e explique. b) Qual a probabilidade do número médio de árvores de cedro por hectare na reserva seja menor do que 2? c) Qual a probabilidade de o número total de árvores de cedro na reserva ser 195? ●Distribuição amostral de proporções Seja “p” é a proporção das unidades de uma população que possui uma certa característica (proporção de “sucessos”). EXs :a) árvores com cancro uma floresta de eucalipto b ) árvores coberta por cipós numa mata c) capivaras do sexo masculino. Considere amostras aleatórias de tamanho n⇒ 1. 𝐸(𝑝̂𝑛) = 𝑝 2. 𝑉𝐴𝑅(𝑝̂𝑛) = 𝑝(1−𝑝) 𝑛 3. Para grande, n>30 ⇒ 𝑝̂𝑛 enquanto variável aleatória tem distribuição aproximadamente normal, isto é: 𝑝̂𝑛~𝑁(𝑝, 𝑝(1−𝑝) 𝑛 ) Exercício: Uma proporção de 37% dos visitantes de um parque favorece a cobrança de taxas de entrada. Uma amostra aleatória de 200 visitantes foi tomada: a) Qual é o parâmetro? 37% b) Qual é a estatística? (0,37)(200)=74 c) Qual é a probabilidade que em uma amostra de 200 visitantes pelo menos 40% favoreçam a cobrança de taxa? 32 d) 𝑃(𝑝̂𝑛 ≥ 0,40) = 1 − 𝑃(𝑝̂𝑛 < 0,40) = 1 − 𝑃 ( 𝑝̂𝑛−𝑝 √(𝑝(1−𝑝)) 𝑝 < 0,40−0,37 √(0,37)(1−0,37) 200 ) = 1 − 𝑃(𝑍 < 0,882) = 1 − 0,8106 = 0,189; APP: µ=0.37; σ=0.034; 𝑃(𝑋 > 𝑥) = 0.18879 ●1. Estimação Intervalar Média populacional: Z= 𝑋̅−µ 𝜎 √𝑛 ⇒ 𝑃 (−𝑧𝛼 2 ≤ 𝑍 ≤ 𝑧𝛼 2) = 1 − 𝛼⇒ 𝑃 (−𝑧𝛼 2 ≤ 𝑋̅−µ 𝜎 √𝑛 ≤ 𝑧𝛼 2) = 1 − 𝛼 ⇒ 𝑃 (−𝑧𝛼 2 𝜎 √𝑛 ≤ 𝑋̅ − µ ≤ 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 ⇒ 𝑃 (−𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ≤ −µ ≤ 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 ⇒ 𝑃 (𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ≤ µ ≤ 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 𝐼𝐶µ = (𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ; 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛)⇒𝐼𝐶µ = 𝑋̅ ± 𝑧𝛼 2 𝜎 √𝑛 𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎; = 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝐸 = 𝑧𝛼 2 𝜎 √𝑛 = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛 = ( 𝑧𝛼 2𝜎 𝐸 ) 2 OBS :Se 𝑛 > 30, podemos, podemos substituir σ pelo desvio padrão 𝑠. Se n≤ 30, a população deve ter distribuição normal, e devemos conhecer σ para aplicar as fórmulas acima. Para o caso 33 de pequenas amostras (𝑛 ≤ 30) 𝑢𝑠𝑎𝑚𝑜𝑠 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡. ● A distribuição de Student Se a distribuição de uma população (é normal (aproximadamente) ⇒ então a distribuição de T= 𝑋̅−µ 𝑆 √𝑛 terá uma Distribuição de Student para todas as amostras de tamanho n. OBS 1: Na medida em que aumenta o tamanho n da amostra, a Distribuição T de Student se aproxima da Distribuição Normal padronizada. Para n> 30 as diferenças são pequenas. OBS 2: σ>1; OBS 3: E(T) = 0;OBS 4: Simétrica;OBS 5:n- 1graus de liberdade. Podemos escrever T= (𝑋̅−µ) ( 𝜎 √𝑛) √𝑆2 𝜎2 = 𝑍 √ 𝑉 (𝑛−1) , 𝑍 = 𝑋̅−µ 𝜎 √𝑛 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑜𝑟𝑚𝑎𝑙 𝑝𝑎𝑑𝑟ã𝑜 𝑒 𝑉 = (𝑛−1)𝑆2 𝜎2 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑞𝑢𝑖 − 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑐𝑜𝑚 𝑣 = 𝑛 − 1𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒. 34 Proporção populacional: 𝐼𝐶𝑝 = 𝑝̂ ± 𝑧𝛼 2 √𝑝̂(1 − 𝑝̂) 𝑛 Distribuição amostral de 𝑆2 = ∑(𝑿𝒊−𝑿̅)𝟐 𝒏−𝟏 ~ 𝜒2(n -1), o desvio padrão amostral denotado por s, é a raiz quadrada positiva de 𝑠2, isto e, 𝑠 = √𝑠2; E(𝑆2) = 𝜎2, 𝑆2, 𝑣𝑎𝑟𝑖á𝑣𝑒𝑙 𝑎𝑙𝑒𝑎𝑡ó𝑟𝑖𝑎. Graus de liberdade – A quantidade n-1 é frequentemente chamada de graus de liberdade associados a estimativa da variância. Os graus de liberdade representam o número de pedaços independentes de informações disponíveis para o cálculo da variabilidade. Daí, ∑ (𝑥𝑖 − 𝑥̅) = 𝑛 𝑖=1 0, ⇒ o cálculo da variância amostral não envolve n independentes desvios quadrados da média 𝑥.̅ Teorema: Se 𝑆2 é a variância de uma amostra aleatória de tamanho n, retirada de uma população normal, com variância 𝜎2, então a estatística 𝜒2= (𝑛−1)𝑆2 𝜎2 = ∑ (𝑋𝑖−𝑋̅)2 𝜎2 𝑛 𝑖=1 , tem distribuição qui-quadrado com v=n-1 graus de liberdade. Uma variável aleatória contínua tem distribuição qui- quadrado com graus de liberdade se sua função densidade for dada por: 35 sendo . Denotamos . O gráfico abaixo mostra a função qui-quadrado com 2 graus de liberdade. Notemos pelo gráfico da distribuição qui-quadrado que ela é assimétrica e positiva, isto vale para qualquer grau de liberdade. Sua positividade é fácil de ser verificada, pois ela é soma de normais ao quadrado, portanto só pode ser positiva. A distribuição qui-quadrado possui diversas aplicações na inferência estatística. ●2. Estimação Intervalar Variância populacional: 𝑷(𝜒2 𝐿 ≤ 𝜒2 ≤ 𝜒2 𝑅) = 𝟏 − 𝜶⇒𝑷 (𝝌𝟐 𝑳 ≤ (𝑛−1)𝑆2 𝜎2 ≤ 𝜒2 𝑅)= 𝟏 − 𝜶 ⇒ 𝑷 ( (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈𝟐 ≤ (𝑛−1)𝑆2 𝝌𝟐 𝑳 )= 𝟏 − 𝜶 36 Desvio padrão populacional: 𝑷 (√ (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈 ≤ √ (𝑛−1)𝑆2 𝝌𝟐 𝑳 ) = 𝟏 − 𝜶 Exercício 1: De uma população normal com 𝜎2=16 levantou-se uma amostra, obtendo-se as observações 10, 5, 10, 7. Determinar ao nível de 5% um 𝐼𝐶µ para a média da população. Exercício 2: Em um certo lago, uma amostra de 1000 peixes acusou 290 tilápias. Construa um IC de 95% de confiança para a verdadeira proporção de tilápias na população. Exercício 3:a) De um povoamento de eucaliptos, sorteou-se 30 árvores com a finalidade de estimar o diâmetro médio do povoamento (população aprox.normal). Foram encontradas as seguintes estatísticas na amostra. 𝑥̅ = 26,5; 𝑠 = 7,8. 𝐶alcule: 𝐼𝐶µ(95%); 𝐼𝐶µ(99%).b) Qual o tamanho da amostra necessário para estimar o diâmetro médio de plantas de eucaliptos se o erro máximo deve ser de 2cm da média? Considere 𝜶=5%. 𝑛 = ( (2,04523)(7,8) 2 ) 2 = ~65 Exercício 4: Suponha que uma amostra de tamanho 12 da altura de um cultivar forneceu os seguintes resultados: 𝑥 ̅=3,504; s= 0,109. Construa um IC para o desvio padrão da população (𝜶=5%) 𝐼𝐶𝜎 = (√ (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈 ≤ √ (𝑛−1)𝑆2 𝝌𝟐 𝑳 )= (√ (𝟏𝟐−𝟏)0,1092 𝜒2 𝑅=21,92005 ≤ 𝝈 ≤ √ (12−1)0,1092 𝝌𝟐 𝑳=3,81575) = (0,0772; 0,1851) 37 2,5% 95% 2,5% 0 𝜒2 𝐿 = 3,81575 𝜒2 𝑅 = 21,92005 APP: 𝜒2 𝐿: 𝑣 = 11, 𝑃(𝑋 < 𝑥) = 0,025 ⇒ 𝜒2 𝐿 = 3,81575 𝜒2 𝑅: 𝑣 = 11, 𝑃(𝑋 > 𝑥) = 0,025 ⇒ 𝜒2 𝑅 = 21,92005 ●Testes Estatísticos (20-04-2021) a) Retiramos amostras de tamanho 𝑛 ou tamanhos 𝑛1≠ 𝑛2≠... . ≠𝑛𝑘. b) Sob determinada hipótese de algum valor (hipótese nula = ℎ0) e com Base em valores amostrais, identificamos a Estatística associada, ou seja, a sua distribuição de probabilidade que está tabulada. c) Nesta distribuição delimitamos uma área θ (grau de confiança), p.ex. 95%. Esquematicamente: 𝛼 = 1 − 𝜃(𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎); Área em branco 38 (região de não rejeição de ℎ0) d) Calculamos o valor (determinação) da Estatística associada (Estatística de teste ⇒ Variável aleatória) com base em informação da amostra. e) Decisão: Caso o valor calculado em d), esteja acima ou abaixo do(s) limite(s) de confiança (valor(es) crítico(s) ⇒ rejeitamos a hipótese nula (ℎ0). Caso contrário, consideramos ℎ1 𝑜𝑢 ℎ𝑎 , ℎ𝛼(ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎) como verdadeira. f) Por que? Existem dois tipos de erro: Rejeitarmos uma ℎ0 verdadeira (ou aceitarmos uma ℎ𝑎 falsa) Erro Tipo I (α) Não rejeitarmos uma ℎ0 falsa (ou rejeitarmos uma ℎ𝑎 verdadeira) Erro Tipo II (β) Exercício 1-Explicar as conclusões abaixo, considerando os tipos de Erro I e II. Hoje à noite você vai a uma festa. A previsão do tempo diz que há 80% de possibilidade de chuva. Você leva um guarda-chuva? ℎ0: Vai chover hoje à noite. ℎ𝑎: Não vai chover hoje à noite. Erro Tipo I: Você rejeita ℎ0 e, portanto, acredita que não vai chover. Sai sem o guarda-chuva e se molha (Rejeitarmos uma ℎ0 verdadeira). Erro Tipo II: Você não rejeita ℎ0 e, portanto, aceita que vai chover. Passa a noite carregando um guarda-chuva sem usá- lo (Não rejeitarmos uma ℎ0 falsa). α - é a probabilidade de se cometer um Erro Tipo I (nível de significância), é a chance de se rejeitar ℎ0 quando ela é verdadeira. 39 β - é a probabilidade de se cometer um Erro Tipo II, é a chance de não se rejeitar ℎ0 quando ela é falsa. Exercício 2: Nos casos abaixo, defina a hipótese nula (ℎ0) e a hipótese alternativa (ℎ𝑎) apropriadas. a) Uma fábrica de painéis de madeira deseja duplicar a sua produção. A duplicação acarretaria num consumo adicional de 1.300.000 𝑚3/𝑎𝑛𝑜 de madeira. Com base no sistema de inventário da empresa, que dispõe de 1500 parcelas, o gerente florestal encontrou que as florestas da empresa, têm uma capacidade excedente de produção média de 1225.000 𝑚3/𝑎𝑛𝑜 , com desvio padrão de 130.000 𝑚3/𝑎𝑛𝑜. b) Sabe-se que numa floresta tropical não perturbada a abundância de espécies “pioneiras” fica em torno de 10%. Com aumento de perturbações antrópicas a abundância dessas espécies tende a crescer. Na demarcação de uma reserva florestal com área total de 50.000 ha, ecologistas e engenheiros florestais discutem a incorporação de uma área de 7.500 ha onde o levantamento de campo revelou uma abundância de 15% de espécies pioneiras. ℎ0:p=10% ; ℎ𝑎:p>10%. OBS 1: O valor p é uma área delimitada pelo(s) valore(s) da estatística calculada com os dados amostrais. Consequentemente, se o valor p < α⇒ rejeitamos ℎ0 . 40 Outras representações gráficas para a realização de testes de hipóteses: Teste para média µ: ℎ0 : µ = 1.300.000 ; ℎ1 ≠ 1.300.000, ℎ1 > 1.300.000 𝑜𝑢 ℎ1 < 1.300.000 a) (população normal, σ conhecido e desconhecido e n>30). Estatística de teste: 𝑍 = 𝑋̅−µ 𝜎 √𝑛 ~𝑁(0; 1) Ilustração (teste bilateral) Região de não rejeição de ℎ0 Região de rejeição Região de rejeição 𝑧𝑝 2 𝑧𝛼 2 𝑧𝛼 2 𝑧𝑝 2 Z b) (população normal, σ desconhecido e n≤30) Estatística de teste: T= 𝑋̅−µ 𝑆 √𝑛 ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡(𝑛 − 1) OBS 2: Se a população (distribuição) não é essencialmente normal, utilize métodos não paramétricos que não exijam uma distribuição normal. 41 OBS 3: Se a população (distribuição) é essencialmente normal, para n≤30, e σ é conhecido, usamos a estatística de teste 𝑍 = 𝑋̅−µ 𝜎 √𝑛 . Para σ desconhecido, usamos a distribuição de Student com T= 𝑋̅−µ 𝑆 √𝑛 . Teste de afirmação sobre uma proporção para p: 𝐻0 : 𝑝 = 0,5; 𝐻1 : 𝑝 ≠ 0,5 (n>30) Estatística de teste: 𝑝̂−𝑝 √𝑝(1−𝑝) 𝑛 ~𝑁(0; 1) Teste bilateral da Variância 𝝈𝟐 ∶ ℎ0 : 𝜎2 = 100; ℎ1 ≠ 100 Estatística de teste - 𝜒2 = (𝑛−1)𝑆2 𝜎2 ~𝜒2(𝑛 − 1) Teste de comparação das variâncias de duas populações normais: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 42 Amostras independentes (populações normais) Estatística de teste: 𝐹 = 𝑆1 2 𝑆2 2 ~ 𝐹(𝑛 − 1, 𝑚 − 1) ⇒ 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑠1 2 𝑠2 2 > 1 OBS 4: Colhidas as amostras de n e m indivíduos, respectivamente, das duas populações, calculamos os valores (variâncias amostrais) 𝑠1 2 𝑒 𝑠2 2 e o valor observado 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑠12 𝑠22 . Se 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 pertencer à região crítica (área que corresponde ao nível de significância α, delimitada pelos valores críticos), rejeitamos ℎ𝑜; caso contrário, a aceitamos. EX 2: Queremos verificar se duas florestas de Pinus produzem resinas com a mesma homogeneidade quanto a densidade. Para isso, sorteamos duas amostras de seis árvores de cada floresta, e obtivemos as seguintes densidades: α=0,10 Floresta A 145 127 136 142 141 137 Floresta B 143 128 132 138 142 132 As hipóteses a serem testadas são: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1,08 Valores críticos: 𝐹𝐿 (5,5) = 0,1981; 𝐹𝑅 (5,5) = 5,0503 43 Conclusão= não rejeitamos ℎ𝑜 de que as variâncias sejam iguais, ou seja, as florestas A e B produzem resina com a mesma homogeneidade quanto a 2,5% 95% 2,5% 0 0,1981 5,0503 APP: d1=5; d2=5 ⇒ F(5, 5) P(X<x)=0,05⇒f=𝐹𝐿 (5) = 0,19801 P(X>x)=0,05⇒f=𝐹𝑅 (5) = 5,05033 Teste de comparação de duas médias (variâncias conhecidas): ℎ𝑜 ∶ µ𝑥 − µ𝑦 =0; ℎ1: µ𝑥 − µ𝑦 ≠ 0 , > 0 𝑜𝑢 < 0 ) Amostras independentes Estatística de teste: 𝑍 = 𝑋̅−𝑌̅ √( 𝜎12 𝑛 + 𝜎22 𝑚) ~𝑁(µ𝑥 − µ𝑦; √( 𝜎12 𝑛 + 𝜎22 𝑚) ) Exercício 1: Construir o IC para µ𝑥 − µ𝑦. 44 Teste de comparação de duas médias (variâncias desconhecidas): ℎ𝑜 ∶ µ𝑥 − µ𝑦 =0; ℎ1: µ𝑥 − µ𝑦 ≠ 0, > 0 𝑜𝑢 < 0) Amostras independentes (populações normais) a) Estatística de teste (variâncias diferentes): 𝑇 = 𝑋̅ − 𝑌̅ √(𝑠1 2 𝑛 + 𝑠2 2 𝑚) ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = 𝑚í𝑛(𝑛 − 1, 𝑚 − 1) 𝑔𝑙 = 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 b) Estatística de teste (variâncias iguais): 𝑇 = 𝑋̅−𝑌̅ √𝑆𝑝(1 𝑛+ 1 𝑚) ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = (𝑛 + 𝑚 − 2), 𝑠𝑜𝑏 ℎ𝑜. Daí, 𝑆𝑝2 = (𝑛−1)𝑆12+(𝑚−1)𝑆22 𝑛+𝑚−2 OBS 5: Antes da aplicação acima, devemos fazer o teste das variâncias para decidir em relação aos casos a) e b). Exercício 1: Dois procedimentos (A e B) de extração de celulose de eucalipto devem ser testados quanto a quantidade produzida. As amostras para A e B foram de tamanhos 12 e 15, médias 68 e 76, variância 50 e 52, respectivamente. Testar, para o nível de significância de 5%, se há diferenças significativa entre as quantidades produzidas. Então: ℎ0 = µ𝐴 − µ𝐵 = 0 ; µ𝐴 − µ𝐵 ≠ 0 Teste de variância: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 45 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 52 50 = 1,04 Valores críticos: 𝐹𝐿 (14,11) = 0,32314; 𝐹𝑅 (14,11) = 3,35881 Conclusão 1: não rejeitamos ℎ𝑜(𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 5%) de que as variâncias sejam iguais, ou seja, as quantidades produzidas tem variabilidades, cujas as diferenças não são significativas. Daí, 𝑆𝑝2 = (𝑛 − 1)𝑆1 2 + (𝑚 − 1)𝑆2 2 𝑛 + 𝑚 − 2 = (14)(52) + (11)(50) 15 + 12 − 2 = =51,12 e 𝑇𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑋̅−𝑌̅ √𝑆𝑝(1 𝑛+ 1 𝑚) = 76−68 √51,12( 1 15+ 1 12) = 2,89 𝑇𝑐𝑟í𝑡𝑖𝑐𝑜 (𝑔𝑙 = 25) = 2,05954 Conclusão 2: Rejeitamos, ao nível de 5%, de que as médias populacionais das quantidades produzidas de celulose, relativas aos 2 (dois) procedimentos, sejam iguais. Exercício 2: Um estudo de dois tratamentos para evitar a corrosão de elementos metálicos em conjunto com a madeira está sendo testado para desacelerar a degradação da madeira na qual está embutido. Foram usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão eliminada). Qual seria a conclusão sobre os dois tratamentos? Tratamento Amostra Média Desvio Padrão A 15 48 10 B 12 52 15 46 Teste sobre duas Médias: População aproximadamente normal e amostras dependentes ℎ𝑜 ∶ µ𝑑 =0; ℎ1: µ𝑑 ≠ 0, > 0 𝑜𝑢 < 0) 𝐸𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑡𝑒𝑠𝑡𝑒 𝑇 = 𝑑̅ − µ𝑑 𝑠𝑑 √𝑛 ~ 𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = = (n-1). Notação: µ𝑑 = média das diferenças d para a população de dados emparelhados; 𝑑̅ = valor médio das diferenças d para os dados amostrais emparelhados; 𝑠𝑑 = desvio padrão das diferenças d para os dados amostrais emparelhados; n= número de pares de dados Exercício 1: Número de espécies de fungos de 9 árvores antes e depois do tratamento Antes Depois d 77 80 3 62 58 -4 61 61 0 80 76 -4 90 79 -11 72 69 -3 86 90 4 59 51 -8 88 81 -7 47 Faça o teste, e conclua sobre a eficácia do tratamento (α=5%). ℎ𝑜 ∶ µ𝑑 =0; ℎ1: µ𝑑 ≠ 0 𝑇𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑑̅−µ𝑑 𝑠𝑑 √𝑛 = −30 5 √9 = −17,96 𝑇𝑐𝑟í𝑡𝑖𝑐𝑜(8) = −2,30 Conclusão: rejeitamos ℎ𝑜 ∶ µ𝑑 =0. O tratamento é eficaz. Exercício 2: Cinco operadores de certo tipo de máquina utilizada no beneficiamento de madeira são treinados em máquinas de duas marcas diferentes, A e B. Mediu-se o tempo que cada um deles gasta na realização de uma mesma tarefa, e os resultados estão no quadro abaixo. Operador Marca A Marca B 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78 Com o nível de significância de 10%, podemos afirmar que a tarefa realizada na máquina A demora mais do que na máquina B? 48 ● Os tratamentos quantitativos: Análise de Regressão (27-04-2021) OBS: Tratamentos- qualitativos ou quantitativos; quantitativos -associados com pontos numa escala numérica; Exemplos- temperatura, tempo, pressão, etc... ; Qualitativos- não é baseado em quantificação, não podem ser ordenados de acordo com a magnitude (ordem de grandeza) Exemplos- tipo de material, variedade, etc... . Uso da Análise de Variância- no caso de experimentos com tratamento quantitativos não é correto. EX: Dados de um experimento inteiramente ao acaso de doses de um mesmo adubo e crescimento de um cultivar Tratamento A B C D E 3 5 8 9 12 4 9 10 13 11 8 13 12 17 16 Suponha na tabela abaixo que A, B, C, D e E, representam estas quantidades. Aplicando a análise de variância relativa ao modelo 𝑦𝑖𝑗 = µ + 𝛼𝑖 + €𝑖𝑗 , ao nível de 5%, temos: 49 Causas da GL SQ QM F variação Tratamentos 4 132 33 3,30 Resíduo 10 100 10 Total 14 232 F= ∑ 𝑛𝑖(𝑦̅𝑖− 𝑦̿)2 /(𝑘−1) 𝑘 𝑖 ∑ ∑ (𝑦𝑖𝑗−𝑦̅𝑖) 2 𝑛𝑖 𝑗=1 𝑘 𝑖=1 /(𝑛−𝑘) = 𝑆𝑄𝑇𝑅/(𝑘−1) 𝑆𝑄𝐸/(𝑛−𝑘) = 𝑀𝑆𝑅 𝑀𝑆𝐸 (pág 2) F (crítico)= F(4,10)= 3,48 ⇒ não se rejeitaria a hipótese de que os tratamentos são, em média, iguais. Porém, se os tratamentos fossem qualitativamente diferentes, p.ex, esta análise estaria correta. Os tratamentos A, B, C, D e E são, no entanto, quantitativamente diferentes, isto é, correspondem às doses 1,2, 3,4, e 5 do mesmo adubo. A análise de variância não capta esta última informação. Uso da Análise de Regressão ( x-dose, y-crescimento) y x 3 1 4 1 8 1 5 2 9 2 13 2 50 8 3 10 3 12 3 9 4 13 4 17 4 12 5 11 5 16 5 Causas da GL SQ QM F variação Tratamentos 1 120 120 13,92 Resíduo 13 112 8,62 Total 14 232 O valor calculado (F=13,92) é significante ao nível de 5%. Conclui-se então que a dose de adubo (x) afeta o crescimento do cultivar (y), isto é, aumenta a dose, aumenta o crescimento (coeficiente angular (b=2)) 51 Mais resultados da regressão: Bioestat. Variável dependente = Coluna 1 Variável independente= Coluna 2 Média (X) = 3.0000 Média (Y) = 10.0000 Coef. de Determinação (R2) = 0.5172 R2 (ajustado) = 0.4801 Coeficiente de Correlação = 0.7192 Intercepto (a) = 4.0000 t = 2.2505 p = 0.0423 Coef. de Regressão (b) =2.0000 t = 3.7321p = 0.0025 IC 95% (a) 0.161 a 7.839 IC 95% (b) 0.842 a 3.158 Equação Y' = a + bX 52 ● Métodos de Amostragem Existe vários Métodos de Amostragem utilizados nas Ciências Florestais. Todos têm como objetivo gerar informações sem viés e com a maior precisão possível. Métodos de Amostragem utilizados nas Ciências Florestais. São métodos objetivos (sem interferência das pessoas que os utilizam) e imparciais. Todas unidades da população possuem uma certa chance de serem selecionadas na amostra. Esta chance é conhecida e é diferente de zero. Para estes métodos seremos capazes de calcular a precisão de uma dada estatística para representar o parâmetro da população. · Amostragem Aleatória Simples · Amostragem Aleatória Estratificada · Amostragem Sistemática · Amostragem por conglomerados e Em Múltiplos estágios Amostragem Aleatória Simples (AAS) Uma amostra de um dado tamanho tem a mesma chance de ser selecionada que qualquer outra amostra possível de mesmo tamanho. Exemplo Clássico: Bolas de mesmo tamanho, peso, superfície, etc., numa urna. Qualquer amostra de 3 bolas tem exatamente a mesma chance de ser obtida. O PROCESSO ALEATÓRIO de seleção das unidades elimina qualquer interferência de escolha humana na escolha dos elementos da amostra. Tabela de números aleatórios As propriedades da Tabela de Números Aleatório implicam que: 53 · Qualquer par de dígitos tem a mesma chance de ser um dos 100 possíveis pares: 00, 01, . . . , 99. · Qualquer trio de dígitos tem a mesma chance de ser um dos 1000 possíveis trios: 000, 001, . . . , 999. · Qualquer . . . Como utilizar Números Aleatórios numa Amostragem? Terminologia N (maiúsculo) denota o tamanho da população. n (minúsculo) denota o tamanho da amostra. A) Rotular todas N unidades da população: 1. Designar cada unidade na população por um rótulo composto de dígitos. 2. Sempre utilizar o menor número possível de dígitos nos rótulos: Para 10 ou menos unidades, utilizar rótulos de um dígito: 0, 1, . . . , 9. Para mais de 10 e menos de 100, utilizar dois dígitos nos rótulos: 00, 01, . . . , 99. 3. Todos os rótulos devem possuir o mesmo número de dígitos. 4. Cada unidade deve ser designada pelo mesmo número de rótulos B) Selecionar uma amostra de tamanho n: 1. Iniciar num ponto aleatório da Tabela de Números Aleatórios. 2. Ler os rótulos sistematicamente seguindo as linhas ou colunas da Tabela. 3. Se um rótulo já lido surgir novamente ou se aparecer um rótulo que não está presente na população, ignorá-lo e seguir para o próximo. 54 4. Continuar até que n unidades sejam selecionadas. Exercício 1: Realizar uma amostra aleatória simples de tamanho 4 dos fragmentos. Estimar a média, mediana e o desvio padrão populacional. Fragmento – Rótulo - Área (ha) Fazenda Santa Rita (Fragmento) 01(Rótulo) 35 (Área) Fazenda Santa Rita 2 02 2 Piraquera 03 17 Fazenda Sertão 04 10 Fazenda Água Clara 05 19 Fazenda Tijuco Preto 06 4 Fazenda Dona Zilma 07 40 Sítio Arueira 08 1 Fazenda Água Funda 09 7 Sítio Santa Clara 10 9 Sítio Santo Antônio 55 11 12 Fazenda Conceição 12 10 Sítio do Bento 13 18 Fazenda Pau Queimado 14 34 Fazenda Gibeira 15 21 56 Linhas Colunas 1 2 3 4 5 6 7 8 9 10 1 37330 53935 13353 39148 90771 13159 33960 06997 84693 46795 2 10556 08243 70946 57339 72234 59692 52999 93494 95782 09651 3 45811 96068 33049 45243 27243 94492 67854 01933 75224 77355 4 73736 58198 34805 92339 46743 87758 53546 91205 20339 80666 5 17223 12221 61507 77114 72285 69923 05809 06493 97064 46339 6 81548 95763 83937 91219 01721 17329 93669 60293 03667 21710 7 90216 94892 06615 01442 53108 21428 83671 71161 47712 73850 8 00764 91156 09068 03279 05814 60628 50454 75238 85013 03935 9 20759 16044 24367 90989 46036 74737 77971 76094 96855 71792 10 42933 66329 75711 94739 36532 97440 27111 15222 30748 68995 11 90227 25813 47260 18871 32378 83526 45759 91977 17721 94625 12 43376 01076 85915 30545 47255 04452 24526 77645 13186 42302 13 63024 89093 09505 22752 03459 61945 92030 77252 68334 14381 14 57417 62107 69764 44870 58163 36237 50600 19644 17087 57247 15 42252 61257 07265 89677 80135 78227 41473 70922 67684 39150 16 78009 80035 01594 31923 16715 13916 58606 83282 25382 04772 17 38594 79867 81298 27956 23186 58969 40255 53449 06430 02044 18 61166 10972 89696 72737 74575 33628 07724 09325 55122 03607 19 96847 09658 78425 27341 01678 72410 07312 18256 14849 41021 20 96233 37435 02304 86004 36919 34869 36691 05771 70516 23301 21 96723 28815 56751 06769 79709 94181 64349 87804 51772 20745 22 83778 80486 07191 27820 12450 50519 12220 01604 42242 30684 23 81870 45840 40560 06232 48136 70977 79352 60376 65229 78414 24 79836 38814 35247 52688 54767 59184 09034 45814 08280 11287 25 87161 71681 12125 66883 61697 17181 54093 56464 11199 07275 26 87783 75633 05979 57992 39071 52546 62850 73274 29428 35256 27 08119 21105 09347 34139 56304 12470 98466 22863 62609 36216 28 18922 09414 30267 31239 05542 90793 48181 04769 37248 31929 29 17629 55417 41930 85312 67452 19141 27944 78229 88922 66229 30 85876 53986 94018 97123 26576 85913 14366 63907 19704 24935 31 39992 84306 70490 49481 78479 81102 99329 90414 53003 74881 32 41986 50658 70507 53404 25900 28854 61275 59667 51324 67022 33 99382 46409 04296 92514 19794 81119 23260 64028 61763 50013 34 72215 07414 94276 26246 50979 22571 64260 32572 97833 10481 35 35633 43596 50301 44167 92491 03588 41259 10595 59500 78197 36 88312 90675 83843 39813 81547 56037 85139 86009 98724 00114 37 97936 08967 06297 90721 11649 00469 90058 19169 42794 65151 38 70453 97653 82137 31617 82240 78879 99752 33814 27956 00884 39 13199 73340 29241 96338 78479 01993 83968 45405 24145 99657 40 86790 40381 32919 51971 02988 45995 01324 43030 76348 11470 41 64480 68876 88985 23621 77087 38588 90692 19155 47371 14490 42 68173 57677 77372 71297 77786 48919 69894 25420 45816 11371 43 03398 42731 22387 81826 28712 38888 20897 85387 09919 27589 44 92656 62471 96454 40858 51211 86127 24676 84158 09159 52302 45 03659 61742 79474 10843 48114 15666 38553 05251 47571 80037 57 Amostragem Aleatória Estratificada (AAE) População dividida em “grupos mais homogêneos”. Em cada grupo se faz uma AAS. Combina-se as ASS de cada grupo numa única amostra Menor variabilidade entre amostras da população. Maior precisão na amostragem. A população é subdivida em grupos mutuamente exclusivos chamados ESTRATOS. Uma AAS é tomada dentro de cada estrato, e as estimativas dos estratos são combinadas. Como os grupos são mutuamente exclusivos, cada unidade da população pertence a um único estrato. Se os estratos forem internamente mais homogêneos que a população em termos da variável que está sendo medida, a AAE será mais precisa que a AAS. Estimadores: a) 𝑋̅ = 1 𝑁 ∑ 𝑁𝑖𝑋̅𝑖 𝑘 𝑖=1 b) 𝑉̂(𝑋̅) = ∑ ( 𝑁𝑖 𝑁) 2 𝑘 𝑖=1 ( 𝑁𝑖−𝑛𝑖 𝑁𝑖 ) 𝑠𝑖2 𝑛𝑖 Exercício 2: Produção em floresta plantada. Estrato (área- ha) 𝑁𝑖 𝑛𝑖 𝑥̅𝑖 𝑠𝑖2 1 a 10 7 4 1,6 3,3 11 a 20 4 2 2,8 4,0 21 a 40 4 2 2,5 2,2 Total 15 8 - - 58 a) Estimar a média populacional b) Desvio padrão populacional c) Construir o intervalo de confiança para Amostragem sistemática(AS) Inicialmente, as unidades da população são colocadas numa certa ordem.. Para uma amostra sistemática de “1-em-cada-k- unidades”, você primeiro seleciona aleatoriamente uma das k primeiras unidades. A partir da unidade selecionada toma-se sempre a k-ésima unidade. NOTE: somente a primeira unidade é selecionada aleatoriamente, todas as demais são tomadas sistematicamente. Amostragem por conglomerados(AC) P,ex. se as fazendas são as unidades da população então um grupo de fazendas seria um conglomerado- seleciona-se o conglomeradao. Amostragem em Múltiplos Estágios (AME) Como o nome sugere, na amostragem em múltiplos estágios o processo de amostragem aleatória é repetido em vários estágios hierarquizados. Em cada estágio, qualquer um dos métodos de amostragem discutidos pode ser utilizado. EX: Levantamento Regional O DPRN (Departamento de Proteção dos Recursos Naturais) do Estado de São Paulo deseja realizar um levantamento rápido para diagnosticar a situação dos fragmentos florestais em todo Estado. Qual a melhor forma de amostrar? Estado de São Paulo 59 1o. ESTÁGIO Quadrículas do IBGE dentro do Estado (AAS) 2o. ESTÁGIO Fragmentos dentro de Quadrículas (AAE por tamanho) 3o. ESTÁGIO Parcelas dentro de Fragmentos dentro de Quadrículas (AS)
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
34
Questões - R - 2023-2
Estatística Experimental
UFRRJ
3
Questões - 2024-1
Estatística Experimental
UFRRJ
1
Lista 1 - Teste de Hipóteses - 2023-2
Estatística Experimental
UFRRJ
1
Questão - Teste de Hipóteses - 2023-2
Estatística Experimental
UFRRJ
1
Lista 4 - Estatística Experimental - 2024-1
Estatística Experimental
UFRRJ
3
Exercício - 2023-2
Estatística Experimental
UFRRJ
1
Exercício - Teste T - Estatística Experimental 2023 1
Estatística Experimental
UFRRJ
3
P1 - Estatística Experimental 2021 2
Estatística Experimental
UFRRJ
2
Lista - 2023-2
Estatística Experimental
UFRRJ
7
Questões - 2023-2
Estatística Experimental
UFRRJ
Texto de pré-visualização
1 m Estatística Experimental 2021-2 Módulo I Roteiro (revisão); previsão de alguns acréscimos durante a exposição. ●População-Conjunto de quaisquer elementos (valores, pessoas, objetos, etc... .). ● Amostra-É um subconjunto de uma população. ● Amostra aleatória- ● Estatística descritiva- ● Estatística inferencial- ●Estudo observacional- verificamos e medimos características específicas, não tentamos modificar os elementos a serem estudados. Ex: Local da floresta onde os passáros se alimentam. Estação do ano Árvores Arbusto Chão Total Primavera 30 20 9 59 Outono 13 22 26 61 Total 43 42 35 120 Fonte: 2 Dado que estamos na primavera, qual a proporção dos que se alimentam no chão? Dado que os pássaros se alimentam no arbusto, qual a proporção na primavera? ●Estudo experimental- Aplicamos determinado tratamento e passamos, então a observar seus efeitos sobre a variável dos elementos a serem estudados. Ex 1: Comparação do peso de 4(quatro) variedades (tratamento) de uma planta (experimento inteiramente ao acaso ou inteiramente casualizado); Esquema do experimento. Sorteio aleatório das variedades nas 20 parcelas; Princípio da repetição + aleatorização. A B C D 31 24 59 54 23 19 74 46 22 42 43 61 45 33 42 37 29 33 57 52 Modelo matemático: 𝑦𝑖𝑗 = µ + 𝛼𝑖 + Є𝑖𝑗 F= ∑ 𝑛𝑖(𝑦̅𝑖− 𝑦̿)2 /(𝑘−1) 𝑘 𝑖 ∑ ∑ (𝑦𝑖𝑗−𝑦̅𝑖) 2 𝑛𝑖 𝑗=1 𝑘 𝑖=1 /(𝑛−𝑘) = 𝑆𝑄𝑇𝑅/(𝑘−1) 𝑆𝑄𝐸/(𝑛−𝑘) = 𝑀𝑆𝑅 𝑀𝑆𝐸 A C D C A B D A B C D A B D B B C D C A 3 Modelo matemático (experimento em blocos ao acaso): 𝑦𝑖𝑗 = µ + 𝛼𝑖 + ℬ𝑖 + Є𝑖𝑗 Hipóteses: Ex 2: Comparação do efeito de 3 (adubos), A, B e C, sobre o crescimento de algum tipo de arbusto. Exercício: Uma pesquisadora deseja estimar o tamanho da população de FUNÁRIOS RUFUS (João de Barro) em uma localidade. Num primeiro levantamento, a pesquisadora capturou 31 pássaros e marcou a todos com uma anilha. No segundo, capturou 47 pássaros dos quais 12 tinham a anilha referente ao primeiro levantamento. Qual a estimativa do tamanho da população de FUNÁRIOS RUFUS nessa localidade? ● Tipos de variáveis Qualitativa Quantitativa Nominal: Espécies de arbóreas numa floresta; Classificação dos solos. Discreta: Nº de árvores com fungo(s) em uma amostra de 10. Ordinal: Julgamentos do tipo: Bom/médio/ruim; Resistência à ferrugem. Contínua: Taxa de mortalidade das árvores xє(0,1); Ângulo de dispersão das sementes de Ipê roxo. 4 ● Medidas associadas a variáveis quantitativas e gráficos Percentis- divide uma série de dados em 100 grupos (1% cada grupo). Posição (ordem) do percentil de ordem K: L= ( 𝐾 100) × 𝑛 + 0,5 Ex: 1 2 3 4 5 K=50-L=( 50 100) × 5 + 0,5 =3º valor da série ordenada ►𝑃50=3 (percentil de ordem 50)=mediana;𝑃25 = 1,75(1º𝑞𝑢𝑎𝑟𝑡𝑖𝑙);𝑃75 = 4,25(3º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙). Limites de discrepância: 𝑃25- 1,5(𝑃75 − 𝑃25); 𝑃75 + 1,5(𝑃75 − 𝑃25) Valores discrepantes ou outliers: < 𝑃25- 1,5(𝑃75 − 𝑃25); > 𝑃75 + 1,5(𝑃75 − 𝑃25) Diagrama em caixas (Box Plot): Ex 1: 1 2 3 4 5 5 Fonte: BioEstat 5.3 Comentários: Para revelar tendências centrais, dispersão, tipo de distribuição e a presença de outliers (valores extremos). Exercício : Elaborar o Box Plot do Ex 1, 6 A B C D Comentar: Assimetria: 𝑥̅ < mediana<moda ►assimétrica negativa 𝑥̅ = mediana = moda ►simétrica moda< mediana< 𝑥̅ ►assimétrica positiva 7 Aproximadamente simétrica Gráfico ramo – e – folhas: Exercício 1: Crescimento médio de um cultivar em 33 regiões agrícolas. 81 94 116 108 74 79 101 87 93 105 109 93 106 103 100 93 100 78 101 101 95 90 94 90 91 92 100 87 89 90 89 86 85 Solução: Para fazer o ramo- e- folhas, começamos com uma linha vertical ou horizontal com a seguinte escala: Divide-se cada valor por 10 (10 gramas por classe) a partir de 74g. O ramo será a parte inteira e as folhas a fracionária (Boxplot: abrir planilha, clicar em: gráficos, caule e folhas,>>; marcar: Unidade; 2 linhas e exibir diagrama. 8 CAULE FOLHA Escores = 33 1 7 4 2 7 8 9 1 8 1 6 8 5 6 7 7 9 9 10 9 0 0 0 1 2 3 3 3 4 4 1 9 5 7 10 0 0 0 1 1 1 3 4 10 5 6 8 9 0 11 1 11 6 Exercício 2: Construir a representação Ramo e Folhas para o experimento, abaixo. Suponhamos um experimento para decidir sobre a eficácia de 2 tipos de adubo A e B em relação ao crescimento de um cultivar. Cada um aplicado a 18 e 21 cultivares, respectivamente. Adubo A Adubo B 45 60 54 57 55 58 62 55 70 50 52 59 38 48 64 59 55 56 55 56 55 61 52 53 54 59 48 57 57 50 65 55 60 55 58 54 - - - 59 51 56 9 Somatório: Exercício: Mostrar: ∑ (𝒙𝒊 − 𝒚𝒊) = ∑ 𝒙𝒊 𝒏 𝒊=𝟏 − ∑ 𝒚𝒊 𝒏 𝒊=𝟏 𝒏 𝒊=𝟏 Aplicar: X =( 3,4,1,4,3,3,2) é o número de brotos por cepa de eucalipto; Y=( 10,1 11,1 10,7 13,1 14,5, 13,5 12,5) é a altura das cepas. (1) Variância e (2) Desvio padrão: média e raiz quadrada das distâncias de cada valor da série em relação à média, respectivamente. (1) Populacional:𝝈𝟐 = ∑ (𝑿𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝑵 ; (1) Amostral: 𝒔𝟐 = ∑ (𝒙𝒊−𝒙̅)𝟐 𝒏 𝟏 𝒏−𝟏 ; (2) Desvio Padrão Populacional: 𝝈 = √∑ (𝒙𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝑵 ; (2) Desvio Padrão Amostral: √∑ (𝒙𝒊−µ)𝟐 𝑵 𝒊=𝟏 𝒏−𝟏 . Comentários: Exercício1: Determinar o peso médio e a variância de uma cana de certa variedade no canavial de uma usina de uma amostra aleatória, em diversos pontos da lavoura. Pesos em quilogramas, como mostrado a seguir: 1,58 1,32 1,76 1,51 1,38 1,55 1,71 1,54 1,50 1,67 𝑥̅ = 1,55; 𝑆2 = 24,26 − 240,87 10 9 = 0,02 10 Exercício 2: Mostrar que 𝒔𝟐 = ∑ (𝒙𝒊−𝒙̅)𝟐 𝒏 𝒊=𝟏 𝒏−𝟏 = ∑ 𝑥2− (∑ 𝑥𝑖 𝑛 𝑖=1 )2 𝑛 𝑛 𝑖=1 𝑛−1 Exercício 3: Suponhamos um experimento para decidir sobre a eficácia de 2 tipos de adubo A e B em relação ao crescimento de um cultivar. Cada um aplicado a 18 e 21 cultivares, respectivamente. Adubo A Adubo B 45 60 54 57 55 58 62 55 70 50 52 59 38 48 64 59 55 56 55 56 55 61 52 53 54 59 48 57 57 50 65 55 60 55 58 54 - - - 59 51 56 a) Para verificar a homogeneidade das duas populações, um pesquisador sugeriu que se usasse o quociente 𝐹 = 𝑣𝑎𝑟(𝑋/𝐴) 𝑣𝑎𝑟(𝑋/𝐵) , mas não disse qual decisão tomar baseado nesse valor. Que regra de decisão você adotaria? b) Faça um box plot para os dados referentes aos adubos A e B. Compare os dois conjuntos de dados por meio desses desenhos. c) Para decidir se os resultados dos dois adubos são semelhantes ou não, adotou-se o seguinte teste: sejam 11 𝑡 = 𝑥̅𝐴 − 𝑥̅𝑏 𝑆𝑝√ 1 𝑛𝐴 − 1 𝑛𝐵 , 𝑆𝑝 = (𝑛𝐴 − 1)𝑣𝑎𝑟(𝑋/𝐴) + (𝑛𝐵 − 1)𝑣𝑎𝑟(𝑥/𝐵) 𝑛𝐴 − 𝑛𝐵 − 2 𝑛𝐴 𝑒 𝑛𝐵, 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎𝑠 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠. Caso |𝑡| <2, os resultados são semelhantes, caso contrário, são diferentes. Qual seria a sua conclusão? 12 ● Alguns conceitos de probabilidade Experimento Aleatório- apresenta mais de um resultado possível. EX 1: O nº de árvores com cancro numa floresta de eucalipto (seleção, p.ex, de 10 árvores); EX 2: A produtividade de diferentes áreas de floresta de Pinus que receberam adubação; EX 3: As espécies de aves que são capturadas numa rede de uma floresta nativa; EX 4: Face, voltada para cima, no lançamento de uma moeda 3 vezes. Espaço amostral (S)- conjunto dos resultados possíveis de um experimento aleatório. EX 1: S=(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10); EX4:S=(ca,ca,ca; ca,ca,co; ca,co,ca; co,ca,ca; ca,co,co; co,ca,co; co,co,ca; co,co,co). ca=cara; co=coroa Evento A,B... .)- subconjunto de um espaço amostral. EX 1: A=(2,5,9 ); EX 2: B= (Prod/Prod≥0). Prod=Produtividade. Obs- se o resultado é um elemento de A, dizemos que o evento A ocorre. Eventos mutuamente exclusivos ou excludentes- não podem ocorrer mesmo tempo. OBS1: Complementar de A=𝑨̅ A e B são complementares se P(A) + P(B) = P(S) = 1 13 Conceito de probabilidade- é um nº P є [ 0, 1], associado a ,ocorrência de um evento. i) 0 ≤ P(A) ≤ 1; ii) P(S)= 1; iii) Se A e B são eventos mutuamente exclusivos ou excludentes, isto é, A∩B=Φ, então P(AUB)= P(A) + P(B). Obtenção da probabilidade- conceito frequencial ou empírico- P(A)= 𝑁º 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝐴 𝑛º 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠 𝑑𝑜 𝑒𝑟𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜; conceito clássico- P(A)= 𝑁º 𝑑𝑒 𝑚𝑎𝑛𝑒𝑖𝑟𝑎𝑠 𝑐𝑜𝑚𝑜 𝐴 𝑝𝑜𝑑𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑛º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑆 . Lei dos grandes números- se repetimos um experimento um grande nº de vezes, a probabilidade pela frequência relativa (conceito frequencial) de um evento tende para a probabilidade teórica (conceito clássico). Regra da Adição (06-04-2021) P (A ou B) = P (ocorrência de A, ou B, ou ambos) P(AUB)= P(A)+P(B) – P(A∩B) P(A∩B) P(A) P(B) Ss Definição: Os eventos A e B dizem-se mutuamente excludentes ou exclusivos se não podem ocorrer simultaneamente. AA 14 P(AUB)= P(A)+P(B) P(A) P(B) Probabilidade condicional- A BBB B P(A/B)= 𝑃(𝐴∩B) 𝑃(𝐵)>0 EX: Num levantamento em floresta de Pinus oocarpa (espécie de pinheiro) foram observadas 830 árvores, segundo a tabela abaixo: Idade Bifurcada (C) Tortas Rabo de raposa Sem defeito Total Jovem (B) 24 91 78 181 374 Madura (A) 36 74 76 270 456 Total 60 165 154 451 830 15 Calcular: a) P(AUB)=P(A)+P(B) - P(A∩B) = 456 830 + 374 830 − 0 0 = 1 ; P(A/B) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) = 0 0,451 = 0; P(C/A) = 𝑃(𝐶∩𝐴) 𝑃(𝐴) = 36 830 456 830 = 0,079 Eventos independentes: Sejam A e B eventos de S. Intuitivamente, A e B são independentes ►P(A/B) = P(A) e P(B/A)= P(B). Exercício 1: Sejam A e B eventos tais que P(A)=0,2, P(B)=p e P(AUB)= 0,6. Calcular p considerando A e B: a) Mutuamente exclusivos; P(AUB)= P(A) + P(B) ⇒ 0,6 = 0,2 + p ⇒ p= 0,4 b) Independentes. P(AUB) = P(A) + P(B) - P(A).P(B) ⇒ 0,6 = 0,2 + p - 0,2p ⇒ P=0,5. Exercício 2: Uma empresa de consultoria participa de duas concorrências para realizar estudos de impacto ambiental. A probabilidade de vencer a primeira concorrência é de 50% e de vencer a segunda é de 70%, enquanto que a probabilidade de vencer ambas concorrências é 40%. A= (vence a 1ª concorrência); B=(vence a 2ª concorrência) C=(vence ambas as concorrências). Qual a probabilidade de vencer a segunda concorrência dado que ela venceu a primeira? P(B/A) = 𝑃(B∩A) 𝑃(𝐴) = 𝑃(𝐶) 𝑃(𝐴) = 0,4 0,5 =0,8 OBS: A e B são eventos independentes se P(A∩B) = P(A). P(B) Teorema de Bayes- Partição de um espaço amostral S (i=1,2,3,4) se: Ai∩Aj=Ǿ, B é um evento arbitrário. 16 A4 B B= A1∩B U A2∩B U A3∩B U A4∩B; P(B)= P(A1∩B) + P (A2∩B) + P(A3∩B) + P(A4∩B); P(B/A1)= 𝑃(𝐴1∩𝐵) 𝑃(𝐴1) ► P(A1∩B)=P(A1).P(B/A1); P(A1/B)= 𝑃(𝐴1∩𝐵) 𝑃(𝐵) = P(A1).P(B/A1) ∑ P(Ai).P(B/Ai) 4 𝑖=1 . Sejam A1, A2,............,An eventos que formam uma partição de S. Seja B contido em S. Sejam conhecidas P(Ai) e P(B/Ai), i=1,.....n. Então: 𝑃(𝐴𝑗/𝐵)= 𝑃(𝐴𝑗.𝑃(𝐵/𝐴𝑗) ∑ 𝑃(𝐴 𝑛 𝑖=1 𝑖).𝑃(𝐵/𝐴𝑖) j=1,......,n Exercício 1: Em uma madeireira, 3 máquinas M1, M2 e M3 produzem 30%, 45% e 25%, dos produtos, respectivamente. Sabe-se por experiências anteriores, que 2%, 3% e 2% dos produtos feitos por cada máquina são, respectivamente defeituosos. Suponha que um produto, já acabado, seja selecionado aleatoriamente. a) Qual é a probabilidade de que tal produto apresente algum defeito? b) Qual a probabilidade que seja da máquina M1, dado que é defeituoso? A1 A3 A2 17 B=D=(o produto está fora da especificação); A1=M1( o produto é proveniente da máquina1), A2=M2 (idem máquina 2), A3 = M3 (idem máquina 3). D D= M1∩D U M2∩D U M3∩D; P(D)= P(M1∩D) + P (M2∩D) + P(M3∩D); P(D/M1) = 𝑃(𝑀1∩𝐷) 𝑃(𝑀1) - P(M1∩D)=P(M1).P(D/M1); P(D/M2) = 𝑃(𝑀2∩𝐷) 𝑃(𝑀2) - P(M2∩D)=P(M2).P(D/M2); P(D/M3) = 𝑃(𝑀3∩𝐷) 𝑃(𝑀3) - P(M3∩D)=P(M3).P(D/M3). P(D)= P(M1). P(D/M1) + P(M2). P(D/M2) + P(M3). P(D/M3) a) P(D)= 0,30 x 0,02 + 0,45 x 0,03 + 0,25 x 0,02 = 0,02450. b) P(M1/D) = 𝑃(M1∩D) 𝑃(𝐷) = 0,30× 0,02 0,02450 = 0,24490 Exercício 2: Uma água é contaminada se forem encontrados bacilos tipo A e/ou bacilos tipo B e C simultaneamente. As probabilidades de se encontrarem bacilos tipo A, B e C são, respectivamente, 0,30; 0,20 e 0,80. Existindo bacilos tipo A não existirão bacilos tipo B. Existindo bacilos tipo B, a probabilidade de existirem bacilos tipo C é reduzida à metade. Calcular: M1 M2 M3 18 a) P(BUC); b) P(água ser contaminada); c) P(B/água contaminada). ● Variável aleatória X- é uma função que associa a cada, elemento de um espaço amostral um número real. EX1: Considere uma amostra de três árvores para verificar a ocorrência de cancro. Então: S= (𝑐𝑐𝑐, 𝑐𝑐𝑐,̅ 𝑐𝑐 ̅𝑐, 𝑐̅𝑐𝑐, 𝑐𝑐̅𝑐̅, 𝑐̅𝑐𝑐̅, 𝑐̅𝑐̅𝑐, 𝑐̅𝑐̅𝑐̅) 𝑐 - cancro; 𝑐̅ – não cancro Seja X o número de árvores com cancro. 𝑋(𝑐𝑐𝑐) = 3; 𝑋(𝑐𝑐𝑐̅) = 2; 𝑋(𝑐𝑐̅𝑐) = 2; 𝑋(𝑐̅𝑐𝑐) = 2; 𝑋(𝑐𝑐̅𝑐̅) = 1; 𝑋(𝑐̅𝑐𝑐̅) = 1; 𝑋(𝑐̅𝑐̅𝑐) = 1; 𝑋(𝑐̅𝑐̅𝑐̅) = 0 Distribuição de probabilidade de X X 𝑋2 P(X) 0 0 1/8 1 1 3/8 2 4 3/8 3 9 1/8 Total - 1 p=1/2, n=3; E(X) – Valor Esperado de X, Expectância de X E(X)= ∑ 𝑋. 𝑃(𝑋)= (0×1/8)+ (1×3/8)+ (2×3/8) +(3×1/8)=1,5. V(X)= E(𝑋2) – (𝐸(𝑋)) 2 = (0×1/8)+ (1×3/8) + (4×3/8) +(9×1/8)- (1,5)2 = 0,75; V(X) – Variância de X 19 APP- Probability Distributions e Calculadora Estatística (João Gondim) ● Distribuição Binomial- As probabilidades são constantes e independentes na repetição da experiência aleatória. 𝑋(𝑐𝑐𝑐̅) = 2; 𝑋(𝑐𝑐̅𝑐) = 2; 𝑋(𝑐̅𝑐𝑐) P(X=2)= 𝐶3 2 ( 1 2) 2 (1 − 1 2) 3−2 = 3/8 E(X)= np; V(X)= np(1-p); 1-p=q. P(X=x)= 𝐶𝑛𝑥(𝑝)𝑥(1 − 𝑝)𝑛−𝑥 ; X= 0,1,…… n (Função de Probabilidade de X) Exercício: Um levantamento florestal mostra que 70% das árvores selecionadas para a indústria moveleira tem diâmetros acima de 60 cm. Seleciona-se uma amostra de 8(oito) árvores. Elaborar a distribuição de probabilidade. Calcular o valor esperado, variância e desvio padrão. P(X=0) = 𝐶8 0 (0,70)0(1 − 0,70)8−0= 0,00007 Na tabela: n=8, p=0,7, x=0. P(X=1) = 𝐶8 1 (0,70)1(1 − 0,70)8−1 = 0,0012. . . . . P(X=8)= Valor esperado= E(X)= np= 8x0,70=5,6 Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68 20 P(X=1) = 𝐶8 1 (0,70)1(1 − 0,70)8−1 = 0,0012. Na tabela: n=8, p=0,7, x=1. Na APP: n= p= x=1 P(X=x)= . . . Valor esperado= E(X)= np= 8x0,70=5,6 Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68 b) Em uma amostra de 10 árvores, qual é a probabilidade de que pelo menos 3 tenham diâmetro abaixo de 60 cm ? 8 0.7 1 0.00122 21 ● MODELO PROBABILÍSTICO NORMAL Definições: 1- Variável Aleatória(v.a) Seja E um experimento e S o conjunto de todos os resultados possíveis associados ao experimento. Uma função X ,que associe a cada elemento sS um número real ,X(s) , é denominada variável aleatória. Ex. Considere o experimento de se jogar uma moeda duas vezes. Consideremos, o espaço S abaixo, associado a este experimento. S=[caracara, caracoroa, coroacara, coroacoroa]; Seja X a v.a que representa o número de caras .Daí, X(caracara)=2,X(caracoroa)=X(coroacara)=1,X(coroacoroa)=0. caracara 2 1 caracoroa 1 coroacara 0 coroacoroa Domínio(S) R x 2- Variável Aleatória Discreta e Contínua Seja X uma variável aleatória. Se o número de valores possíveis de X (contradomínio-R x) for finito ou infinito numerável, denominamos X de variável aleatória discreta. Suponha-se que o 22 contradomínio de X, seja um intervalo, isto é, X possa tomar todos os valores possíveis no intervalo, então, diremos que X é uma variável aleatória contínua. Associadas as variáveis aleatórias temos as suas funções de probabilidades. Seja X uma variável aleatória contínua. A função densidade de probabilidade (fdp), é uma função f, que satisfaz às seguintes condições: f(x) x ,0 R x, RX f x dx 1 ( ) Além disso ,definimos para qualquer c<d (em R x), P(c <X< d) = d c f x dx ( ) ,onde P representa a probabilidade de X está compreendida no intervalo (c,d). 3-O Modelo Normal (a) Definição- A variável aleatória X , que tome todos os valores reais x , com parâmetros e 2 0 tem uma distribuição normal (ou gaussiana), se sua fdp é dada por: x f x e x , 2 1 ) ( 2 2 2 ) ( 23 f(X) (b) Gráfico- X (c) Momentos- Pode-se demonstrar que: E(X)= ; V(X)= 2 ; f(x) quando x ; e são os pontos de inflexão de f(x); x= é o valor para o qual ocorre o máximo da função, isto é, f(x)= 2 1 ; f(x) é simétrica em torno de ,isto é, f( )= f( ), x x 99,73%; 3 95,45%; 2 68,27%; 3 ;0 4 3 curtose Coeficientedemomentodeassimetria 2 ,0 7979 Desviomedio A área total limitada pela curva e pelo eixo dos x é igual a 1; portanto a área sob a curva ,compreendida entre as duas coordenadas X=a e X=b, em que a<b, representa a probabilidade 24 de X estar situado entre a e b, representada por P(a<X<b). Se X tem distribuição normal, média e variância 2 ,escrevemos: X : N( , 2 ). Quando =0 e 2 =1, temos uma normal padrão ou reduzida, e escrevemos N(0,1). Se X : N( , 2 ) então a v.a Z = X , terá uma distribuição N(0,1). Aplicando o operador E(esperança matemática) à variável Z, temos. xf x dx E X ( ) ( ) E(Z)=E( X )= () ) ( E E X = = 0 0 =0 1 ) ( 1 ) ( ) ( 2 2 2 2 2 2 E X E X E Z , isto é, Z tem média 0 e variância 1. (prova-se também a normalidade). 25 3.1- Tabulação da Distribuição Normal (X : N( , 2 ). P(a<X<b)= dx e x b a 2 2 2 ) ( 2 1 A integral não pode ser calculada exatamente, e a probabilidade acima é obtida aproximadamente por métodos numéricos. No entanto ,para cada valor de e cada valor de , teríamos que obter P(a<X<b) para diversos valores de a e b. Isto pode ser contornado reduzindo a variável X nos moldes de Z, gerando desta forma a tabela para a distribuição normal padrão N(0,1), a saber: P(a<X<b)= ( ) ( ) ) ( ) ( a b b Z P a b X P a , onde representa a Função de Distribuição(fdp) da curva normal reduzida, isto é: ) ( 2 1 ) ( 2 2 z P Z dx e z z z ( ) 1 ) ( x x (z) 26 TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO z s ds e z z Z P 2 2 2 1 ( ) ) ( Z 0 1 2 3 4 5 6 7 8 9 - 3,0 0 , 0 0 1 3 0 , 0 0 1 0 0 , 0 0 0 7 0 , 0 0 0 5 0 , 0 0 0 3 0 , 0 0 0 2 0 , 0 0 0 2 0 , 0 0 0 1 0 , 0 0 0 1 0 , 0 0 0 0 - 2,9 0 , 0 0 1 9 0 , 0 0 1 8 0 , 0 0 1 7 0 , 0 0 1 7 0 , 0 0 1 6 0 , 0 0 1 6 0 , 0 0 1 5 0 , 0 0 1 5 0 , 0 0 1 4 0 , 0 0 1 4 - 2,8 0 , 0 0 2 6 0 , 0 0 2 5 0 , 0 0 2 4 0 , 0 0 2 3 0 , 0 0 2 3 0 , 0 0 2 2 0 , 0 0 2 1 0 , 0 0 2 0 0 , 0 0 2 0 0 , 0 0 1 9 - 2,7 0 , 0 0 3 5 0 , 0 0 3 4 0 , 0 0 3 3 0 , 0 0 3 2 0 , 0 0 3 1 0 , 0 0 3 0 0 , 0 0 2 9 0 , 0 0 2 8 0 , 0 0 2 7 0 , 0 0 2 6 - 2,6 0 , 0 0 4 7 0 , 0 0 4 5 0 , 0 0 4 4 0 , 0 0 4 3 0 , 0 0 4 1 0 , 0 0 4 0 0 , 0 0 3 9 0 , 0 0 3 8 0 , 0 0 3 7 0 , 0 0 3 6 - 2,5 0 , 0 0 6 2 0 , 0 0 6 0 0 , 0 0 5 9 0 , 0 0 5 7 0 , 0 0 5 5 0 , 0 0 5 4 0 , 0 0 5 2 0 , 0 0 5 1 0 , 0 0 4 9 0 , 0 0 4 8 - 2,4 0 , 0 0 8 2 0 , 0 0 8 0 0 , 0 0 7 8 0 , 0 0 7 5 0 , 0 0 7 3 0 , 0 0 7 1 0 , 0 0 6 9 0 , 0 0 6 8 0 , 0 0 6 6 0 , 0 0 6 4 - 2,3 0 , 0 1 0 7 0 , 0 1 0 4 0 , 0 1 0 2 0 , 0 0 9 9 0 , 0 0 9 6 0 , 0 0 9 4 0 , 0 0 9 1 0 , 0 0 8 9 0 , 0 0 8 7 0 , 0 0 8 4 - 2,2 0 , 0 1 3 9 0 , 0 1 3 6 0 , 0 1 3 2 0 , 0 1 2 9 0 , 0 1 2 6 0 , 0 1 2 2 0 , 0 1 1 9 0 , 0 1 1 6 0 , 0 1 1 3 0 , 0 1 1 0 - 2,1 0 , 0 1 7 9 0 , 0 1 7 4 0 , 0 1 7 0 0 , 0 1 6 6 0 , 0 1 6 2 0 , 0 1 5 8 0 , 0 1 5 4 0 , 0 1 5 0 0 , 0 1 4 6 0 , 0 1 4 3 - 2,0 0 , 0 2 2 8 0 , 0 2 2 2 0 , 0 2 1 7 0 , 0 2 1 2 0 , 0 2 0 7 0 , 0 2 0 2 0 , 0 1 9 7 0 , 0 1 9 2 0 , 0 1 8 8 0 , 0 1 8 3 - 1,9 0 , 0 2 8 7 0 , 0 2 8 1 0 , 0 2 7 4 0 , 0 2 6 8 0 , 0 2 6 2 0 , 0 2 5 6 0 , 0 2 5 0 0 , 0 2 4 4 0 , 0 2 3 8 0 , 0 2 3 3 - 1,8 0 , 0 3 5 9 0 , 0 3 5 2 0 , 0 3 4 4 0 , 0 3 3 6 0 , 0 3 2 9 0 , 0 3 2 2 0 , 0 3 1 4 0 . 0 3 0 7 0 , 0 3 0 0 0 , 0 2 9 4 - 1,7 0 , 0 4 4 6 0 , 0 4 3 6 0 , 0 4 2 7 0 , 0 4 1 8 0 , 0 4 0 9 0 , 0 4 0 1 0 , 0 3 9 2 0 , 0 3 8 4 0 , 0 3 7 5 0 , 0 3 6 7 - 1,6 0 , 0 5 4 8 0 , 0 5 3 7 0 , 0 5 2 6 0 , 0 5 1 6 0 , 0 5 0 5 0 , 0 4 9 5 0 , 0 4 8 5 0 , 0 4 7 5 0 , 0 4 6 5 0 , 0 4 5 5 - 1,5 0 , 0 6 6 8 0 , 0 6 5 5 0 , 0 6 4 3 0 , 0 6 3 0 0 , 0 6 1 8 0 , 0 6 0 6 0 , 0 5 9 4 0 , 0 5 8 2 0 , 0 5 7 0 0 , 0 5 5 9 - 1,4 0 , 0 8 0 8 0 , 0 7 9 3 0 , 0 7 7 8 0 , 0 7 6 4 0 , 0 7 4 9 0 , 0 7 3 5 0 , 0 7 2 2 0 , 0 7 0 8 0 , 0 6 9 4 0 , 0 6 8 1 - 1,3 0 , 0 9 6 8 0 , 0 9 5 1 0 , 0 9 3 4 0 , 0 9 1 8 0 , 0 9 0 1 0 , 0 8 8 5 0 , 0 8 6 9 0 , 0 8 5 3 0 , 0 8 3 8 0 , 0 8 2 3 - 1,2 0 , 1 1 5 1 0 , 1 1 3 1 0 , 1 1 1 2 0 , 1 0 9 3 0 , 1 0 7 5 0 , 1 0 5 6 0 , 1 0 3 8 0 , 1 0 2 0 0 , 1 0 0 3 0 , 0 9 8 5 - 1,1 0 , 1 3 5 7 0 , 1 3 3 5 0 , 1 3 1 4 0 , 1 2 9 2 0 , 1 2 7 1 0 , 1 2 5 1 0 , 1 2 3 0 0 , 1 2 1 0 0 , 1 1 9 0 0 , 1 1 7 0 - 1,0 0 , 1 5 8 7 0 , 1 5 6 2 0 , 1 5 3 9 0 , 1 5 1 5 0 , 1 4 9 2 0 , 1 4 6 9 0 , 1 4 4 6 0 , 1 4 2 3 0 , 1 4 0 1 0 , 1 3 7 9 - 0,9 0 , 1 8 4 1 0 , 1 8 1 4 0 , 1 7 8 8 0 , 1 7 6 2 0 , 1 7 3 6 0 , 1 7 1 1 0 , 1 6 8 5 0 , 1 6 6 0 0 , 1 6 3 5 0 , 1 6 1 1 - 0,8 0 , 2 1 1 9 0 , 2 0 9 0 0 , 2 0 6 1 0 , 2 0 3 3 0 , 2 0 0 5 0 , 1 9 7 7 0 , 1 9 4 9 0 , 1 9 2 2 0 , 1 8 9 4 0 , 1 8 6 7 - 0,7 0 , 2 4 2 0 0 , 2 3 8 9 0 , 2 3 5 8 0 , 2 3 2 7 0 , 2 2 9 7 0 , 2 2 6 6 0 , 2 2 3 6 0 , 2 2 0 6 0 , 2 1 7 7 0 , 2 1 4 8 - 0,6 0 , 2 7 4 3 0 , 2 7 0 9 0 , 2 6 7 6 0 , 2 6 4 3 0 , 2 6 1 1 0 , 2 5 7 8 0 , 2 5 4 6 0 , 2 5 1 4 0 , 2 4 8 3 0 , 2 4 5 1 - 0,5 0 , 3 0 8 5 0 , 3 0 5 0 0 , 3 0 1 5 0 , 2 9 8 1 0 , 2 9 4 6 0 , 2 9 1 2 0 , 2 8 7 7 0 , 2 8 4 3 0 , 2 8 1 0 0 , 2 7 7 6 - 0,4 0 , 3 4 4 6 0 , 3 4 0 9 0 , 3 3 7 2 0 , 3 3 3 6 0 , 3 3 0 0 0 , 3 2 6 4 0 , 3 2 2 8 0 , 3 1 9 2 0 , 3 1 5 6 0 , 3 1 2 1 - 0,3 0 , 3 8 2 1 0 , 3 7 8 3 0 , 3 7 4 5 0 , 3 7 0 7 0 , 3 6 6 9 0 , 3 6 3 2 0 , 3 5 9 4 0 , 3 5 5 7 0 , 3 5 2 0 0 , 3 4 8 3 - 0,2 0 , 4 2 0 7 0 , 4 1 6 8 0 , 4 1 2 9 0 , 4 0 9 0 0 , 4 0 5 2 0 , 4 0 1 3 0 , 3 9 7 4 0 , 3 9 3 6 0 , 3 8 9 7 0 , 3 8 5 9 - 0,1 0 , 4 6 0 2 0 , 4 5 6 2 0 , 4 5 2 2 0 , 4 4 8 3 0 , 4 4 4 3 0 , 4 4 0 4 0 , 4 3 6 4 0 , 4 3 2 5 0 , 4 2 8 6 0 , 4 2 4 7 - 0,0 0 , 5 0 0 0 0 , 4 9 6 0 0 , 4 9 2 0 0 , 4 8 8 0 0 , 4 8 4 0 0 , 4 8 0 1 0 , 4 7 6 1 0 , 4 7 2 1 0 , 4 6 8 1 0 , 4 6 4 1 0,0 0 , 5 0 0 0 0 , 5 0 4 0 0 , 5 0 8 0 0 , 5 1 2 0 0 , 5 1 6 0 0 , 5 1 9 9 0 , 5 2 3 9 0 , 5 2 7 9 0 , 5 3 1 9 0 , 5 3 5 9 0,1 0 , 5 3 9 8 0 , 5 4 3 8 0 , 5 4 7 8 0 , 5 5 1 7 0 , 5 5 5 7 0 , 5 5 9 6 0 , 5 6 3 6 0 , 5 6 7 5 0 , 5 7 1 4 0 , 5 7 5 3 0,2 0 , 5 7 9 3 0 , 5 8 3 2 0 , 5 8 7 1 0 , 5 9 1 0 0 , 5 9 4 8 0 , 5 9 8 7 0 , 6 0 2 6 0 , 6 0 6 4 0 , 6 1 0 3 0 , 6 1 4 1 0,3 0 , 6 1 7 9 0 , 6 2 1 7 0 , 6 2 5 5 0 , 6 2 9 3 0 , 6 3 3 1 0 , 6 3 6 8 0 , 6 4 0 6 0 , 6 4 4 3 0 , 6 4 8 0 0 , 6 5 1 7 0,4 0 , 6 5 5 4 0 , 6 5 9 1 0 , 6 6 2 8 0 , 6 6 6 4 0 , 6 7 0 0 0 , 6 7 3 6 0 , 6 7 7 2 0 , 6 8 0 8 0 , 6 8 4 4 0 , 6 8 7 9 0,5 0 , 6 9 1 5 0 , 6 9 5 0 0 , 6 9 8 5 0 , 7 0 1 9 0 , 7 0 5 4 0 , 7 0 8 8 0 , 7 1 2 3 0 , 7 1 5 7 0 , 7 1 9 0 0 , 7 2 2 4 0,6 0 , 7 2 5 7 0 , 7 2 9 1 0 , 7 3 2 4 0 , 7 3 5 7 0 , 7 3 8 9 0 , 7 4 2 2 0 , 7 4 5 4 0 , 7 4 8 6 0 , 7 5 1 7 0 , 7 5 4 9 0,7 0 , 7 5 8 0 0 , 7 6 1 1 0 , 7 6 4 2 0 , 7 6 7 3 0 , 7 7 0 3 0 , 7 7 3 4 0 , 7 7 6 4 0 , 7 7 9 4 0 , 7 8 2 3 0 , 7 8 5 3 0,8 0 , 7 8 8 1 0 , 7 9 1 0 0 , 7 9 3 9 0 , 7 9 6 7 0 , 7 9 9 5 0 , 8 0 2 3 0 , 8 0 5 1 0 , 8 0 7 8 0 , 8 1 0 6 0 , 8 1 3 3 0,9 0 , 8 1 5 9 0 , 8 1 8 6 0 , 8 2 1 2 0 , 8 2 3 8 0 , 8 2 6 4 0 , 8 2 8 9 0 , 8 3 1 5 0 , 8 3 4 0 0 , 8 3 6 5 0 , 8 3 8 9 1,0 0 , 8 4 1 3 0 , 8 4 3 8 0 , 8 4 6 1 0 , 8 4 8 5 0 , 8 5 0 8 0 , 8 5 3 1 0 , 8 5 5 4 0 , 8 5 7 7 0 , 8 5 9 9 0 , 8 6 2 1 1,1 0 , 8 6 4 3 0 , 8 6 6 5 0 , 8 6 8 6 0 , 8 7 0 8 0 , 8 7 2 9 0 , 8 7 4 9 0 , 8 7 7 0 0 , 8 7 9 0 0 , 8 8 1 0 0 , 8 8 3 0 1,2 0 , 8 8 4 9 0 , 8 8 6 9 0 , 8 8 8 8 0 , 8 9 0 7 0 , 8 9 2 5 0 , 8 9 4 4 0 , 8 9 6 2 0 . 8 9 8 0 0 , 8 9 9 7 0 , 9 0 1 5 1,3 0 , 9 0 3 2 0 , 9 0 4 9 0 , 9 0 6 6 0 , 9 0 8 2 0 , 9 0 9 9 0 , 9 1 1 5 0 , 9 1 3 1 0 , 9 1 4 7 0 , 9 1 6 2 0 , 9 1 7 7 1,4 0 , 9 1 9 2 0 , 9 2 0 7 0 , 9 2 2 2 0 , 9 2 3 6 0 , 9 2 5 1 0 , 9 2 6 5 0 , 9 2 7 8 0 , 9 2 9 2 0 , 9 3 0 6 0 , 9 3 1 9 1,5 0 , 9 3 3 2 0 , 9 3 4 5 0 , 9 3 5 7 0 , 9 3 7 0 0 , 9 3 8 2 0 , 9 3 9 4 0 , 9 4 0 6 0 , 9 4 1 8 0 , 9 4 3 0 0 , 9 4 4 1 1,6 0 , 9 4 5 2 0 , 9 4 6 3 0 , 9 4 7 4 0 , 9 4 8 4 0 , 9 4 9 5 0 , 9 5 0 5 0 , 9 5 1 5 0 , 9 5 2 5 0 , 9 5 3 5 0 , 9 5 4 5 1,7 0 , 9 5 5 4 0 , 9 5 6 4 0 , 9 5 7 3 0 , 9 5 8 2 0 , 9 5 9 1 0 , 9 5 9 9 0 , 9 6 0 8 0 , 9 6 1 6 0 , 9 6 2 5 0 , 9 6 3 3 1,8 0 , 9 6 4 1 0 , 9 6 4 8 0 , 9 6 5 6 0 , 9 6 6 4 0 , 9 6 7 1 0 , 9 6 7 8 0 , 9 6 8 6 0 , 9 6 9 3 0 , 9 7 0 0 0 , 9 7 0 6 1,9 0 , 9 7 1 3 0 , 9 7 1 9 0 , 9 7 2 6 0 , 9 7 3 2 0 , 9 7 3 8 0 , 9 7 4 4 0 , 9 7 5 0 0 , 9 7 5 6 0 , 9 7 6 2 0 , 9 7 6 7 2,0 0 , 9 7 7 2 0 , 9 7 7 8 0 , 9 7 8 3 0 , 9 7 8 8 0 , 9 7 9 3 0 , 9 7 9 8 0 , 9 8 0 3 0 , 9 8 0 8 0 , 9 8 1 2 0 , 9 8 1 7 2,1 0 , 9 8 2 1 0 , 9 8 2 6 0 , 9 8 3 0 0 , 9 8 3 4 0 , 9 8 3 8 0 , 9 8 4 2 0 , 9 8 4 6 0 , 9 8 5 0 0 , 9 8 5 4 0 , 9 8 5 7 2,2 0 , 9 8 6 1 0 , 9 8 6 4 0 , 9 8 6 8 0 , 9 8 7 1 0 , 9 8 7 4 0 , 9 8 7 8 0 , 9 8 8 1 0 , 9 8 8 4 0 , 9 8 8 7 0 , 9 8 9 0 2,3 0 , 9 8 9 3 0 , 9 8 9 6 0 , 9 8 9 8 0 , 9 9 0 1 0 , 9 9 0 4 0 , 9 9 0 6 0 , 9 9 0 9 0 , 9 9 1 1 0 , 9 9 1 3 0 , 9 9 1 6 2,4 0 , 9 9 1 8 0 , 9 9 2 0 0 , 9 9 2 2 0 , 9 9 2 5 0 , 9 9 2 7 0 , 9 9 2 9 0 , 9 9 3 1 0 , 9 9 3 2 0 , 9 9 3 4 0 , 9 9 3 6 2,5 0 , 9 9 3 8 0 , 9 9 4 0 0 , 9 9 4 1 0 , 9 9 4 3 0 , 9 9 4 5 0 , 9 9 4 6 0 , 9 9 4 8 0 , 9 9 4 9 0 , 9 9 5 1 0 , 9 9 5 2 2,6 0 , 9 9 5 3 0 , 9 9 5 5 0 , 9 9 5 6 0 , 9 9 5 7 0 , 9 9 5 9 0 , 9 9 6 0 0 , 9 9 6 1 0 , 9 9 6 2 0 , 9 9 6 3 0 , 9 9 6 4 2,7 0 , 9 9 6 5 0 , 9 9 6 6 0 , 9 9 6 7 0 , 9 9 6 8 0 , 9 9 6 9 0 , 9 9 7 0 0 , 9 9 7 1 0 , 9 9 7 2 0 , 9 9 7 3 0 , 9 9 7 4 2,8 0 , 9 9 7 4 0 , 9 9 7 5 0 , 9 9 7 6 0 , 9 9 7 7 0 , 9 9 7 7 0 , 9 9 7 8 0 , 9 9 7 9 0 , 9 9 7 9 0 , 9 9 8 0 0 , 9 9 8 1 2,9 0 , 9 9 8 1 0 , 9 9 8 2 0 , 9 9 8 2 0 , 9 9 8 3 0 , 9 9 8 4 0 , 9 9 8 4 0 , 9 9 8 5 0 , 9 9 8 5 0 , 9 9 8 6 0 , 9 9 8 6 3,0 0 , 9 9 8 7 0 , 9 9 9 0 0 , 9 9 9 3 0 , 9 9 9 5 0 , 9 9 9 7 0 , 9 9 9 8 0 , 9 9 9 8 0 , 9 9 9 9 0 , 9 9 9 9 1 , 0 0 0 0 27 Exercício1: Utilizando esta tabela encontre as seguintes probabilidades: a) P(Z > 1,96) = 1-P(Z ≤ 1,96)= 1- 0,9750=0,02500 b) P(Z < 1,96) = 0,9750 c) P(Z < - 1,.96) = 0,02500 ⇒APP: µ= σ= x= p(X<x)= -0.0250 -1,96 0 Z d) P( -2,50 < Z < 2,50 ) = 𝑃(𝑍 < 2,5) − 𝑃(𝑍 < −2,5) = 0,9938 − 0,0062 = 0,9876 𝑜𝑢 98,76%. 98,78% Z -2,5 2,5 APP: µ= σ= X= 𝑃(𝑋 < 𝑥)= X= 𝑃(𝑋 < 𝑥)= 0 1 -1.96 0.0250 0 0 1 2,5 0,99379 -2,5 0,00621 28 P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃(𝑋 < −2,5) = 0,99379 − 0,00621 = 0,98758 e) P( 0,50 < Z < 1,50 ) = f) P( Z < z ) = 0.75 ⇒ z = ? 0,67(tabela); 0,67449 (Probaility Distributios). g) P( -z1 < Z < z1 ) = 0.75 ⇒ z1 = ? 0,750 0,125 0,125 -z1 z1 Z 𝑃(𝑍 < −𝑧1) = 0,125 ⇒ −𝑧1 = −1,15, 𝑑𝑎í 𝑧1 =? APP: µ=0 σ=1 x= P(X<x)=0.125⇒ x=-1.15035 h) P( 0.27 < Z < z2 ) = 0.50 ⇒ z2 = ? Exercício2: A distribuição dos diâmetros de uma floresta de Pinus segue distribuição Normal com média 23 cm e desvio padrão 7 cm. Pede-se: a) Esquematize o gráfico da distribuição. b) Qual a proporção de árvores com diâmetro acima de 28cm? e) Qual a proporção de árvores com diâmetro entre 20 e 25cm? f) Qual a proporção de árvores com diâmetro entre 16 e 30cm? g) Qual a proporção de árvores com diâmetro entre 25 e 30cm? h) Se 25% das menores árvores forem cortadas, qual o diâmetro mínimo das árvores remanescentes? 29 i) Qual o diâmetro mínimo para uma árvore estar entre as 1% maiores árvores? P(X≥x)=0,01⇒P(Z≥ 𝑥−23 7 ) = 0,01 = 1 − 𝑝 (𝑍 ≤ 𝑥−23 7 ) = 0,99 ⇒ 𝑥−23 7 = 2,33 ⇒ 𝑥 = 39,31; APP: µ=23, σ=7, P(x>x)=0,01⇒x=39.284444 Exercício 3: Ao delinear um processo de fabricação para um tipo de produto de madeira, a indústria obteve na etapa inicial um resultado positivo de 16%. Isto é, 16% produtos nesta etapa são aceitáveis, e 84% são defeituosos. Selecionados 12 desses produtos, nesta etapa, qual a probabilidade de obter ao menos 1 que seja bom? Se é de grande importância obter ao menos 1 dispositivo bom para fins de teste, a probabilidade resultante é adequada? ●Distribuição amostral das médias e da variância (13-04-2021) Em uma amostra aleatória os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de elementos, de maneira que toda a amostra de tamanho n possível tenha a mesma chance de ser escolhida). Se amostras aleatórias de tamanho n (com reposição) forem tomadas de uma população com média µ e desvio padrão σ, então a distribuição amostral de 𝑋̅𝑛 tem as seguintes propriedades: 1. 𝑬(𝑿̅) = µ𝑿̅ = µ ⇒ 𝑿̅𝒏 é um estimador não não tendencioso de µ; 2. √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 (𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑒 𝑋̅) 3. 𝑿̅𝒏 ~𝑵 (µ; 𝜎 √𝑛 ); 𝑿̅𝒏 ~𝑵 (µ; 𝑠 √𝑛 ) ; 𝒏 > 𝟑𝟎 30 OBS 1: Na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal (Teorema do Limite central). OBS 2: Se o tamanho da amostra cresce ⇒ o desvio padrão da média 𝜎 √𝑛 ou erro amostral decresce. Exercício 1: Para a população P= (1, 2, 3) n=2 (com reposição), mostrar que 𝑬(𝑿̅) = µ𝑿̅ 𝒆 √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 . Amostragem sem reposição: √𝑉(𝑋̅) = 𝜎𝑋̅ = √𝑁−𝑛 𝑁−1 𝜎 √𝑛 (𝜎 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) √𝑉(𝑋̅) = 𝜎𝑋̅ = √𝑁−𝑛 𝑁 𝑆 √𝑛 (𝜎 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) Se (𝑛 ≤ 5%𝑁 ) podemos usar 𝜎 √𝑛 Para n > 5%N ⇒ usa-se o fator de correção para população finita (amostragem sem reposição). Exercício 2: Mostrar que: 𝐥𝐢𝐦 𝑵→∞ 𝜎𝑋̅ = √𝑁−𝑛 𝑁−1 𝜎 √𝑛 = √𝑉(𝑋̅) = 𝜎𝑋̅ = 𝜎 √𝑛 Comentar: Exercício 3: Seja X o número de árvores de cedro por hectare numa região de floresta tropical. Suponha que X tem média igual a 2.2 e desvio padrão igual a 1.4. Seja 𝑋̅ o número médio de árvores de cedro por hectare numa reserva de 100 ha (n=100). 31 a) Qual a distribuição de 𝑋̅ ? Desenhe um gráfico e explique. b) Qual a probabilidade do número médio de árvores de cedro por hectare na reserva seja menor do que 2? c) Qual a probabilidade de o número total de árvores de cedro na reserva ser 195? ●Distribuição amostral de proporções Seja “p” é a proporção das unidades de uma população que possui uma certa característica (proporção de “sucessos”). EXs :a) árvores com cancro uma floresta de eucalipto b ) árvores coberta por cipós numa mata c) capivaras do sexo masculino. Considere amostras aleatórias de tamanho n⇒ 1. 𝐸(𝑝̂𝑛) = 𝑝 2. 𝑉𝐴𝑅(𝑝̂𝑛) = 𝑝(1−𝑝) 𝑛 3. Para grande, n>30 ⇒ 𝑝̂𝑛 enquanto variável aleatória tem distribuição aproximadamente normal, isto é: 𝑝̂𝑛~𝑁(𝑝, 𝑝(1−𝑝) 𝑛 ) Exercício: Uma proporção de 37% dos visitantes de um parque favorece a cobrança de taxas de entrada. Uma amostra aleatória de 200 visitantes foi tomada: a) Qual é o parâmetro? 37% b) Qual é a estatística? (0,37)(200)=74 c) Qual é a probabilidade que em uma amostra de 200 visitantes pelo menos 40% favoreçam a cobrança de taxa? 32 d) 𝑃(𝑝̂𝑛 ≥ 0,40) = 1 − 𝑃(𝑝̂𝑛 < 0,40) = 1 − 𝑃 ( 𝑝̂𝑛−𝑝 √(𝑝(1−𝑝)) 𝑝 < 0,40−0,37 √(0,37)(1−0,37) 200 ) = 1 − 𝑃(𝑍 < 0,882) = 1 − 0,8106 = 0,189; APP: µ=0.37; σ=0.034; 𝑃(𝑋 > 𝑥) = 0.18879 ●1. Estimação Intervalar Média populacional: Z= 𝑋̅−µ 𝜎 √𝑛 ⇒ 𝑃 (−𝑧𝛼 2 ≤ 𝑍 ≤ 𝑧𝛼 2) = 1 − 𝛼⇒ 𝑃 (−𝑧𝛼 2 ≤ 𝑋̅−µ 𝜎 √𝑛 ≤ 𝑧𝛼 2) = 1 − 𝛼 ⇒ 𝑃 (−𝑧𝛼 2 𝜎 √𝑛 ≤ 𝑋̅ − µ ≤ 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 ⇒ 𝑃 (−𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ≤ −µ ≤ 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 ⇒ 𝑃 (𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ≤ µ ≤ 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛) = 1 − 𝛼 𝐼𝐶µ = (𝑋̅ − 𝑧𝛼 2 𝜎 √𝑛 ; 𝑋̅ + 𝑧𝛼 2 𝜎 √𝑛)⇒𝐼𝐶µ = 𝑋̅ ± 𝑧𝛼 2 𝜎 √𝑛 𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎; = 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝐸 = 𝑧𝛼 2 𝜎 √𝑛 = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛 = ( 𝑧𝛼 2𝜎 𝐸 ) 2 OBS :Se 𝑛 > 30, podemos, podemos substituir σ pelo desvio padrão 𝑠. Se n≤ 30, a população deve ter distribuição normal, e devemos conhecer σ para aplicar as fórmulas acima. Para o caso 33 de pequenas amostras (𝑛 ≤ 30) 𝑢𝑠𝑎𝑚𝑜𝑠 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡. ● A distribuição de Student Se a distribuição de uma população (é normal (aproximadamente) ⇒ então a distribuição de T= 𝑋̅−µ 𝑆 √𝑛 terá uma Distribuição de Student para todas as amostras de tamanho n. OBS 1: Na medida em que aumenta o tamanho n da amostra, a Distribuição T de Student se aproxima da Distribuição Normal padronizada. Para n> 30 as diferenças são pequenas. OBS 2: σ>1; OBS 3: E(T) = 0;OBS 4: Simétrica;OBS 5:n- 1graus de liberdade. Podemos escrever T= (𝑋̅−µ) ( 𝜎 √𝑛) √𝑆2 𝜎2 = 𝑍 √ 𝑉 (𝑛−1) , 𝑍 = 𝑋̅−µ 𝜎 √𝑛 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑜𝑟𝑚𝑎𝑙 𝑝𝑎𝑑𝑟ã𝑜 𝑒 𝑉 = (𝑛−1)𝑆2 𝜎2 𝑡𝑒𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑞𝑢𝑖 − 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑐𝑜𝑚 𝑣 = 𝑛 − 1𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒. 34 Proporção populacional: 𝐼𝐶𝑝 = 𝑝̂ ± 𝑧𝛼 2 √𝑝̂(1 − 𝑝̂) 𝑛 Distribuição amostral de 𝑆2 = ∑(𝑿𝒊−𝑿̅)𝟐 𝒏−𝟏 ~ 𝜒2(n -1), o desvio padrão amostral denotado por s, é a raiz quadrada positiva de 𝑠2, isto e, 𝑠 = √𝑠2; E(𝑆2) = 𝜎2, 𝑆2, 𝑣𝑎𝑟𝑖á𝑣𝑒𝑙 𝑎𝑙𝑒𝑎𝑡ó𝑟𝑖𝑎. Graus de liberdade – A quantidade n-1 é frequentemente chamada de graus de liberdade associados a estimativa da variância. Os graus de liberdade representam o número de pedaços independentes de informações disponíveis para o cálculo da variabilidade. Daí, ∑ (𝑥𝑖 − 𝑥̅) = 𝑛 𝑖=1 0, ⇒ o cálculo da variância amostral não envolve n independentes desvios quadrados da média 𝑥.̅ Teorema: Se 𝑆2 é a variância de uma amostra aleatória de tamanho n, retirada de uma população normal, com variância 𝜎2, então a estatística 𝜒2= (𝑛−1)𝑆2 𝜎2 = ∑ (𝑋𝑖−𝑋̅)2 𝜎2 𝑛 𝑖=1 , tem distribuição qui-quadrado com v=n-1 graus de liberdade. Uma variável aleatória contínua tem distribuição qui- quadrado com graus de liberdade se sua função densidade for dada por: 35 sendo . Denotamos . O gráfico abaixo mostra a função qui-quadrado com 2 graus de liberdade. Notemos pelo gráfico da distribuição qui-quadrado que ela é assimétrica e positiva, isto vale para qualquer grau de liberdade. Sua positividade é fácil de ser verificada, pois ela é soma de normais ao quadrado, portanto só pode ser positiva. A distribuição qui-quadrado possui diversas aplicações na inferência estatística. ●2. Estimação Intervalar Variância populacional: 𝑷(𝜒2 𝐿 ≤ 𝜒2 ≤ 𝜒2 𝑅) = 𝟏 − 𝜶⇒𝑷 (𝝌𝟐 𝑳 ≤ (𝑛−1)𝑆2 𝜎2 ≤ 𝜒2 𝑅)= 𝟏 − 𝜶 ⇒ 𝑷 ( (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈𝟐 ≤ (𝑛−1)𝑆2 𝝌𝟐 𝑳 )= 𝟏 − 𝜶 36 Desvio padrão populacional: 𝑷 (√ (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈 ≤ √ (𝑛−1)𝑆2 𝝌𝟐 𝑳 ) = 𝟏 − 𝜶 Exercício 1: De uma população normal com 𝜎2=16 levantou-se uma amostra, obtendo-se as observações 10, 5, 10, 7. Determinar ao nível de 5% um 𝐼𝐶µ para a média da população. Exercício 2: Em um certo lago, uma amostra de 1000 peixes acusou 290 tilápias. Construa um IC de 95% de confiança para a verdadeira proporção de tilápias na população. Exercício 3:a) De um povoamento de eucaliptos, sorteou-se 30 árvores com a finalidade de estimar o diâmetro médio do povoamento (população aprox.normal). Foram encontradas as seguintes estatísticas na amostra. 𝑥̅ = 26,5; 𝑠 = 7,8. 𝐶alcule: 𝐼𝐶µ(95%); 𝐼𝐶µ(99%).b) Qual o tamanho da amostra necessário para estimar o diâmetro médio de plantas de eucaliptos se o erro máximo deve ser de 2cm da média? Considere 𝜶=5%. 𝑛 = ( (2,04523)(7,8) 2 ) 2 = ~65 Exercício 4: Suponha que uma amostra de tamanho 12 da altura de um cultivar forneceu os seguintes resultados: 𝑥 ̅=3,504; s= 0,109. Construa um IC para o desvio padrão da população (𝜶=5%) 𝐼𝐶𝜎 = (√ (𝒏−𝟏)𝑆2 𝜒2 𝑅 ≤ 𝝈 ≤ √ (𝑛−1)𝑆2 𝝌𝟐 𝑳 )= (√ (𝟏𝟐−𝟏)0,1092 𝜒2 𝑅=21,92005 ≤ 𝝈 ≤ √ (12−1)0,1092 𝝌𝟐 𝑳=3,81575) = (0,0772; 0,1851) 37 2,5% 95% 2,5% 0 𝜒2 𝐿 = 3,81575 𝜒2 𝑅 = 21,92005 APP: 𝜒2 𝐿: 𝑣 = 11, 𝑃(𝑋 < 𝑥) = 0,025 ⇒ 𝜒2 𝐿 = 3,81575 𝜒2 𝑅: 𝑣 = 11, 𝑃(𝑋 > 𝑥) = 0,025 ⇒ 𝜒2 𝑅 = 21,92005 ●Testes Estatísticos (20-04-2021) a) Retiramos amostras de tamanho 𝑛 ou tamanhos 𝑛1≠ 𝑛2≠... . ≠𝑛𝑘. b) Sob determinada hipótese de algum valor (hipótese nula = ℎ0) e com Base em valores amostrais, identificamos a Estatística associada, ou seja, a sua distribuição de probabilidade que está tabulada. c) Nesta distribuição delimitamos uma área θ (grau de confiança), p.ex. 95%. Esquematicamente: 𝛼 = 1 − 𝜃(𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎); Área em branco 38 (região de não rejeição de ℎ0) d) Calculamos o valor (determinação) da Estatística associada (Estatística de teste ⇒ Variável aleatória) com base em informação da amostra. e) Decisão: Caso o valor calculado em d), esteja acima ou abaixo do(s) limite(s) de confiança (valor(es) crítico(s) ⇒ rejeitamos a hipótese nula (ℎ0). Caso contrário, consideramos ℎ1 𝑜𝑢 ℎ𝑎 , ℎ𝛼(ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎) como verdadeira. f) Por que? Existem dois tipos de erro: Rejeitarmos uma ℎ0 verdadeira (ou aceitarmos uma ℎ𝑎 falsa) Erro Tipo I (α) Não rejeitarmos uma ℎ0 falsa (ou rejeitarmos uma ℎ𝑎 verdadeira) Erro Tipo II (β) Exercício 1-Explicar as conclusões abaixo, considerando os tipos de Erro I e II. Hoje à noite você vai a uma festa. A previsão do tempo diz que há 80% de possibilidade de chuva. Você leva um guarda-chuva? ℎ0: Vai chover hoje à noite. ℎ𝑎: Não vai chover hoje à noite. Erro Tipo I: Você rejeita ℎ0 e, portanto, acredita que não vai chover. Sai sem o guarda-chuva e se molha (Rejeitarmos uma ℎ0 verdadeira). Erro Tipo II: Você não rejeita ℎ0 e, portanto, aceita que vai chover. Passa a noite carregando um guarda-chuva sem usá- lo (Não rejeitarmos uma ℎ0 falsa). α - é a probabilidade de se cometer um Erro Tipo I (nível de significância), é a chance de se rejeitar ℎ0 quando ela é verdadeira. 39 β - é a probabilidade de se cometer um Erro Tipo II, é a chance de não se rejeitar ℎ0 quando ela é falsa. Exercício 2: Nos casos abaixo, defina a hipótese nula (ℎ0) e a hipótese alternativa (ℎ𝑎) apropriadas. a) Uma fábrica de painéis de madeira deseja duplicar a sua produção. A duplicação acarretaria num consumo adicional de 1.300.000 𝑚3/𝑎𝑛𝑜 de madeira. Com base no sistema de inventário da empresa, que dispõe de 1500 parcelas, o gerente florestal encontrou que as florestas da empresa, têm uma capacidade excedente de produção média de 1225.000 𝑚3/𝑎𝑛𝑜 , com desvio padrão de 130.000 𝑚3/𝑎𝑛𝑜. b) Sabe-se que numa floresta tropical não perturbada a abundância de espécies “pioneiras” fica em torno de 10%. Com aumento de perturbações antrópicas a abundância dessas espécies tende a crescer. Na demarcação de uma reserva florestal com área total de 50.000 ha, ecologistas e engenheiros florestais discutem a incorporação de uma área de 7.500 ha onde o levantamento de campo revelou uma abundância de 15% de espécies pioneiras. ℎ0:p=10% ; ℎ𝑎:p>10%. OBS 1: O valor p é uma área delimitada pelo(s) valore(s) da estatística calculada com os dados amostrais. Consequentemente, se o valor p < α⇒ rejeitamos ℎ0 . 40 Outras representações gráficas para a realização de testes de hipóteses: Teste para média µ: ℎ0 : µ = 1.300.000 ; ℎ1 ≠ 1.300.000, ℎ1 > 1.300.000 𝑜𝑢 ℎ1 < 1.300.000 a) (população normal, σ conhecido e desconhecido e n>30). Estatística de teste: 𝑍 = 𝑋̅−µ 𝜎 √𝑛 ~𝑁(0; 1) Ilustração (teste bilateral) Região de não rejeição de ℎ0 Região de rejeição Região de rejeição 𝑧𝑝 2 𝑧𝛼 2 𝑧𝛼 2 𝑧𝑝 2 Z b) (população normal, σ desconhecido e n≤30) Estatística de teste: T= 𝑋̅−µ 𝑆 √𝑛 ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡(𝑛 − 1) OBS 2: Se a população (distribuição) não é essencialmente normal, utilize métodos não paramétricos que não exijam uma distribuição normal. 41 OBS 3: Se a população (distribuição) é essencialmente normal, para n≤30, e σ é conhecido, usamos a estatística de teste 𝑍 = 𝑋̅−µ 𝜎 √𝑛 . Para σ desconhecido, usamos a distribuição de Student com T= 𝑋̅−µ 𝑆 √𝑛 . Teste de afirmação sobre uma proporção para p: 𝐻0 : 𝑝 = 0,5; 𝐻1 : 𝑝 ≠ 0,5 (n>30) Estatística de teste: 𝑝̂−𝑝 √𝑝(1−𝑝) 𝑛 ~𝑁(0; 1) Teste bilateral da Variância 𝝈𝟐 ∶ ℎ0 : 𝜎2 = 100; ℎ1 ≠ 100 Estatística de teste - 𝜒2 = (𝑛−1)𝑆2 𝜎2 ~𝜒2(𝑛 − 1) Teste de comparação das variâncias de duas populações normais: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 42 Amostras independentes (populações normais) Estatística de teste: 𝐹 = 𝑆1 2 𝑆2 2 ~ 𝐹(𝑛 − 1, 𝑚 − 1) ⇒ 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑠1 2 𝑠2 2 > 1 OBS 4: Colhidas as amostras de n e m indivíduos, respectivamente, das duas populações, calculamos os valores (variâncias amostrais) 𝑠1 2 𝑒 𝑠2 2 e o valor observado 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑠12 𝑠22 . Se 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 pertencer à região crítica (área que corresponde ao nível de significância α, delimitada pelos valores críticos), rejeitamos ℎ𝑜; caso contrário, a aceitamos. EX 2: Queremos verificar se duas florestas de Pinus produzem resinas com a mesma homogeneidade quanto a densidade. Para isso, sorteamos duas amostras de seis árvores de cada floresta, e obtivemos as seguintes densidades: α=0,10 Floresta A 145 127 136 142 141 137 Floresta B 143 128 132 138 142 132 As hipóteses a serem testadas são: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1,08 Valores críticos: 𝐹𝐿 (5,5) = 0,1981; 𝐹𝑅 (5,5) = 5,0503 43 Conclusão= não rejeitamos ℎ𝑜 de que as variâncias sejam iguais, ou seja, as florestas A e B produzem resina com a mesma homogeneidade quanto a 2,5% 95% 2,5% 0 0,1981 5,0503 APP: d1=5; d2=5 ⇒ F(5, 5) P(X<x)=0,05⇒f=𝐹𝐿 (5) = 0,19801 P(X>x)=0,05⇒f=𝐹𝑅 (5) = 5,05033 Teste de comparação de duas médias (variâncias conhecidas): ℎ𝑜 ∶ µ𝑥 − µ𝑦 =0; ℎ1: µ𝑥 − µ𝑦 ≠ 0 , > 0 𝑜𝑢 < 0 ) Amostras independentes Estatística de teste: 𝑍 = 𝑋̅−𝑌̅ √( 𝜎12 𝑛 + 𝜎22 𝑚) ~𝑁(µ𝑥 − µ𝑦; √( 𝜎12 𝑛 + 𝜎22 𝑚) ) Exercício 1: Construir o IC para µ𝑥 − µ𝑦. 44 Teste de comparação de duas médias (variâncias desconhecidas): ℎ𝑜 ∶ µ𝑥 − µ𝑦 =0; ℎ1: µ𝑥 − µ𝑦 ≠ 0, > 0 𝑜𝑢 < 0) Amostras independentes (populações normais) a) Estatística de teste (variâncias diferentes): 𝑇 = 𝑋̅ − 𝑌̅ √(𝑠1 2 𝑛 + 𝑠2 2 𝑚) ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = 𝑚í𝑛(𝑛 − 1, 𝑚 − 1) 𝑔𝑙 = 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 b) Estatística de teste (variâncias iguais): 𝑇 = 𝑋̅−𝑌̅ √𝑆𝑝(1 𝑛+ 1 𝑚) ~𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = (𝑛 + 𝑚 − 2), 𝑠𝑜𝑏 ℎ𝑜. Daí, 𝑆𝑝2 = (𝑛−1)𝑆12+(𝑚−1)𝑆22 𝑛+𝑚−2 OBS 5: Antes da aplicação acima, devemos fazer o teste das variâncias para decidir em relação aos casos a) e b). Exercício 1: Dois procedimentos (A e B) de extração de celulose de eucalipto devem ser testados quanto a quantidade produzida. As amostras para A e B foram de tamanhos 12 e 15, médias 68 e 76, variância 50 e 52, respectivamente. Testar, para o nível de significância de 5%, se há diferenças significativa entre as quantidades produzidas. Então: ℎ0 = µ𝐴 − µ𝐵 = 0 ; µ𝐴 − µ𝐵 ≠ 0 Teste de variância: ℎ𝑜 ∶ 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎2 ; ℎ1 ∶ 𝜎𝐴 2 ≠ 𝜎𝐵 2 45 𝑓𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 52 50 = 1,04 Valores críticos: 𝐹𝐿 (14,11) = 0,32314; 𝐹𝑅 (14,11) = 3,35881 Conclusão 1: não rejeitamos ℎ𝑜(𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 5%) de que as variâncias sejam iguais, ou seja, as quantidades produzidas tem variabilidades, cujas as diferenças não são significativas. Daí, 𝑆𝑝2 = (𝑛 − 1)𝑆1 2 + (𝑚 − 1)𝑆2 2 𝑛 + 𝑚 − 2 = (14)(52) + (11)(50) 15 + 12 − 2 = =51,12 e 𝑇𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑋̅−𝑌̅ √𝑆𝑝(1 𝑛+ 1 𝑚) = 76−68 √51,12( 1 15+ 1 12) = 2,89 𝑇𝑐𝑟í𝑡𝑖𝑐𝑜 (𝑔𝑙 = 25) = 2,05954 Conclusão 2: Rejeitamos, ao nível de 5%, de que as médias populacionais das quantidades produzidas de celulose, relativas aos 2 (dois) procedimentos, sejam iguais. Exercício 2: Um estudo de dois tratamentos para evitar a corrosão de elementos metálicos em conjunto com a madeira está sendo testado para desacelerar a degradação da madeira na qual está embutido. Foram usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão eliminada). Qual seria a conclusão sobre os dois tratamentos? Tratamento Amostra Média Desvio Padrão A 15 48 10 B 12 52 15 46 Teste sobre duas Médias: População aproximadamente normal e amostras dependentes ℎ𝑜 ∶ µ𝑑 =0; ℎ1: µ𝑑 ≠ 0, > 0 𝑜𝑢 < 0) 𝐸𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑡𝑒𝑠𝑡𝑒 𝑇 = 𝑑̅ − µ𝑑 𝑠𝑑 √𝑛 ~ 𝑆𝑡𝑢𝑑𝑒𝑛𝑡, 𝑔𝑙 = = (n-1). Notação: µ𝑑 = média das diferenças d para a população de dados emparelhados; 𝑑̅ = valor médio das diferenças d para os dados amostrais emparelhados; 𝑠𝑑 = desvio padrão das diferenças d para os dados amostrais emparelhados; n= número de pares de dados Exercício 1: Número de espécies de fungos de 9 árvores antes e depois do tratamento Antes Depois d 77 80 3 62 58 -4 61 61 0 80 76 -4 90 79 -11 72 69 -3 86 90 4 59 51 -8 88 81 -7 47 Faça o teste, e conclua sobre a eficácia do tratamento (α=5%). ℎ𝑜 ∶ µ𝑑 =0; ℎ1: µ𝑑 ≠ 0 𝑇𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑑̅−µ𝑑 𝑠𝑑 √𝑛 = −30 5 √9 = −17,96 𝑇𝑐𝑟í𝑡𝑖𝑐𝑜(8) = −2,30 Conclusão: rejeitamos ℎ𝑜 ∶ µ𝑑 =0. O tratamento é eficaz. Exercício 2: Cinco operadores de certo tipo de máquina utilizada no beneficiamento de madeira são treinados em máquinas de duas marcas diferentes, A e B. Mediu-se o tempo que cada um deles gasta na realização de uma mesma tarefa, e os resultados estão no quadro abaixo. Operador Marca A Marca B 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78 Com o nível de significância de 10%, podemos afirmar que a tarefa realizada na máquina A demora mais do que na máquina B? 48 ● Os tratamentos quantitativos: Análise de Regressão (27-04-2021) OBS: Tratamentos- qualitativos ou quantitativos; quantitativos -associados com pontos numa escala numérica; Exemplos- temperatura, tempo, pressão, etc... ; Qualitativos- não é baseado em quantificação, não podem ser ordenados de acordo com a magnitude (ordem de grandeza) Exemplos- tipo de material, variedade, etc... . Uso da Análise de Variância- no caso de experimentos com tratamento quantitativos não é correto. EX: Dados de um experimento inteiramente ao acaso de doses de um mesmo adubo e crescimento de um cultivar Tratamento A B C D E 3 5 8 9 12 4 9 10 13 11 8 13 12 17 16 Suponha na tabela abaixo que A, B, C, D e E, representam estas quantidades. Aplicando a análise de variância relativa ao modelo 𝑦𝑖𝑗 = µ + 𝛼𝑖 + €𝑖𝑗 , ao nível de 5%, temos: 49 Causas da GL SQ QM F variação Tratamentos 4 132 33 3,30 Resíduo 10 100 10 Total 14 232 F= ∑ 𝑛𝑖(𝑦̅𝑖− 𝑦̿)2 /(𝑘−1) 𝑘 𝑖 ∑ ∑ (𝑦𝑖𝑗−𝑦̅𝑖) 2 𝑛𝑖 𝑗=1 𝑘 𝑖=1 /(𝑛−𝑘) = 𝑆𝑄𝑇𝑅/(𝑘−1) 𝑆𝑄𝐸/(𝑛−𝑘) = 𝑀𝑆𝑅 𝑀𝑆𝐸 (pág 2) F (crítico)= F(4,10)= 3,48 ⇒ não se rejeitaria a hipótese de que os tratamentos são, em média, iguais. Porém, se os tratamentos fossem qualitativamente diferentes, p.ex, esta análise estaria correta. Os tratamentos A, B, C, D e E são, no entanto, quantitativamente diferentes, isto é, correspondem às doses 1,2, 3,4, e 5 do mesmo adubo. A análise de variância não capta esta última informação. Uso da Análise de Regressão ( x-dose, y-crescimento) y x 3 1 4 1 8 1 5 2 9 2 13 2 50 8 3 10 3 12 3 9 4 13 4 17 4 12 5 11 5 16 5 Causas da GL SQ QM F variação Tratamentos 1 120 120 13,92 Resíduo 13 112 8,62 Total 14 232 O valor calculado (F=13,92) é significante ao nível de 5%. Conclui-se então que a dose de adubo (x) afeta o crescimento do cultivar (y), isto é, aumenta a dose, aumenta o crescimento (coeficiente angular (b=2)) 51 Mais resultados da regressão: Bioestat. Variável dependente = Coluna 1 Variável independente= Coluna 2 Média (X) = 3.0000 Média (Y) = 10.0000 Coef. de Determinação (R2) = 0.5172 R2 (ajustado) = 0.4801 Coeficiente de Correlação = 0.7192 Intercepto (a) = 4.0000 t = 2.2505 p = 0.0423 Coef. de Regressão (b) =2.0000 t = 3.7321p = 0.0025 IC 95% (a) 0.161 a 7.839 IC 95% (b) 0.842 a 3.158 Equação Y' = a + bX 52 ● Métodos de Amostragem Existe vários Métodos de Amostragem utilizados nas Ciências Florestais. Todos têm como objetivo gerar informações sem viés e com a maior precisão possível. Métodos de Amostragem utilizados nas Ciências Florestais. São métodos objetivos (sem interferência das pessoas que os utilizam) e imparciais. Todas unidades da população possuem uma certa chance de serem selecionadas na amostra. Esta chance é conhecida e é diferente de zero. Para estes métodos seremos capazes de calcular a precisão de uma dada estatística para representar o parâmetro da população. · Amostragem Aleatória Simples · Amostragem Aleatória Estratificada · Amostragem Sistemática · Amostragem por conglomerados e Em Múltiplos estágios Amostragem Aleatória Simples (AAS) Uma amostra de um dado tamanho tem a mesma chance de ser selecionada que qualquer outra amostra possível de mesmo tamanho. Exemplo Clássico: Bolas de mesmo tamanho, peso, superfície, etc., numa urna. Qualquer amostra de 3 bolas tem exatamente a mesma chance de ser obtida. O PROCESSO ALEATÓRIO de seleção das unidades elimina qualquer interferência de escolha humana na escolha dos elementos da amostra. Tabela de números aleatórios As propriedades da Tabela de Números Aleatório implicam que: 53 · Qualquer par de dígitos tem a mesma chance de ser um dos 100 possíveis pares: 00, 01, . . . , 99. · Qualquer trio de dígitos tem a mesma chance de ser um dos 1000 possíveis trios: 000, 001, . . . , 999. · Qualquer . . . Como utilizar Números Aleatórios numa Amostragem? Terminologia N (maiúsculo) denota o tamanho da população. n (minúsculo) denota o tamanho da amostra. A) Rotular todas N unidades da população: 1. Designar cada unidade na população por um rótulo composto de dígitos. 2. Sempre utilizar o menor número possível de dígitos nos rótulos: Para 10 ou menos unidades, utilizar rótulos de um dígito: 0, 1, . . . , 9. Para mais de 10 e menos de 100, utilizar dois dígitos nos rótulos: 00, 01, . . . , 99. 3. Todos os rótulos devem possuir o mesmo número de dígitos. 4. Cada unidade deve ser designada pelo mesmo número de rótulos B) Selecionar uma amostra de tamanho n: 1. Iniciar num ponto aleatório da Tabela de Números Aleatórios. 2. Ler os rótulos sistematicamente seguindo as linhas ou colunas da Tabela. 3. Se um rótulo já lido surgir novamente ou se aparecer um rótulo que não está presente na população, ignorá-lo e seguir para o próximo. 54 4. Continuar até que n unidades sejam selecionadas. Exercício 1: Realizar uma amostra aleatória simples de tamanho 4 dos fragmentos. Estimar a média, mediana e o desvio padrão populacional. Fragmento – Rótulo - Área (ha) Fazenda Santa Rita (Fragmento) 01(Rótulo) 35 (Área) Fazenda Santa Rita 2 02 2 Piraquera 03 17 Fazenda Sertão 04 10 Fazenda Água Clara 05 19 Fazenda Tijuco Preto 06 4 Fazenda Dona Zilma 07 40 Sítio Arueira 08 1 Fazenda Água Funda 09 7 Sítio Santa Clara 10 9 Sítio Santo Antônio 55 11 12 Fazenda Conceição 12 10 Sítio do Bento 13 18 Fazenda Pau Queimado 14 34 Fazenda Gibeira 15 21 56 Linhas Colunas 1 2 3 4 5 6 7 8 9 10 1 37330 53935 13353 39148 90771 13159 33960 06997 84693 46795 2 10556 08243 70946 57339 72234 59692 52999 93494 95782 09651 3 45811 96068 33049 45243 27243 94492 67854 01933 75224 77355 4 73736 58198 34805 92339 46743 87758 53546 91205 20339 80666 5 17223 12221 61507 77114 72285 69923 05809 06493 97064 46339 6 81548 95763 83937 91219 01721 17329 93669 60293 03667 21710 7 90216 94892 06615 01442 53108 21428 83671 71161 47712 73850 8 00764 91156 09068 03279 05814 60628 50454 75238 85013 03935 9 20759 16044 24367 90989 46036 74737 77971 76094 96855 71792 10 42933 66329 75711 94739 36532 97440 27111 15222 30748 68995 11 90227 25813 47260 18871 32378 83526 45759 91977 17721 94625 12 43376 01076 85915 30545 47255 04452 24526 77645 13186 42302 13 63024 89093 09505 22752 03459 61945 92030 77252 68334 14381 14 57417 62107 69764 44870 58163 36237 50600 19644 17087 57247 15 42252 61257 07265 89677 80135 78227 41473 70922 67684 39150 16 78009 80035 01594 31923 16715 13916 58606 83282 25382 04772 17 38594 79867 81298 27956 23186 58969 40255 53449 06430 02044 18 61166 10972 89696 72737 74575 33628 07724 09325 55122 03607 19 96847 09658 78425 27341 01678 72410 07312 18256 14849 41021 20 96233 37435 02304 86004 36919 34869 36691 05771 70516 23301 21 96723 28815 56751 06769 79709 94181 64349 87804 51772 20745 22 83778 80486 07191 27820 12450 50519 12220 01604 42242 30684 23 81870 45840 40560 06232 48136 70977 79352 60376 65229 78414 24 79836 38814 35247 52688 54767 59184 09034 45814 08280 11287 25 87161 71681 12125 66883 61697 17181 54093 56464 11199 07275 26 87783 75633 05979 57992 39071 52546 62850 73274 29428 35256 27 08119 21105 09347 34139 56304 12470 98466 22863 62609 36216 28 18922 09414 30267 31239 05542 90793 48181 04769 37248 31929 29 17629 55417 41930 85312 67452 19141 27944 78229 88922 66229 30 85876 53986 94018 97123 26576 85913 14366 63907 19704 24935 31 39992 84306 70490 49481 78479 81102 99329 90414 53003 74881 32 41986 50658 70507 53404 25900 28854 61275 59667 51324 67022 33 99382 46409 04296 92514 19794 81119 23260 64028 61763 50013 34 72215 07414 94276 26246 50979 22571 64260 32572 97833 10481 35 35633 43596 50301 44167 92491 03588 41259 10595 59500 78197 36 88312 90675 83843 39813 81547 56037 85139 86009 98724 00114 37 97936 08967 06297 90721 11649 00469 90058 19169 42794 65151 38 70453 97653 82137 31617 82240 78879 99752 33814 27956 00884 39 13199 73340 29241 96338 78479 01993 83968 45405 24145 99657 40 86790 40381 32919 51971 02988 45995 01324 43030 76348 11470 41 64480 68876 88985 23621 77087 38588 90692 19155 47371 14490 42 68173 57677 77372 71297 77786 48919 69894 25420 45816 11371 43 03398 42731 22387 81826 28712 38888 20897 85387 09919 27589 44 92656 62471 96454 40858 51211 86127 24676 84158 09159 52302 45 03659 61742 79474 10843 48114 15666 38553 05251 47571 80037 57 Amostragem Aleatória Estratificada (AAE) População dividida em “grupos mais homogêneos”. Em cada grupo se faz uma AAS. Combina-se as ASS de cada grupo numa única amostra Menor variabilidade entre amostras da população. Maior precisão na amostragem. A população é subdivida em grupos mutuamente exclusivos chamados ESTRATOS. Uma AAS é tomada dentro de cada estrato, e as estimativas dos estratos são combinadas. Como os grupos são mutuamente exclusivos, cada unidade da população pertence a um único estrato. Se os estratos forem internamente mais homogêneos que a população em termos da variável que está sendo medida, a AAE será mais precisa que a AAS. Estimadores: a) 𝑋̅ = 1 𝑁 ∑ 𝑁𝑖𝑋̅𝑖 𝑘 𝑖=1 b) 𝑉̂(𝑋̅) = ∑ ( 𝑁𝑖 𝑁) 2 𝑘 𝑖=1 ( 𝑁𝑖−𝑛𝑖 𝑁𝑖 ) 𝑠𝑖2 𝑛𝑖 Exercício 2: Produção em floresta plantada. Estrato (área- ha) 𝑁𝑖 𝑛𝑖 𝑥̅𝑖 𝑠𝑖2 1 a 10 7 4 1,6 3,3 11 a 20 4 2 2,8 4,0 21 a 40 4 2 2,5 2,2 Total 15 8 - - 58 a) Estimar a média populacional b) Desvio padrão populacional c) Construir o intervalo de confiança para Amostragem sistemática(AS) Inicialmente, as unidades da população são colocadas numa certa ordem.. Para uma amostra sistemática de “1-em-cada-k- unidades”, você primeiro seleciona aleatoriamente uma das k primeiras unidades. A partir da unidade selecionada toma-se sempre a k-ésima unidade. NOTE: somente a primeira unidade é selecionada aleatoriamente, todas as demais são tomadas sistematicamente. Amostragem por conglomerados(AC) P,ex. se as fazendas são as unidades da população então um grupo de fazendas seria um conglomerado- seleciona-se o conglomeradao. Amostragem em Múltiplos Estágios (AME) Como o nome sugere, na amostragem em múltiplos estágios o processo de amostragem aleatória é repetido em vários estágios hierarquizados. Em cada estágio, qualquer um dos métodos de amostragem discutidos pode ser utilizado. EX: Levantamento Regional O DPRN (Departamento de Proteção dos Recursos Naturais) do Estado de São Paulo deseja realizar um levantamento rápido para diagnosticar a situação dos fragmentos florestais em todo Estado. Qual a melhor forma de amostrar? Estado de São Paulo 59 1o. ESTÁGIO Quadrículas do IBGE dentro do Estado (AAS) 2o. ESTÁGIO Fragmentos dentro de Quadrículas (AAE por tamanho) 3o. ESTÁGIO Parcelas dentro de Fragmentos dentro de Quadrículas (AS)