·

Economia ·

Econometria

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

OBJETIVOS DE APRENDIZAGEM Definir inferência estatística e respectivas aplicações Identificar os tipos de amostragem utilizados em um estudo estatístico Descrever o papel do teorema das combinações lineares e o teorema do limite central na inferência estatística Introdução A estatística provê recursos para a organização a descrição a análise e a interpre tação de dados visando a uma avaliação científica ou a uma tomada de decisão A coleta de dados permite estudar diversas características de uma população para investigar questões de interesse enquanto a estatística inferencial tem o objetivo de realizar afirmações por meio da análise de um conjunto de valores dentro de um universo que são representativos Neste capítulo veremos os principais conceitos da inferência estatística e suas aplicações bem como os tipos de amostragem que são utilizados em um estudo estatístico Além disso vamos tratar da importância dos teoremas das combinações lineares e do limite central na inferência estatística Inferência estatística e suas aplicações O acúmulo de informações para a gestão de negócio é extremamente impor tante na medida em que permite uma análise eficiente na tomada de ação presente ou na execução de estratégias futuras Esse acúmulo de informa Inferência estatística Luís Gustavo Maschietto ções é conhecido como big data e sua importância é tão expressiva que a capacidade de domínio dessas informações é vista como um ativo valioso no ambiente corporativo Por sua importância e seu valor esses dados são comparados com uma nova moeda ou mesmo como um material de valor como ouro ou petróleo Obviamente nem todos os dados têm tanta importância para o mundo corporativo e nem sempre todos os dados são importantes para determinada empresa assim os dados devem ser rigorosamente identificados ou criados coletados integrados ao escopo proposto filtrados transformados e contextualizados para poderem embasar decisões de forma ágil e precisa SHARDA DELEN TURBAN 2019 Modos tradicionais de coleta de dados de forma manual foram em grande parte substituídos por mecanismos mais modernos de coleta Diversas ferra mentas de BI business intelligence são capazes de realizar análises complexas desses dados e gerar relatórios com informações assertivas para um negócio ou mesmo com informações estatísticas atuais e futuras Portanto os dados são considerados a matériaprima para diversas tecnologias de decisão existentes no mercado e permitem a produção de insight de informações pertinentes e de conhecimento para uma gestão eficiente do negócio SHARDA DELEN TURBAN 2019 Nos bastidores de todas as ferramentas de análise de dados existem aplicações matemáticas fundamentais para possibilitar a assertividade das análises e previsões A estatística uma coleção de técnicas matemáticas aplicadas para caracterizar e interpretar dados sempre foi utilizada para gerar informações precisas para determinada área de negócio Diversos métodos e técnicas vêm sendo utilizados e desenvolvidos há muito tempo para permitir atender a características singulares dos dados e às necessidades dos usuários finais Esses métodos estatísticos habitualmente são classificados como descritivos ou inferenciais A principal diferença entre os dois são os dados utilizados na execução desses métodos enquanto a estatística inferencial é aplicada para realizar inferências ou tirar conclusões sobre as características da população o método descritivo é focado em descrever a amostra de dados à disposição SHARDA DELEN TURBAN 2019 O termo população utilizado na estatística inferencial vem do latim populatione tem o mesmo radical de populu povo e revela assim as origens da estatística que em seus primórdios se ocupava de compilar dados a respeito de populações ou seja a totalidade de pessoas que forma uma coletivida de uma vila um povoado uma cidade um país etc Com o tempo o termo passou Inferência estatística 2 a ser empregado em um sentido mais amplo para qualquer coletivo de interesse sejam animais espécies de plantas ou outros objetos Mas guarda o sentido de todo da totalidade dos objetos de interesse BECKER 2015 p 38 As amostras em estatística são definidas por partes de um todo ou seja qualquer subconjunto da população de interesse Para a estatística inferencial as amostras são indícios que possam levar à conclusão de um todo Dessa forma uma parte amostra talvez se generalize para um todo população Portanto o objetivo da estatística é a validação dessa generalização Em diversas situações a definição de uma população não é facilmente alcançada não existem listagens concretas para serem utilizadas de forma que a palavra é a única forma de descrever uma população o que pode gerar diversas dúvidas no entendimento do que é essa população Outro fator a ser considerado é que o resultado estatístico alcançado pela inferência pode não apresentar uma exatidão totalmente assertiva mas a proximidade do valor alcançado serve de base para a realização de ótimas tomadas de decisão A grande preocupação da estatística inferencial é medir a qualidade da inferência alcançada Como ocorre em qualquer tipo de processo de medição existe o empenho na verificação da aproximação entre uma medida concreta e a proporção amostral assim como entre um valor desconhecido e a propor ção populacional Dessa forma existe a teoria de erros de mensuração com preferência ao termo de erros de amostragem para análises dos processos executados de mediação Outra questão a ser verificada é o quão representativa é a amostragem de uma população Como na maior parte das análises não existe a possibilidade de conseguir o todo da população a intuição é guiada para a generalização de uma representação confiável do todo Dessa forma a amostra deve ser construída a partir do produto que ela representa caso isso não ocorra não existe validade na qualidade da amostragem BECKER 2015 Na Figura 1 são representados os passos necessários para a verificação de uma amostra com base em uma população Após a coleta de uma amostra é possível realizar uma análise exploratória dos dados e começar os processos de inferência estatística Inferência estatística 3 Figura 1 Passos necessários para a execução de uma amostragem Fonte Adaptada de Universidade Federal de Santa Catarina 20 documento online Com relação à representatividade de uma amostra é possível citar a aplicação de testes de um medicamento para ser utilizado em humanos Nesse cenário para verificar a eficácia do medicamento são utilizados 10 animais selvagens criados para a execução desses testes como elementos de amostragem Em cinco animais mamíferos é aplicado o medicamento enquanto a outra metade é utilizada como controle Os dois grupos de animais são escolhidos de forma aleatória A mesma dieta é fornecida a todos os animais durante um período Ao final do processo são medidas as caracterís ticas de interesse Entre essas características estão o nível de colesterol no sangue dos animais Caso exista uma diferença significativa entre as médias da medida de interesse dos grupos é possível a atribuição da diferença ao medicamento que foi administrado É importante lembrar que o teste foi realizado no intuito de aplicar o medicamento em humanos mas foi realizado em animais Portanto exis tem questões que devem ser levantadas em relação à representatividade desse estudo Mesmo sabendo que as cobaias do estudo são mamíferos e portanto com metabolismos semelhantes aos dos seres humanos é ne cessário confirmar a efetividade do medicamento Outra questão que deve ser levantada para verificar a eficiência do teste por exemplo é garantir que os pesquisadores envolvidos no estudo dos dados não saibam qual é o grupo de controle animais que não receberam o medicamento e qual é o grupo experimental animais que receberam o medicamento para que Inferência estatística 4 não influenciem o resultado Portanto em diversos exemplos de estudos de amostragem a presunção de representatividade é sempre baseada no conhecimento dos elementos que são relevantes e que podem influenciar a descoberta do ponto de interesse do estudo Desse modo para um estudo de amostragem ser bemsucedido é extrema mente importante a manutenção da consistência na relação entre população de referência e amostra que a represente Devese definir primeiramente a população de interesse abstrata para ser possível retirar uma amostra representativa ou seja concreta Não é simplesmente a amostra que trará indícios de sua representatividade mas o processo que foi utilizado para sua definição além da coerência entre a população representada e a amostra tomada BECKER 2015 Além do exemplo de aplicação de amostragem nos testes de medicamentos em humanos a utilização de técnicas de amostragem em estatísticas oficiais também pode ser percebida frequentemente A ONU Organização das Nações Unidas por exemplo utiliza muitos levantamentos por amostragem que são realizados em diversos paísesmembros e que são utilizados para diversos fins Entre as amostragens realizadas pela ONU estão renda familiar saúde desemprego produção industrial agricultura etc No Brasil por exemplo no Censo Demográfico é selecionado aproximadamente um a cada quatro questionários para permitir uma análise da renda e da ocupação de indivíduos Nos Estados Unidos também é adotada uma seleção de questionários para a realização de uma análise da população em relação a casamento fertilidade etc Ainda no Brasil informações publicadas antecipadamente ao Censo como dados sobre desemprego produção industrial e área agrícola são produzidas a partir de amostras Além disso pesquisas de mercado e de opinião pública também são casos clássicos do uso de amostragem ROSSI 2020 Outros exemplos do uso da inferência estatística incluem previsões de durabilidade em calculadoras manuais com base em análise de desempenho de outras calculadoras análises de propriedades particulares em determi nada região do país com base em projeções de população e tendências de negócios comparação de dietas para perda de peso a partir das análises de perdas de peso de indivíduos que fizeram essas dietas verificação de dosagem de uma nova vacina a partir de testes em voluntários de hospitais que foram selecionados de forma aleatória e prevenção do fluxo de tráfego em rodovias que ainda estão em construção a partir do tráfego verificado em rodovias alternativas Inferência estatística 5 Se uma amostragem de clientes de uma loja comercial revela que 75 deles são do sexo masculino somos induzidos a generalizar a estatística como se ela fosse válida para todos os clientes e passamos a tomar decisões com base nessa percepção Assim a decoração da loja por exemplo poderá refletir essa percepção e talvez evitese o uso de tons pastéis mais femininos BECKER 2015 Tipos de amostragem utilizados em um estudo estatístico Os métodos de amostragem são divididos em duas principais categorias amos tragem probabilística e amostragem não probabilística Em uma amostragem probabilística os itens são escolhidos por um procedimento que envolve acaso ou de forma aleatória Nesse tipo de amostragem o objetivo é produzir uma amostra representativa de uma população Já a amostragem não probabilística é considerada menos científica mas pode ser utilizada por conveniência As quatro técnicas presentes na amostragem probabilística são listadas a seguir DOANE SEWARD 2014 1 Amostra aleatória simples utiliza números aleatórios para a seleção de itens de uma lista p ex clientes do Banco do Brasil 2 Amostra sistemática seleciona os itens de x em x de uma sequência ou uma lista p ex usuários do Facebook 3 Amostra estratificada seleciona características de elementos dentro de um estrato de forma aleatória p ex por nome altura peso etc 4 Amostra por conglomerado seleciona áreas geográficas aleatórias p ex cidade para representar uma população Na amostragem aleatória simples será considerado Y como o tamanho da população e y como o tamanho da amostra Dessa forma todos os itens na população de Y itens possuem a mesma chance de serem escolhidos na amostra de y itens Para exemplificar seu uso basta considerar um jogo de pôquer em que o objetivo é escrever cada um dos Y valores em uma ficha e depois retirar y fichas de uma urna É possível obter a mesma análise se for considerado que a população de Y itens esteja em uma lista numerada bastando para tanto escolher de forma aleatória y inteiros entre 1 e Y Nesse cenário devese tomar o devido cuidado para não introduzir possíveis vícios que comprometam a tarefa de seleção DOANE SEWARD 2014 Inferência estatística 6 O vício de seleção em uma amostragem aleatória simples deve ser evitado para não influenciar o resultado Um exemplo de vício seria considerar uma seleção de estudantes ao acaso presentes em uma lista de 20 alunos Caso existisse uma solicitação de escolha a partir do uso do bom senso de uma pessoa ela poderia preferir escolher o nome do meio o que provocaria um vício de seleção em relação aos alunos que estão em outros pontos da lista analisada Para que seja evitado esse tipo de problema devese basear a escolha a partir do uso de números aleatórios O número aleatório antes da existência de computadores era escolhido por um estatístico pelo uso de tabelas impressas com números aleatórios Atualmente com o uso de calculadoras científicas é possível definir esse número estipulando por exemplo um intervalo entre 0 e 1 Com o uso de sistemas aplicativos utilizados em computadores é possível o uso de fun ções prontas para a seleção desse número aleatório No software Excel por exemplo é possível utilizar a função chamada de RANDBETWEEN ou ALEATORIOENTRE na versão em português do Excel para gerar um número aleatório entre 1 e 20 Dessa forma a função seria montada da seguinte forma RANDBETWEEN120 ou ALEATORIOENTRE120 Com o uso da função todos os números do intervalo possuem a mesma possibilidade de serem escolhidos DOANE SEWARD 2014 Na Figura 2 é mostrado o exemplo da escolha de alunos a partir de uma lista com o uso do programa Excel Nesse exemplo o número escolhido pela função do Excel foi 13 que representa o nome Luiz Figura 2 Escolha randômico de uma lista de alunos no Excel Inferência estatística 7 Em uma amostragem conhecida como amostragem sem reposição quando um item é selecionado para ser inserido em uma amostragem ele não poderá ser selecionado novamente nessa amostragem A função no Excel ALEATORIOEN TRE utiliza uma amostragem com reposição ou seja o mesmo número aleatório escolhido pelo sistema pode aparecer mais de uma vez Nesse exemplo caso sejam retornadas todas as fichas novamente na urna e elas sejam misturadas antes da próxima seleção um item poderá ser escolhido novamente Quando o tamanho da amostra y está próximo do tamanho Y da população a amostragem sem reposição pode se tornar um problema Isso ocorre porque ela induz à perda de independência estatística entre os itens que foram selecionados o que pode ocasionar um vício por subestimar ou superestimar os resultados Em amostras com o uso de reposição os itens são selecionados de forma independente o que evita o vício DOANE SEWARD 2014 Em uma amostra sistemática após escolher primeiramente um ponto aleatório inicial entre os primeiros x itens de uma lista são escolhidos os itens de x em x ou seja todo xésimo item de uma lista Na Figura 3 é ilustrado como amostrar todo terceiro item com início pelo segundo item o que resulta uma amostragem de y 4 itens DOANE SEWARD 2014 Figura 3 Exemplo de amostragem sistemática Fonte Dias 2018 documento online A amostragem sistemática é utilizada em populações que não podem ser listadas ou em populações infinitas como ocorre em processos de produção Exemplos desse cenário acontecem por exemplo em amostragem eleitoral em que pessoas são escolhidas no momento da saída do local de votação a partir de uma quantidade definida para serem entrevistadas Dessa forma Inferência estatística 8 poderia ser definida uma quantidade de 15 em 15 eleitores que saem do local de votação para ser entrevistada Outro exemplo é o processo de produção em que é testado todo quinto produto produzido Além desses exemplos a amostragem sistemática também é adequada para populações que são organizadas fisicamente de forma linear como na verificação de cada cinco pastas que contenham informações de vendas em gavetas de arquivos DOANE SEWARD 2014 Para uma amostragem sistemática de y itens de uma população de Y itens é necessária uma periodicidade x que seja aproximadamente Yy Na Figura 4 é mostrado um exemplo em que é necessário amostrar o salário de CEOs chief executive officer ou diretor executivo em uma lista de 500 empresas Dessa forma devese selecionar toda a vigésima observação pois o resultado de x 50025 é igual a 20 Nesse exemplo para amostrar os salários de CEOs de 500 empresas definiuse de forma aleatória iniciar a escolha da décima posição Assim a cada 20 itens da lista que se encontra ordenada de forma alfabética foi possível produzir uma amostragem de 25 diretores executivos DOANE SEWARD 2014 Figura 4 Amostra sistemática de salários de diretores executivos em uma lista de empresas Fonte Doane e Seward 2014 p 37 Inferência estatística 9 Em uma amostra estratificada é possível melhorar a eficiência de uma amostra com o uso de informações já disponíveis sobre a população anali sada Esse recurso pode ser utilizado quando a população pode ser dividida em subgrupos homogêneos de tamanhos conhecidos estratos A partir de cada estrato é possível realizar uma amostra aleatória simples com um tamanho escolhido Dessa forma podese combinar as estimativas de es tratos individuais com o uso de ponderações convenientes Portanto com uma amostragem estratificada é possível a diminuição da margem de erro e a redução de custos Temse portanto em uma população com T estratos que o tamanho populacional Y é representado pela soma dos tamanhos dos estratos ou seja Y Y1 Y2 YZ Em relação ao peso que é atribuído ao estrato u ele é ponderado pela proporção conhecida na população ou seja u é ru YuY DOANE SEWARD 2014 Na Figura 5 é mostrado um exemplo de estimativa de taxa de contaminação de uma virose entre os professores da rede pública de ensino Nesse cenário a populaçãoalvo é composta de 60 de homens e de 40 de mulheres Para esse estudo foi definido um tamanho de amostragem de 300 Como forma de garantir um equilíbrio por sexo a amostra foi realizada em 180 homens e 120 mulheres Para esse estudo poderia ser selecionada uma amostra aleatória do total de professores Nesse caso seria possível estimar as taxas globais de infeção por meio da ponderação de infecções para homens e mulheres Dessa forma temse uM 060 e uF 040 Com esses resultados é possível analisar os tamanhos conhecidos dos estratos DOANE SEWARD 2014 Figura 5 Exemplo de amostra estratificada Inferência estatística 10 Uma amostragem por conglomerados é constituída por estratos de regiões geográficas Um estágio da amostragem por conglomerado consiste em todos os elementos em cada uma das x subregiões definidas como conglomerados escolhidas de forma aleatória Em dois estágios de amostragem por conglo merado primeiramente são selecionadas de forma aleatória x subregiões e posteriormente é escolhida uma amostra aleatória de elementos dentro de cada subregião ou conglomerado Na Figura 6 é fornecido um exemplo da aplicação de amostra por con glomerados de um estágio Nesse exemplo primeiramente a população é agrupada por subregiões conglomerados em que cada subregião possui dois elementos Após esses agrupamentos são escolhidos dois grupos dos agrupamentos da população DOANE SEWARD 2014 Figura 6 Exemplo de amostra por conglomerados em um estágio Fonte Ochoa 2015 documento online A Figura 7 apresenta um exemplo de amostragem por conglomerados em dois estágios Nesse exemplo é ilustrado como quatro elementos são amos trados de cada um dos três conglomerados escolhidos de forma aleatória A aproximação dos conglomerados diminui o tempo gasto com entrevistadores e deslocamento DOANE SEWARD 2014 Inferência estatística 11 Figura 7 Exemplo de amostra por conglomerados em dois estágios Fonte Doane e Seward 2014 p 37 Uma amostragem por conglomerados é útil quando existe uma tolerância em relação à perda de confiabilidade existe um custo alto dos dados devido à distância tornase caro o uso de uma amostragem estratificada ou simples e quando as características dos estratos e uma lista de referência da população não estão facilmente disponíveis A amostragem por conglomerado apresenta em muitos casos uma alta precisão além de ser rápida e barata de aplicar A precisão ocorre porque por exemplo pessoas de vivem em uma mesma vizinhança normalmente apresentam características semelhantes como nível de educação renda tipo de moradia etc Em pesquisas eleitorais estudos de criminalidade e contaminações por material pesado é muito comum o uso desse tipo de amostragem Outros exemplos de uso são no controle de estoque a partir de conglomerados de produtos alocados em armazéns e em regiões florestais que são vistas como conglomerados para diversos tipos de estudos científicos DOANE SEWARD 2014 Existem três técnicas de amostragem não aleatória que normalmente são utilizadas por empresas para permitir uma rapidez na análise de dados que servem de base para uma orientação em decisões informais Inferência estatística 12 1 amostra intencional 2 amostra por conveniência 3 grupos de enfoque Essas técnicas permitem a análise de dados preliminares como auxílio para a elaboração de estudos formais a partir de amostras aleatórias Es pecificamente a amostra intencional usa o conhecimento especializado para escolher elementos considerados típicos como é o caso da escolha de alunos para uma entrevista A amostragem por conveniência usa uma amostra disponível como pedir opiniões a amigos do colégio no horário de almoço Já os grupos de enfoque são painéis de indivíduos que são escolhidos para representar uma população mais ampla para a discussão de ideias sobre determinado assunto por exemplo em uma estratégia de marketing para o lançamento de um produto DOANE SEWARD 2014 Um exemplo comum de amostragem aleatória simples é uma pesquisa para conhecer a opinião dos moradores de um bairro em uma cidade Considerando que a pesquisa foi limitada à verificação em 30 domicílios embora no bairro existam 300 para conseguir a amostra dos 30 endereços é realizado um sorteio entre os 300 endereços disponíveis Assim todas as residências possuem a mesma chance de participar da pesquisa O papel do teorema das combinações lineares e o teorema do limite central na inferência estatística Para a inferência estatística os teoremas das combinações lineares e o teo rema do limite central estabelecem o nível de confiabilidade dos resultados alcançados a partir da realização de teste de amostragem O teorema das combinações lineares por exemplo estabelece que se a variável de inte resse segue uma distribuição normal na população a distribuição amostral das médias de amostras aleatórias que são retiradas dessa população também será normal independentemente do tamanho dessas amostras Em contrapartida o teorema do limite central estabelece que se não for conhecida a distribuição da variável de interesse ou ela não seguir uma distribuição normal na população a distribuição amostral das médias de amostras aleatórias retiradas dessa população será normal se o tamanho Inferência estatística 13 dessas amostras for suficientemente grande com uma média igual à média populacional e uma variância igual à variância populacional dividida pelo tamanho da amostra REIS 2019 O desviopadrão das médias amostrais é conhecido como erropadrão da média ou simplesmente erropadrão O erro pode ser calculado a partir da diferença entre a média geral e cada média amostral elevando ao qua drado essas diferenças somandoas e então realizando a divisão da soma pelo número de amostras Por fim a raiz quadrada desse valor deve ser calculada para a obtenção do desviopadrão das médias amostrais Como o processo de coletar diversas amostras é inviável é utilizada uma expressão matemática Assim o teorema central do limite surgiu para estabelecer que à medida que as amostras ficam maiores a distribuição amostral apresenta uma aproximadamente normal com uma média igual à média da população e um desviopadrão FIELD 2009 Para que seja possível explicar como o teorema central do limite atua na inferência estatística será considerado um exemplo de análise de chances de candidatos à eleição se elegerem em duas cidades distintas Em uma cidade A será considerado o número de 60000 eleitores e na cidade B será considerado o número de 70000 eleitores Na cidade A foi realizada uma pesquisa com somente 100 pessoas votantes que resultou em um resultado de seis votos para o candidato 10 30 votos para o candidato de número 2 e 60 votos para o candidato de número 3 A partir desse resultado é possível inferir que o candidato 3 vencerá a eleição pois a pesquisa mostrou uma porcentagem de 60 de chance que ele saia vencedor Na cidade B também foi realizada uma pesquisa para estimar o vencedor porém neste caso foi realizada pesquisa com o número de 10000 pessoas Após a pesquisa foi verificado que 1500 pessoas pretendem votar no candidato de número 4 6000 pessoas pretendem votar no candidato de número 5 e 2500 pessoas pretendem votar no candidato de número 6 Para a cidade B constatouse portanto que o candidato 5 tem mais chances de vencer a eleição e que seus votos correspondem a uma porcentagem de 60 do total dos entrevistados Ao analisar as duas pesquisas é possível constatar que a pesquisa reali zada na cidade B apresenta maior confiança em relação à pesquisa analisada na cidade A mas essa afirmação está em um nível de intuição ou seja não é possível afirmar com segurança que de fato a pesquisa realizada na cidade B apresenta maior confiança Nesses casos o teorema central do limite pode ser aplicado para verificar se a intuição inicial está correta O teorema central do limite estabelece que sejam X1 X2 Xn variáveis aleatórias independentes e igualmente distribuídas com médias totais iguais Inferência estatística 14 a µ e desviopadrão igual a σ Então para N suficientemente grande a vari ável dada pela média amostral até n tem distribuição de probabilidade próxima à da curva normal com média µ e desviopadrão que é equivalentemente a FIELD 2009 O teorema limite central pode ser interpretado considerando os seguintes pontos para amostras grandes de qualquer população é possível aproximar a distribuição amostral de por uma distribuição normal com a mesma média populacional e variância igual à variância populacional dividida pelo tamanho da amostra Analisando as características da distribuição populacional será possível estimar o quão grande deve ser a amostra para se obter uma boa aproximação Dessa forma se a distribuição populacional não se afastar muito de uma distribuição normal a aproximação será boa mesmo para pequenos dados de amostra A palavra central do teorema indica sua extrema importância para a inferência estatística No geral amostras com tamanho n 30 conseguem fornecer uma boa aproximação FARIAS 2008 Diversas literaturas conside ram essa faixa de tamanho de elementos em uma amostragem como uma média normal mas isso de fato depende da distribuição da população Dessa forma se a distribuição for simétrica ou ligeiramente assimétrica é provável que uma amostra de 30 elementos permita verificar o teorema central do limite ou seja com a distribuição das médias amostrais normais Entretanto se a população tiver uma distribuição muito assimétrica ou tiver mais de um pico os mesmos 30 elementos podem não ser suficientes Como a população muitas vezes não é conhecida tornase necessário conhecer outra informação sobre a variável de interesse Variáveis como gestos e renda por exemplo normalmente possuem distribuições assimétricas Entretanto variáveis como dimensões de peças e medidas corpóreas muitas vezes possuem distribuição simétrica REIS 2019 Para melhor detalhar o uso do teorema central do limite será demons trada a resolução de um exemplo de um censo realizado em uma cidade com 30000 habitantes Após a realização do censo foi observado que a média das idades das pessoas entrevistadas era de 38 anos com desviopadrão populacional de 5 anos Considerando um grupo de 100 pessoas será ve rificada a probabilidade de a média das idades dessas pessoas pertencer ao intervalo 375385 Sabendo que é possível identificar que σ corresponde ao desviopadrão de 5 anos que µ corresponde à média da amostragem de 38 anos e que n corresponde ao número de pessoas do grupo a ser analisado ou seja 100 pessoas Ao serem atribuídos os valores Inferência estatística 15 na equação temse que ou seja N3805 A média das alturas vai obedecer a uma distribuição normal com média 38 e desviopadrão 05 Dessa forma é delimitada a área no gráfico mostrado na Figura 8 tendo os pontos como 375 38 e 385 ou seja 05 de diferença de 38 lado esquerdo do ponto central e mais 05 lado direito do ponto central Figura 8 Delimitação das áreas encontradas Para o cálculo da área desejada será necessário normalizar a curva na normal padrão que tem média 0 e desviopadrão 1 como mostrado na Figura 9 A variável Z normalizada é dada por onde μ 38 e σ desviopadrão da amostra é igual a 05 Portanto temse que Os valores 1 e 1 encontrados no gráfico de normalização são os resultados do cálculo de e Figura 9 Normalização pela normal padrão Inferência estatística 16 Para o cálculo das áreas a partir do 0 é utilizada a tabela da normal padrão Primeiramente verificase a área correspondente entre 0 e 1 A2 e encontrase o valor de 03413 pela simetria a área correspondente entre 0 e 1A1 também será de 03413 Com a soma dos dois valores achase a probabilidade Portanto a probabilidade de as médias das idades estar entre 375 e 385 é de 06823 ou seja 6826 no teorema central do limite fica claro que conforme aumentase o número de entrevistados a tendência é de melhor assertividade estatística e portanto o número porcentual aumenta Referências BECKER J L Estatística básica transformando dados em informação Porto Alegre Bookman 2015 DIAS M 9 tipos de amostragem probabilística e nãoprobabilística 2018 Disponível em httpswwwopuspesquisacomblogtecnicasamostragemOqueeamos traprobabilistica Acesso em 1 fev 2021 DOANE D P SEWARD L E Estatística aplicada à administração e economia 4 ed Porto Alegre AMGH 2014 FARIAS A M L de Inferência estatística Rio de Janeiro Instituto de Matemática 2008 Ebook FIELD A Descobrindo a estatística usando o SPSS 5 ed Porto Alegre Penso 2009 OCHOA C Amostra probabilística amostra por conglomerados 2015 Disponível em httpswwwnetquestcomblogbrblogbramostraconglomerados Acesso em 1 fev 2021 REIS M M Inferência estatística 2019 Disponível em httpswwwinfufscbrmarcelo menezesreisCap9pdf Acesso em 31 jan 2021 ROSSI J W Técnicas de amostragem e análise de regressão Lisboa Lisbon 2020 SHARDA R DELEN D TURBAN E Business intelligence e análise de dados para gestão do negócio 4 ed Porto Alegre Bookman 2019 UNIVERSIDADE FEDERAL DE SANTA CATARINA Estimação de parâmetros 20 Dis ponível em httpswwwinfufscbrandrezibettiprobabilidadeestimacaode parametroshtml Acesso em 1 fev 2021 Leituras recomendadas BRUCE P BRUCE A Estatística prática para cientistas de dados Rio de Janeiro Alta Books 2019 FREUND J E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2009 WHEELAN C Estatística o que é para que serve como funciona Rio de Janeiro Zahar 2016 Inferência estatística 17 Os links para sites da web fornecidos neste capítulo foram todos testados e seu funcionamento foi comprovado no momento da publicação do material No entanto a rede é extremamente dinâmica suas páginas estão constantemente mudando de local e conteúdo Assim os editores declaram não ter qualquer responsabilidade sobre qualidade precisão ou integralidade das informações referidas em tais links Inferência estatística 18