·

Cursos Gerais ·

Análise Matemática

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

PENSAMENTO LÓGICO E QUANTITATIVO Hélio Radke Bittencourt Aula 05 2 MAPA DA AULA Neste material você tem uma linha do tempo com os principais acontecimentos das videoaulas organizados nas seguintes seções Momentos importantes da disciplina Conceitos e termos relevantes para o conteúdo da aula Para lembrar Dinâmicas exercícios interativos e infográficos Para exercitar Para ir além Curiosidades personalidades e entretenimento Esta é uma versão simplificada do Mapa da Aula para impressão Os recursos interativos disponíveis no material não funcionarão nesta versão Para uma experiência mais enriquecedora acesse a versão completa do Mapa da Aula na aba AULAS 3 AULA 5 PARTE 1 Dando sequência às aulas do professor Alessandro Hélio Radke aborda os conteúdos de Pensamento Lógico e Quantitativo com ênfase em estatística iniciando pela Estatística Descritiva e avançando até culminar na parte de Estatística Inferencial em que é feita uma conexão com a parte inicial da disciplina Nesta primeira parte da aula o professor inicia com alguns tópicos iniciais de Estatística Descritiva definições básicas o que é População e Amostra o que são Parâmetros e Estimadores diferenciação entre Estatística Descritiva vs Inferencial e finalizando com um case relacionado ao Censo da população brasileira propondo algumas reflexões Introdução Definições básicas I Estatística é uma ciência empírica por natureza ou seja é uma ciência baseada em dados Trata desde a coleta dos dados até a parte de organização análise e interpretação dos dados experimentais Conjunto de dados é uma coleção de elementos podendo formar uma população ou universo Esses dois termos são utilizados como sinônimo nesse contexto e Hélio explica que os elementos de análise não precisam ser exatamente pessoas e são exemplos populações de carros populações de notas fiscais de uma empresa para questões de auditoria população de água de um lago população de ar população de arquivos digitais entre outros exemplos Quando trabalhamos com uma parte dessa população estamos trabalhando com uma amostra A partir dessa amostra pretendese tirar conclusões acerca dessa população Em geral buscamse amostras que sejam representativas da população ou seja amostras que consigam naquele pequeno conjunto manter as características da população a qual ela foi extraída Nesse ponto o professor explica que a aleatoriedade é um fator importante A aleatoriedade é uma forte aliada do pesquisador Definidos o que são população e amostra é importante entender os termos ou números que caracterizam uma população e uma amostra Na amostra esses termos ou números que a caracterizam são chamados de parâmetros e são exemplos média populacional μ desviopadrão σ proporção p Definições básicas II Parâmetros são números que caracterizam uma população 0015 0136 0511 4 Na sequência é trazida uma representação em que a População é formada N elementos o professor explica que N é uma simbologia utilizada e que pode representar até um grupo infinito de elementos e a amostra por n elementos Os procedimentos para extração dos elementos da população para formar a amostra são chamados de amostragem Todas as conclusões que transcendem a amostra ou seja as conclusões da amostra que extrapolam para a população são chamadas de inferência estatística No contexto da amostra existem os estimadores e são exemplos média amostral x desviopadrão amostral S proporção amostral p 0719 Ciência que tem por objetivo o estudo dos dados para extrair insights significativos para os negócios e empresas Ciência de Dados Business Intelligence ou BI pode ser traduzido como inteligência de negócios e referese ao processo de coleta organização análise compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios Business Intelligence Pode ser traduzido como painel e é um tipo de interface gráfica que geralmente fornece uma visualização dos principais indicadores de desempenho de um determinado objetivo ou processo de um negócio Dashboard A partir deste momento da aula o professor Hélio traz definições de Estatística Descritiva e Inferencial A parte de Estatística Descritiva se atém a resumir informação de um conjunto de dados sem pretensões de extrapolar Muito utilizada no contexto de Ciência de Dados Business Intelligence e Dashboards em que se busca resumir informações através de painéis que facilitem essa visualização Já na Estatística Inferencial buscase extrapolar os resultados para a população inteira Para tanto a Estatística Inferencial fica alicerçada sobre dois pilares amostragem e probabilidade Amostragem é a maneira como a amostra é formada e as conclusões tiradas por serem baseadas em amostra e não na população inteira são conclusões em probabilidade ou seja não são conclusões livres de erro Definições básicas III Sempre que trabalhamos com Estatística Inferencial temos o erro como companheiro 5 O professor traz um glossário com alguns conceitos trabalhados em aula Estatística descritiva se limita a organizar e descrever dados sem a pretensão de extrapolar os resultados para toda a população Estatística inferencial os resultados amostrais são projetados para toda a população da qual a amostra foi extraída Amostragem conjunto de técnicas para selecionar os elementos da população que irão compor a amostra Probabilidade área da Matemática que trata de fenômenos aleatórios Glossário Introdução ao case A partir deste momento da aula o professor traz a seguinte reflexão Será que podemos confiar nos resultados de uma amostra para fazer as projeções para a população Para buscar responder essa pergunta complexa e aumentar o entendimento geral acerca da Estatística inferencial o professor traz um case para mostrar que é possível sim confiar em pesquisas por amostragem Toda essa teoria que sustenta a Inferência Estatística é bastante sólida Facilmente com simulações a gente mostra que isso funciona Contudo o professor ressalta que é importante saber que sempre existe a possibilidade de a amostra não retratar a realidade embora seja possível minimizar os riscos Ao falar sobre o case o professor sugere a reflexão sobre o contexto da população brasileira de aproximadamente 215 milhões de habitantes e sobre o Censo da população brasileira realizado pelo IBGE em 2022 e que acontece de 10 em 10 anos Por se tratar de um país com dimensões continentais o professor Hélio explica que a realização do Censo gera um custo elevado e dá o exemplo de 2022 R 229290708700 Em dólares esse valor representa aproximadamente 460 milhões Para o exercício do case o professor considerou para a população N 201000000 aproximadamente 3 pessoas por domicílio e 70 milhões de domicílios a serem visitados Case As pesquisas do Censo do IBGE não são feitas com os indivíduos elas são feitas com as famílias por domicílio Considerando o custo a população e os domicílios o custo de cada entrevista resultou em aproximadamente R 3300 por entrevista Considerando que existem custos fixos e não apenas custos variáveis o professor sugere a triplicação do valor de modo que cada entrevista custasse R 9900 ou seja trabalhando com 10 mil lares o valor total iria para R 99000000 o que representa menos de 004 do orçamento do Censo 2022 0858 0907 1032 6 Aumentando o tamanho da amostra para 50 mil domicílios o valor aumenta para aproximadamente 5 milhões o que representa 022 do orçamento do Censo 2022 150 mil domicílios em torno de 15 milhões e menos de 1 do orçamento do Censo 2022 065 200 mil domicílios 198 milhões de reais e 086 do Censo 2022 200 mil domicílios bemfeitos praticamente dão o mesmo resultado 1744 Razões para trabalhar com amostragem Economia de tempo Economia de dinheiro Equipe pode ser melhor treinada O professor explica que ao trabalhar em escala nacional o controle custa mais caro e é mais difícil de obter um treinamento melhor para os entrevistadores Se eu fizer uma pesquisa com um número menor de domicílios eu consigo treinar melhor as pessoas O professor deixa dois links adicionais para complementar os estudos Orçamento do Censo 2022 Como funciona o aplicativo Shazam Para saber mais Estatística Descritiva e Inferencial Relacione os tipos de estatística coluna 1 com as afirmações respectivas que as representam coluna 2 clicando nas opções TIPO DE ESTATÍSTICA AFIRMAÇÃO Inferencial Se atém a resumir informação de um conjunto de dados sem pretensões de extrapolar Busca extrapolar os resultados para a população inteira Fica alicerçada sobre dois pilares amostragem e probabilidade Descritiva 7 AULA 5 PARTE 2 Foi visto anteriormente que um conjunto de dados é composto por elementos Utilizando pessoas como exemplo de elemento o professor sugere a reflexão sobre as características desses elementos que formam o conjunto de dados ou seja as variáveis desses elementos e lista alguns exemplos sexo faixa etária nº de filhos peso altura Conjuntos de dados Variáveis são características dos elementos que formam o conjunto de dados As variáveis vão se dividir em dois grandes grupos Também chamadas de categóricas são variáveis que expressam uma divisão em categorias São subdivididas em nominais e ordinais Qualitativas Também chamadas de métricas são aquelas que precisamos medir ou contar e que possuem um significado numérico de quantidade Quantitativas Variáveis qualitativas Todos os identificadores que temos em nossa vida como RG CPF curso nacionalidade Estado Civil são consideradas variáveis qualitativas nominais Essas categorias simplesmente são diferenciáveis eu não tenho uma questão de hierarquia Já nas ordinais temos categorias hierarquizáveis O professor traz o exemplo de escalas de avaliação de dor ou satisfação que são variáveis difíceis de diagnosticar por não existir à disposição um aparelho específico para realizar a mensuração Além disso o professor dá o exemplo de estrelas de hotel conceito ENADE para cursos de graduação ou CAPES para os cursos de pósgraduação divisão de semestres que são medidas que possuem uma hierarquia mas em que não é possível estabelecer um valor métrico entre as categorias 0113 0240 8 Por que saber classificar uma variável A escolha das ferramentas em estatística depende de saber classificar corretamente uma variável No momento em que eu sei classificar corretamente uma variável eu tenho uma probabilidade maior de tomar a decisão correta na hora da escolha da ferramenta Uma empresa pode ter um NPS de 100 até 100 Todas as variáveis binárias ou seja do tipo simnão check failed gono go entre outras são classificadas como qualitativas nominais uma vez que para ter hierarquia são necessárias pelo menos três categorias ou níveis Outra variável importante comentada pelo professor é o NPS ou Net Promoter Score que representa um indicador do quão provável é que um indivíduo indique para um amigo um dado serviço ou produto que esteja utilizando O NPS utiliza como base a escala ordinal de 0 a 10 em que os que avaliam de 0 a 6 são considerados detratores os que avaliam 7 ou 8 estão na zona neutra e quem avalia 9 ou 10 são chamados de promotores O cálculo do NPS consiste no percentual de promotores subtraído do percentual de detratores Subdivididas em discretas e contínuas As discretas são enumeráveis ou seja são aquelas que podemos contar São exemplos número de disciplinas número de créditos número de faltas As variáveis contínuas são aquelas que precisamos medir ou pesar Variáveis quantitativas A gente consegue mostrar que as variáveis contínuas existem só que elas são de difícil mensuração As variáveis contínuas na verdade existem no campo teórico Porque no campo prático todas as variáveis acabam se tornando discretas As variáveis contínuas existem na teoria conseguimos enxergar que elas existem mas na hora de fazermos as medições somos obrigados a discretizálas São exemplos de variáveis contínuas altura peso tempo e temperatura Na prática o professor explica todas as variáveis se tornam discretas devido à limitação dos instrumentos de medida O professor explica que embora haja consenso sobre a existência da variável é necessário registrála e ao fazer isso colocamos um número com uma precisão préfixada precisão esta que acaba sendo discreta Para classificar uma variável pensem na teoria e não na prática 0703 1432 9 Todos os softwares em algum momento arredondam porque não teria poder computacional para lidar com o infinito As variáveis quantitativas são as mais ricas em informação Se eu tenho uma variável na origem nominal eu não vou conseguir transformála em contínua Para esclarecer ainda mais a diferença de variável contínua e discreta o professor dá o exemplo da variável Pi π no contexto da ferramenta Excel explicando que os valores são desprezados após a décima terceira casa decimal ou seja o valor é arredondado Por exemplo 3141592653589790000000 O professor comenta também sobre o valor monetário ressaltando que embora as moedas e cédulas na carteira pareçam entes discretos por se tratar de itens enumeráveis é classificado como uma variável quantitativa contínua Por fim o professor Hélio traz a escala em ordem de riqueza em informação explicando que as variáveis quantitativas são as mais ricas em informação De uma variável quantitativa contínua é sempre possível descer para o nível de uma variável quantitativa discreta para o nível de uma ordinal e de uma nominal mas o contrário não O Net Promoter Score NPS é uma ferramenta simples para medir os sentimentos pósconsumo e intenções futuras do cliente através da pergunta Qual a probabilidade de você recomendar nossa empresamarca produto para uma amigoa colega ou parente A escala de avaliação é de 0 extremamente baixa a 10 extremamente alta Uma outra vantagem do NPS é que você pode comparar a sua nota com as de diversas outras empresas para descobrir como você está em relação ao mercado As notas médias podem variar de acordo com o ramo de atuação de empresa mas podemos estabelecer de modo geral a seguinte escala de classificação Zona de excelência NPS entre 75 e 100 Zona de qualidade NPS entre 50 e 74 Zona de aperfeiçoamento NPS entre 0 e 49 Zona crítica NPS entre 100 e 1 NPS Novamente o professor deixa dois links adicionais para complementar os estudos O que é o NPS Quantos anos meses dias horas minutos e segundos de vida eu tenho Para saber mais 10 AULA 5 PARTE 3 Depois de apresentar definições prévias e abordar como se classificam variáveis a partir desta terceira parte da aula o professor Hélio começa a trabalhar com ferramentas mais práticas visando como ajudar a organizar e apresentar os dados coletados de uma forma que sejam facilmente lidos e transformálos em informação que é o objetivo da estatística descritiva Introdução O conhecimento do tipo de variável vai ser necessário para que a gente organize os dados de maneira correta Para acompanhar a aula o professor Hélio sinaliza que é necessária a ferramenta Microsoft Excel Demonstração prática I A partir de um conjunto de dados formado por 20 professores em que foram coletados sexo nível de instrução nº de pessoas por domicílio idade e altura o professor realiza uma demonstração prática O arquivo utilizado em aula encontrase disponível na plataforma Iniciando a sequência de ferramentas o professor comenta primeiramente sobre as tabelas de frequência simples Representações tabulares que apresentam de forma concisa o número de ocorrências das categorias ou valores de uma variável Tabelas de frequência simples X variável xi particular valor de X fi frequência absoluta do valor xi fri frequência relativa do valor xi Fi frequência acumulada do valor xi Fri frequência relativa acumulada do valor xi Notação Às vezes a coisa mais importante que se faz em um tratamento de dados são as tabelas de frequência e elas bastam 0000 0153 11 Utilizando a ferramenta Excel o professor faz uma demonstração prática de como realizar uma tabela de frequência usando os comandos básicos O banco de dados utilizado se encontra nos materiais da aula Para exemplificar uma frequência absoluta o professor utiliza três expressões ao trabalhar com a distribuição dos professores do banco de dados por sexo Para identificar o número de sujeitos do sexo masculino CONTSEB2B21H4 Para identificar o número de sujeitos do sexo feminino CONTSEB2B21H5 Expressão para somar os elementos SOMAI4I5 Para exemplificar a frequência relativa ou seja a frequência em percentual são utilizadas as frações nas seguintes expressões I4I6 I5I6 SOMAJ4J5 Demonstração prática II Demonstração prática III Na sequência Hélio aplica a mesma lógica para o grau de instrução da lista de professores do banco de dados A maior parte nem sempre é a maioria A maioria sempre é a maior parte Em seguida o professor aborda o número de pessoas por domicílio que por sua vez é uma variável quantitativa discreta O professor explica que se costuma incluir colunas de frequência acumulada ao trabalhar variáveis que envolvem quantidade 0548 1227 12 Ao trabalhar a distribuição dos professores por idade o professor explica que foram criadas faixas etárias que é característica de uma variável contínua Demonstração prática IV Ao trabalhar a distribuição dos professores por altura também foram utilizadas faixas Análise gráfica I A partir deste momento da aula Hélio ressalta que variáveis contínuas pressupõem maior cuidado na parte de análise gráfica O professor complementa ainda que o tipo de gráfico ou tabela depende do tipo de variável e apresenta alguns exemplos de geração de gráfico No caso de variável qualitativa nominal com poucas categorias como por exemplo a distribuição dos professores por sexo ela pode ser apresentada na forma de gráfico de setores ou gráfico de pizza como também é chamado Esse tipo de gráfico é utilizado principalmente nas chamadas mídias de massa O professor Hélio sugere que o gráfico de setores seja utilizado para aproximadamente até 4 categorias pois com um grande volume de categorias a visualização pode não ficar adequada Para que utilizamos um gráfico Para transmitir a informação para o leitor de uma maneira mais rápida 1920 2033 13 Ao comentar sobre o contexto de uma variável qualitativa nominal com muitas categorias o professor demonstra um gráfico de colunas a partir de uma base de alunos e seus respectivos cursos É sugerida a disposição das colunas em ordem decrescente para melhor visualização Análise gráfica II A linha laranja representa a frequência relativa acumulada e o professor complementa que ela só faz sentido em gráficos de variáveis qualitativas nominais se estiver ordenada de forma decrescente A disposição gráfica da imagem acima é chamada de Diagrama de Pareto Análise gráfica III Ao falar sobre as variáveis qualitativas ordinais ou seja aquelas em que as categorias são ordenadas o professor apresenta um gráfico ordinal de colunas Se a variável é quantitativa ordinal a ordem tem que ser respeitada 2216 2341 14 Análise gráfica V Ao trabalhar com variável quantitativa contínua o professor cita a importância da criação de intervalos ao invés da utilização de valores distantes como no exemplo anterior O gráfico apresentado para este tipo de variável é o histograma O histograma é um gráfico que respeita o fato de uma variável ser quantitativa contínua Por que o histograma é uma ferramenta que usamos tanto em estatística Porque ela permite a gente ter uma ideia do comportamento probabilístico de uma variável O histograma é uma ferramenta que fica mais interessante de ser usada quando eu tenho um grande volume de dados O exemplo seguinte é referente às variáveis quantitativas discretas com o nº de pessoas por domicílio Nestes casos Hélio alerta que a métrica precisa ser respeitada Análise gráfica IV Por fim o professor traz um quadro resumo com os tipos de variáveis e suas respectivas sugestões de gráfico Análise gráfica VI 2424 2811 2459 15 Freak Show Como conteúdo adicional o professor traz um vídeo em que demonstra o que não fazer em um gráfico Clique aqui para assistir 16 AULA 5 PARTE 4 Vistas as tabelas de frequência e os tipos de gráficos o professor Hélio nesta parte da aula trata sobre as medidas de tendência central e de posição Para tanto é realizada outra demonstração a partir da ferramenta Excel utilizando o mesmo conjunto de dados de 20 professores visto anteriormente mas neste momento é dada ênfase para as variáveis quantitativas Introdução As variáveis qualitativas nominais são aquelas que mais restringem o pesquisador em relação ao uso de técnicas estatísticas Na demonstração é dada ênfase para a variável de nº de pessoas por domicílio O professor comenta que existem duas maneiras de proceder com as medidas de posição apresentadas é possível partir dos dados isolados ou seja onde temse as observações para cada um dos elementos do conjunto de dados ou a partir de uma tabela de frequência Medidas de Tendência Central São medidas que indicam a região em torno da qual os dados estão posicionados ou seja dão uma ideia da região central onde os dados estão orbitando As três medidas de posição mais conhecidas são a média a mediana e a moda Antes de detalhar cada uma delas o professor formaliza a notação matemática utilizada nas demonstrações da aula X variável xi particular valor de X Somatório Σ n tamanho da amostra N tamanho da população x média amostral μ média populacional Md Mediana Mo Moda O professor explica que todos os conjuntos de dados tratados no exemplo são amostras ou seja será dada ênfase na notação amostral 0000 0305 17 A média aritmética é definida como a soma de todas as observações da variável X dividida pelo número de elementos do conjunto de dados Frequentemente a média aritmética é o valor que melhor representa um conjunto de dados Média Aritmética Se eu conheço a média eu consigo estimar o total Mediana É o valor que divide o conjunto de dados ordenado em duas partes com igual número de observações Mediana é aquele valor que se eu ordenar os dados do menor ao maior corta meu banco de dados ao meio Mediana sem ordenar os dados é um erro grave Mediana pressupõe um ordenamento Se eu tenho um número par de elementos a mediana vai ser a média dos dois centrais É definida como o valor mais frequente de um conjunto de dados É possível que o conjunto seja bimodal duas modas ou até mesmo multimodal três ou mais modas Moda Eu posso ter conjunto de dados com número de moda variado O professor explica que graficamente a moda é localizada nos pontos mais altos de um gráfico de frequências 0637 1730 1204 18 Média é a medida de tendência central que mais considera informação no seu cálculo Então eu extraio toda informação possível dos dados A média tem esse problema ela pode ser fortemente influenciada por valores extremos Dentro do contexto do Microsoft Excel o professor explica que temos todas as medidas de tendência central disponíveis através de comandos simples e dá um exemplo para cada um partindo do banco de dados disponibilizado Exemplo de média MÉDIAD2D21 Exemplo de mediana MEDD2D21 Exemplo de moda MODOD2D21 Considerações sobre as medidas de tendência central 1 A média é a MTC mais influenciada por valores extremos entretanto é a medida mais rica porque considera todos os valores do conjunto de dados 2 A mediana não é afetada por valores extremos 3 A moda assim como a mediana também não é afetada por valores extremos O professor comenta que a moda é a MTC mais pobre uma vez que considera apenas os valores mais frequentes Média mediana e moda O professor apresentou a definição de média mediana e moda Clique nas opções abaixo e relacione as colunas MEDIDA DEFINIÇÃO 2105 Média Soma de todas as observações da variável X dividida pelo número de elementos do conjunto de dados É definida como o valor mais frequente de um conjunto de dados É o valor que divide o conjunto de dados ordenado em duas partes com igual número de observações Moda Mediana 19 AULA 5 PARTE 5 Na última parte da Aula 5 são explorados os conteúdos referentes a separatrizes e medidas de variabilidade Introdução Se a gente só apresenta as medidas de tendência central talvez a gente não tenha informação suficiente do que está acontecendo de fato naquele meu conjunto de dados A mediana às vezes é muito mais interessante de ser conhecida do que a própria média São valores que dividem ou separam o conjunto de dados ordenado em partes com igual número de observações Separatrizes Diante do conceito acima o professor questiona qual das medidas de tendência central estudada é uma separatriz e explica que é a mediana Além da mediana existem os quartis ou seja a divisão do conjunto de dados em quatro partes os decis em dez partes e os percentis em cem partes com igual número de observações Exemplo I O professor então traz um exemplo de um boletim de um aluno que tirou 425 de 100 em uma prova nota que parece baixa em um primeiro momento mas que a partir da análise das separatrizes é possível observar que a nota estava muito além da mediana que era 26 e do percentil P75 que era 335 Nesses tipos de avaliações em larga escala como ENADE e o antigo Provão essas estatísticas baseadas em percentis sempre são apresentadas para o aluno nos boletins individuais Assim o aluno consegue saber em qual parte do grande grupo que fez a prova ele está localizado Na sequência Hélio traz um exemplo de separatriz no contexto de renda domiciliar per capita no Brasil explicando que uma pessoa com renda acima do percentil P95 que equivale a R 4433 per capita já contempla o grupo dos 5 mais ricos do país 0000 0550 20 O professor também traz um exemplo de um gráfico da ONU que apresenta índices de peso e idade no desenvolvimento de um grande grupo de crianças do nascimento até 5 anos Exemplo II No gráfico é possível observar os percentis e o professor explica que a mediana percentil 50 está representado pela linha verde Índices mais próximos dos percentis 85 e 97 representam risco de obesidade enquanto índices próximos dos percentis 15 e 3 representam risco de desnutrição Dessa forma portanto é possível acompanhar o desenvolvimento de uma criança a partir de uma régua de percentis Percentis são utilizados em várias áreas e são uma ferramenta bastante interessante BOXPLOT Uma maneira de apresentarmos os resultados das separatrizes e dos percentis de uma maneira mais visual é na forma de um BOXPLOT que se trata de uma representação gráfica da variação de dados observados de uma variável numérica por meio de quartis A linha que divide a caixinha é a mediana e os extremos da caixinha são representados pelos percentis P25 e P75 A distância entre esses percentis 25 e 75 é chamada de IQR ou seja amplitude interquartílica do inglês interquartile range As linhas que ficam para fora da caixinha indicam o máximo e o mínimo Quanto maiores são as caixinhas maior a variabilidade dos dados e quanto mais concentrada a caixinha menor a variabilidade dos dados Hélio comenta que é uma ferramenta bastante concisa para identificar se os dados estão muito dispersos ou concentrados 1143 1331 21 De acordo com o professor são uma maneira de complementar as medidas de tendência central As medidas de variabilidade trazem informação sobre a dispersão existente no conjunto de dados Para introduzir o assunto o professor recorre ao que chama de um exemplo motivador em que apresenta o número de vendas diárias realizadas por três vendedores em um período de 6 dias Medidas de variabilidade O professor explica que embora o comportamento observado seja diferente em cada um dos vendedores ao calcular as tendências de medida central média moda e mediana dos 3 vendedores encontrase o mesmo resultado 2 É explicado que o que diferencia o conjunto de dados apresentado portanto é a variabilidade E para quantificar e traduzir a variação existente entre um vendedor e outro são utilizadas as medidas de variabilidade A gente tem que ter cuidado ao analisar medida de tendência central isoladamente Amplitude Representado pela letra R do termo range em inglês é a diferença entre o maior e o menor valor de um conjunto de dados Fazendo a conta de subtrair o valor máximo pelo mínimo para os três vendedores a amplitude resultante foi de 0 para o vendedor A 2 para o vendedor B e 6 para o vendedor C O professor então explica que o grande problema da amplitude é que ela considera apenas dois valores do conjunto de dados desprezando muitas informações Para melhorar a quantificação da variabilidade calculase a variância Variância negativa não existe Variância É uma medida da variabilidade em torno da média Nela todos os valores do conjunto de dados são considerados Além disso a variância leva em consideração o quadrado das diferenças em relação à média garantindo que seu valor sempre seja positivo As variâncias calculadas para os vendedores A B e C foram de respectivamente 0 04 vendas² e 48 vendas² O problema da variância conforme o conteúdo exposto é a sua unidade estar ao quadrado da unidade original 1538 1839 2122 22 Medida de variabilidade amplamente utilizada representa a raiz quadrada positiva da variância O desviopadrão expressa a variação média no conjunto de dados em torno da média Desviopadrão Notem que desviopadrão e variância são medidas equivalentes porque de uma eu consigo chegar na outra sem precisar de nenhuma informação adicional Coeficiente de Variação É a razão entre o desviopadrão e a média O coeficiente de variação vai apresentar a variabilidade em termos relativos da média Vai ser expresso em percentual Na tabela abaixo é possível observar os valores de Coeficiente de Variação para os vendedores A B e C 2540 2712 Sobre amplitude O problema da amplitude é a sua unidade estar ao quadrado da unidade original O problema da amplitude é que ela considera apenas dois valores do conjunto de dados desprezando muitas informações Verdadeiro Falso Verdadeiro Falso PUCRS online