Grande parte dos fenômenos da natureza têm uma característica aleatória, sendo que grande parte dessas assumem uma distribuição normal. Segundo a mecânica de newton, se você conhecer o estado inicial de um dado, como aceleração, velocidade e posição, você tem a capacidade de prever a posição final dele após ser arremessado. Contudo, na prática, esses parâmetros iniciais envolvem tantas variáveis desconhecidas que a posição final do dado é aleatória, imprevisível.
Isso acaba se repetindo em vários outros fenômenos naturais, e a distribuição normal é muito importante para descrevê-los.
Distribuição normal: O que é uma variável aleatória?
Uma variável aleatória é uma função que mapeia uma condição, que é aleatória, a um valor numérico. Ou seja, associamos um elemento de um conjunto amostral a um número. Podemos calcular a probabilidade de uma variável aleatória assumir um valor específico, ou assumir um valor dentro de um intervalo específico. Existem dois principais tipos de variáveis aleatórias:
Variável aleatória discreta
Variáveis aleatórias discretas são aquelas em que temos uma quantidade finita de estados possíveis, e a cada estado representamos um valor. Um grande exemplo disso é a variável aleatória que define o resultado numérico que pode resultar no lançamento de um dado.
Existem 6 estados possíveis, que são as 6 faces diferentes que podem ficar na posição frontal após o arremesso. A cada face associamos a um número, no caso, 1 a 6.
Nesse caso, cada estado tem uma probabilidade de ocorrer. Por exemplo, a probabilidade do arremesso de um dado dar em algum número específico é de ⅙. Já a probabilidade do valor do dado resultar em um número menor ou igual a 3 é 3/6 = 1/2 . Isso porque temos 3 possibilidades de resultados, em relação aos 6 resultados possíveis.
Variável aleatória contínua
Diferentemente da variável aleatória discreta, a VA(Variável Aleatória) contínua pode assumir uma quantidade infinita de valores numéricos. Um grande exemplo desse tipo de variável aleatória é a variável que associa a altura de uma pessoa a um valor numérico. Essa VA é contínua porque, se alguém na rua for sorteado para medir sua altura, o valor obtido pode ser qualquer valor, qualquer um mesmo.
uma característica importante das VA’s contínuas é que a probabilidade dessa de uma VA desse tipo assumir um valor específico é zero. Isso mesmo, a probabilidade de sortear alguém na rua e essa pessoa ter exatamente 1,80m é zero. Isso por que, como o valor da altura de alguém é contínuo, dificilmente ele será 1,800, ele pode ser 1,800002, ou até mesmo 1,8000000000001, ou uma quantidade infinita de valores próximos a esse valor, de forma que a probabilidade de ser exatamente 1,80 é zero. Na realidade, não existe como saber qual valor exatamente é, por que os instrumentos de medida não chegam a grandes precisões.
Por isso, em VA’s contínuas podemos calcular a probabilidade do valor estar dentro de um intervalo. Por exemplo, a probabilidade de sortear alguém na rua e sua altura estiver entre 1,70m e 1,80m. Para realizar esses cálculos, precisamos saber a distribuição que essa VA assume.
Distribuição normal: A distribuição mais comum
O tipo mais comum de distribuição contínua é a distribuição normal, ou gaussiana. Essa distribuição se repete muito na natureza, e é bastante conhecida por sua curva ser similar a de um sino.
Notamos que no eixo x estão os valores possíveis que a VA pode assumir. Dizemos que a VA acima tem média igual a 0, pois ela é simétrica e seu pico está centrado nesse valor. A média é um parâmetro da distribuição normal, que é onde o pico do sino está posicionado.
Outro parâmetro da distribuição gaussiana é a variância, que está relacionada com a largura do sino. Um sino mais ‘fininho’ tem uma variância menor, Já um sino ‘gordinho’ tem uma variância maior. Podemos definir uma distribuição qualquer como N(X,Y), onde X é a média e Y é a variância.
O cálculo da probabilidade de uma VA que assume uma distribuição gaussiana ser um valor dentro de um intervalo é igual a área abaixo do gráfico do sino naquele intervalo. A área abaixo de toda a curva equivale a 1, ou seja, temos 100 % de probabilidade do valor da VA assumir qualquer valor do intervalo todo, afinal, estamos considerando todo o intervalo, isso é óbvio.
Já a probabilidade da VA assumir um valor específico é igual a zero, pois não temos uma área associada a um ponto, e sim a um intervalo.
Para realizar o cálculo das probabilidades em um intervalo, precisamos da tabela da normal, pois calcular a área da curva normal analiticamente é impossível, por isso eu nem mostrei como é a função dela aqui, pois ela é meio inútil na grande maioria dos casos.
Conclusão
Em suma, vimos o que é uma distribuição normal e suas principais características. Esse tipo de distribuição é muito comum e de extrema importância, por isso, espero que tenha ficado muito claro os principais conceitos. Aproveitando que estamos falando sobre estatística, você pode ler sobre simulação de monte carlo, um importante método que envolve aleatoriedade. Até a próxima!
Referências
https://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_normal
https://pt.wikipedia.org/wiki/Vari%C3%A1vel_aleat%C3%B3ria
Ícones feitos por fjstudio from www.flaticon.com’