Causalidade, correlação e sorvetes assassinos

Entre para nossa lista e receba conteúdos exclusivos!

A noção de causalidade é um dos elementos mais importantes dentro das ciências naturais. Ademais, a noção de causalidade ainda emerge nos contextos estatísticos sendo responsável por dar causas a fenômenos que são vistos em certos dados. Todavia, muitas vezes as noções de causalidade aparecem empregadas de forma errada tanto em trabalhos científicos quanto na análise de dados.

Nesse sentido, outras noções importantes que permeiam a ciência, como a correlação, confundem-se com a causalidade de eventos levando pesquisas a resultados extraordinários e até mesmo malucos. Tendo isso em vista, nesse artigo nós da MeuGuru elaboramos esse artigo com a finalidade de explicar os conceitos que permeiam as noções de causalidade.

De fato, o correto entendimento sobre causalidade e correlação permite que nossa compreensão apurada sobre fenômenos naturais. Ademais, ao passo que consolidamos esse conhecimento podemos ainda evitar equívocos sérios que podem até mesmo levar sorvetes ao tribunal como suspeitos de assassinatos.

O que é a causalidade ?

De início, é importante entendermos um pouco sobre a noção de causalidade. Ademais, é ainda necessário que façamos a ressalva significativa sobre esse conceito. De fato, o termo causalidade aparece recorrentemente em diversas áreas da ciência, em particular, na física. Com efeito, quando esse é associado a física, temos um cuidado de que esse termo liga-se a noções causais de eventos que possuem uma determinada causa. Por exemplo, no contexto da eletrodinâmica, citamos as funções de Green retardadas que aparecem como soluções causais para a propagação de ondas eletromagnéticas.

Todavia, aqui estaremos interessado num conceito, que por mais que seja similar, é ligado ainda a causa de fenômenos mais gerais e arbitrários que são obtidos a partir de medições e dados e não específicos e/ou particulares de uma dada área.

Assim, podemos definir a causalidade como a ideia de que um evento ou fenômeno específico é responsável por desencadear ou influenciar outro evento ou fenômeno. Na ciência, estabelecer relações causais sólidas é essencial para compreender os processos naturais e sociais. No entanto, determinar a verdadeira causalidade pode ser um desafio complexo. Muitas vezes, recorre-se a métodos de inferência causal e experimentação para investigar as relações entre variáveis e identificar possíveis mecanismos causais.

Como descobrir a verdadeira causalidade ?

Nesse sentido, uma questão que emerge é saber como é possível determinar a causa dos fenômenos naturais. Com efeito, estudo da causalidade pode ser feito de várias maneiras, em particular, há a abordagem de “causalidade de manipulação” concentra-se na relação causal entre variáveis manipuláveis e usa experimentos controlados para determinar o impacto de uma variável na outra. A “causalidade observacional” é outra abordagem que busca encontrar relações causais com dados observacionais, levando em consideração variáveis de confusão e possíveis vieses.

A inferência causal e o aprendizado de máquina causal são dois campos em que a causalidade tem sido amplamente estudada nos últimos anos. Os métodos e algoritmos utilizados nessas abordagens visam estimar relações causais com dados observacionais ou experimentais. Todavia, ainda estamos longe de termos algum algoritmo que realmente obtenha a relação de causalidade correta.

O conceito de correlação

Conforme mencionamos anteriormente, muitas vezes identificar a causalidade correta é um grande desafio e é justamente esse fato que torna esse problema tão difícil de ser resolvido. Em suma, essa questão emerge de um problema particular que temos com as chamadas correlações. Nesse sentido, é necessário definirmos o que é correlação.

Com efeito, dizemos que correlação é um conceito estatístico que descreve a relação entre duas variáveis. Assim, ela é uma medida estatística que indica a força e a direção dessa relação. Quando duas variáveis estão correlacionadas, significa que há uma associação entre elas, mas não necessariamente uma relação de causa e efeito.

O coeficiente de correlação, que está entre -1 e +1, mostra a correlação. Um coeficiente de correlação de +1 indica uma correlação perfeita positiva, o que significa que as duas variáveis aumentam ou diminuem proporcionalmente umas às outras. Por exemplo, a altura e o peso de uma pessoa podem estar positivamente correlacionados, pois pessoas mais altas geralmente têm maior peso.

Por outro lado, um coeficiente de correlação de -1 indica uma correlação perfeita negativa, indicando que as duas variáveis têm uma relação inversa. A relação entre o preço de um produto e a demanda por ele é um exemplo de uma correlação negativa. A demanda tende a diminuir com o aumento dos preços.

A relação entre causalidade e correlações

Agora, de posse das noções tanto de causalidade e correlação podemos destacar uma máxima importante: a causalidade não implica necessariamente em uma relação de causa e efeito direta e unidirecional. Em muitos casos, as relações causais podem ser complexas e envolver feedbacks, retroalimentações e interações entre várias variáveis.

De fato, essa noção pode parecer intrigante, no entanto, é essencialmente importante que tenhamos em mente que não importa o quanto duas variáveis sejam bem correlacionadas a relação de causa entre elas é independente dessa correlação.

Algorítimos estatísticos e inferências científicas

De fato, essa noção se mostra suficientemente importantes quando analisamos questões envolvendo dados estatísticos. Com efeito, o avanço do poder computacional permite que nós hoje conheçamos métodos estatísticos poderosos que nos permitem avaliar quantidades enormes de dados e estabelecer noções e correlações entre os mesmos.

Todavia, há vários estudiosos que mostram que a partir do momento que temos uma grande quantidade de dados é possível que você estabeleça correlações de forma arbitrária. Ademais, com isso é possível até mesmo que a a partir de algoritmos de inteligências artificiais seja possível estabelecer leis físicas como a própria segunda lei de Newton.

Todavia, tomando esse exemplo, a inteligência artificial, por mais que fosse capaz de estabelecer a relação F=ma, não seria capaz de compreender como uma força é originada ou mesmo qual parâmetro que ao existir no sistema faz com que o outro exista. Assim, não há como definir a causa correta do fenômeno físico.

Interpretações erradas e sorvetes assasinos

Nesse contexto, podemos elencar um divertido exemplo que ilustra com praticidade a noção de como correlações não implicam em causalidade. Com efeito, imagine que estamos durante o período do verão, logo, a temperatura da cidade aumenta consideravelmente e as pessoas procuram ir a praia para refrescar-se tanto pela água quanto tomando sorvetes.

Assim, é evidente que o consumo de sorvetes nessa época do ano aumente. Entretanto, como há mais pessoas na praia isso implica também que há um número maior de assaltos na praia. Nesse sentido, se analisarmos nossas variáveis veremos que o consumo de sorvetes e assaltos na praia deverão estar fortemente correlacionadas. Todavia, dizer que o consumo de sorvetes é a causa dos assaltos na praia é algo absurdamente irreal.

causalidade
Figura 1. Esquematização da associação entre a estação verão, consumo de sorvetes e roubos.

Nesse sentido, vemos que a causa que é a estação do ano relaciona as duas variáveis que também estão relacionadas entre si mas não são causas uma da outra.

Ademais, podemos ainda estender esse pensamento para várias outras noções, por exemplo, imagine o cenário em que em vez de considerarmos a quantidade de assaltos na praia tomarmos a quantidade de mortes por afogamento na praia. Nesse caso, veremos que, pelo pensamento errado de que correlações implicam em causalidade, os sorvetes seriam verdadeiros assassinos.

Referências

  1. PEARL, Judea. Causal inference in statistics: An overview. Statistics Surveys, [S.l.], v. 3, n. 0, p. 96-146, 2009.
  2. RUBIN, Donald B. Causal inference using potential outcomes: Design, modeling, decisions. Journal of the American Statistical Association, [S.l.], v. 100, n. 469, p. 322-331, 2005.
  3. GLYMOUR, Clark; COOPER, Greg. F. Computation, causation, and discovery. Artificial Intelligence, [S.l.], v. 118, n. 1-2, p. 115-153, 1999.
  4. EARL, Judea; GLYMOUR, Madelyn; JEWELL, Nicholas P. Causal Inference in Statistics: A Primer. [S.l.]: [s.n.], 2016.
  5. MORGAN, Stephen L.; WINSHIP, Christopher. Counterfactuals and Causal Inference: Methods and Principles for Social Research. [S.l.]: [s.n.], 2014.
  6. HOLLAND, Paul W. Statistics and causal inference. Journal of the American Statistical Association, [S.l.], v. 81, n. 396, p. 945-960, 1986.
  7. CAUSALITY BLOG. Disponível em: https://causality.cs.ucla.edu/blog/. Acesso em: 29 jun. 2023.

Outros Artigos

Legal

® 2021-2024 Meu Guru | 42.269.770/0001-84 • Todos os direitos reservados

Entre para nossa lista e receba conteúdos exclusivos!