·
Economia ·
Econometria
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
15
Referências de Marketing e Gestão de Marca
Econometria
UCAM
18
Orçamentos, Custos e Finanças no Setor Público: Modelos de Previsão de Receitas
Econometria
UCAM
1
8 Questões Objetivas sobre Estatística e Tratamento de Dados
Econometria
UCAM
20
Conceitos e Aplicações da Inferência Estatística
Econometria
UCAM
12
Coleta e Análise de Dados em Estatística
Econometria
UCAM
12
Fundamentos da Econometria Clássica
Econometria
UCAM
1
Fundamentos e Aplicações da Estatística em Ciência de Dados
Econometria
UCAM
19
Introdução à Estatística Descritiva para Ciência de Dados
Econometria
UCAM
22
Métodos Avançados de Previsão de Demanda
Econometria
UCAM
16
Fundamentos e Metodologias de Matemática: Estatística e Probabilidade
Econometria
UCAM
Texto de pré-visualização
MÉTODOS ESTATÍSTICOS Juliane Silveira Freire da Silva Equação de regressão linear múltipla Yi β0 β1Xi1 β2Xi2 βkXik εi Quando devemos usar um ajuste linear com uma variável independente ou com duas ou mais variáveis independentes Os modelos lineares simples são utilizados sempre que apenas uma va riável independente for suficiente para explicar as variações da dependente Porém muitas vezes apenas uma variável independente não é suficiente para explicar as variações ocorridas com a dependente Então adicionase ao modelo as variáveis correlacionadas que explicam essas variações como visto na Figura 1 a seguir Figura 1 Ideia de um modelo de regressão múltipla Fonte Doane e Seward 2014 p 543 É importante ressaltar que tanto no modelo linear simples quanto no múlti plo todas as variáveis envolvidas devem ser quantitativas Para as qualitativas existem outras análises diferentes do ajuste linear Segundo Hair Junior et al 2009 a análise de regressão é uma ferramenta estatística que deve ser empregada apenas quando a variável dependente e as independentes são métricas Existem casos em que é possível incluir dados Regressão linear múltipla 2 não métricos como variáveis independentes transformando dados ordinais ou nominais com codificação dicotômica ou como a variável dependente pelo uso de uma medida binária na técnica especializada de regressão logística Em resumo para aplicar a análise de regressão múltipla os dados devem ser métricos ou adequadamente transformados E antes de estabelecer a equação de regressão o pesquisador deve decidir sobre qual variável deve ser dependente e quais serão as independentes Em estatística há variáveis qualitativas atributos e quantitativas numé ricas métricas As quantitativas podem ser discretas ou seja resultam de uma contagem ou contínuas quando resultam de uma medição ou operação matemática A regressão múltipla é uma extensão da regressão simples que inclui muitas variáveis independentes chamadas preditoras e usada quando um modelo com um único preditor não é adequado para descrever a verdadeira relação entre a variável dependente Y a variável resposta e seus potenciais preditores X1 X2 X3 A interpretação de regressão múltipla é similar a da regressão simples porque esta é um caso especial da regressão múltipla Na verdade os estatísticos não fazem distinção entre regressão simples e múltipla eles simplesmente a chamam de regressão DOANE SEWARD 2014 Por exemplo desejamos prever valores de gastos mensais Facilmente podemos pensar nas variáveis que podem interferir nesse orçamento gastos com alimentação gastos com vestuário com lazer extras com moradia etc É possível fazer um modelo linear simples para a variável gastos com alimentação explicando o gasto mensal claro que estão correlacionadas e que será possível realizar estimativas que terão um bom ajuste mas será que somente essa é capaz de explicar boa parte do resultado de gastos em um mês É bastante provável que apesar de gastos com alimentação ser uma variável significativa no modelo essa separadamente ou isoladamente não terá um poder explicativo muito alto sobre a variável gasto mensal e poderá gerar um viés na análise Nesse modelo devemos provavelmente inserir mais variáveis para que o poder explicativo da regressão seja mais alto Como já mencionado a análise de regressão simples é muito semelhante a de regressão múltipla No caso da simples os cálculos dos coeficientes da reta bem como os do poder explicativo da variável independente são facilmente realizados Já para a análise de regressão múltipla esses coeficientes além do poder explicativo das variáveis possuem cálculos matemáticos bastante 3 Regressão linear múltipla elaborados Isso acontece também para a representação gráfica por exemplo se tivermos duas variáveis independentes o gráfico já teria 3 dimensões Passando disso já ficaria bastante difícil essa representação Para ter ideia de como cada uma das variáveis independentes relacionase com a variável dependente é possível montar os gráficos de dispersão uma a uma das va riáveis independentes Devido ao fato de a análise de regressão ter ampla utilização muitos pacotes computacionais realizam essa análise facilmente Um dos mais acessíveis é o Excel Podemos citar alguns softwares específicos de estatística como o SPSS SAS MINITAB e R este último é o único livre Vejamos um exemplo de saída no Excel na Figura 2 onde temos a variável dependente como sendo o valor economizado na poupança em um ano e as variáveis independentes sendo idade tempo de experiência profissional e o salário médio Figura 2 Tabela ANOVA Análise de resultados Vamos entender o que precisamos observar na saída de um pacote compu tacional O exemplo foi realizado com o Excel mas independentemente do software utilizado os resultados a serem observados e considerados serão os mesmos O que muda é a estética na saída de cada um dos pacotes Regressão linear múltipla 4 Figura 3 Tabela ANOVA Agora sim temos o modelo significativo de acordo com o F de signifi cação As variáveis são significativas o que indica que estão relacionadas com o valor economizado na popança em um ano Assim sendo a equação de regressão fica assim descrita ŷ 5523439562 590731867x1 019967822x2 ou valor economizado na popança 5523439562 590731867 tempo de experiência profissional 019967822 salário médio Também podemos verificar que de acordo com o R quadrado 9888 das variações ocorridas no valor economizado na poupança y são explicadas pelas variações ocorridas no tempo de experiência profissional x1 e salário médio x2 Um equívoco comum é assumir que a equação que melhor se ajusta aos dados observados é preferível Algumas vezes um modelo com um R quadrado baixo pode fornecer predições úteis enquanto um modelo com um R quadrado maior pode ocultar problemas O ajuste é apenas um dos critérios para avaliar uma regressão DOANE SEWARD 2014 Regressão linear múltipla 6 Deveríamos então preferir o modelo mais simples O princípio da Navalha de Occam Occams Razor afirma que um modelo complexo que seja apenas ligeiramente melhor pode não ser preferível caso um modelo mais simples possa realizar o trabalho DOANE SEWARD 2014 Podemos calcular então o valor estimado para uma pessoa que tenha 10 anos de experiência profissional e um salário médio de R 550000 ŷ 5523439562 590731867 10 019967822 5500 ŷ 170965 Portanto o valor estimado para as economias em poupança em um ano é de R 170965 É importante perceber que se deve observar todos os dados da amostra para que as variáveis sejam corretamente escolhidas e o ajuste linear seja o mais adequado O princípio de Occams Razor coloca que quando duas explicações são relativamente equivalentes damos preferência àquela mais simples mais parcimoniosa DOANE SEWARD 2014 2 Representação matricial Como comentado na seção anterior os cálculos para a determinação dos coeficientes exigem um pouco mais de conhecimento matemático Um dos motivos disso é que as equações lineares podem ser representadas por matrizes e vetores Assim os coeficientes são encontrados de acordo com operações com matrizes Para a regressão linear múltipla vamos primeiramente explicitar a representação matricial para uma regressão múltipla com duas variáveis independentes yi β0 β1xi1 β2xi2 εi 7 Regressão linear múltipla A regressão múltipla é de longe a técnica multivariada mais utilizada Com sua ampla aplicabilidade a ela tem sido usada para muitos propósitos Suas aplicações sempre crescentes recaem em duas grandes classes de problemas de pesquisa previsão e explicação Previsão envolve o quanto que uma variável estatística de regressão uma ou mais variáveis independentes pode prever da variável dependente Explicação examina os coeficientes de regressão magnitude sinal e significância estatística para cada variável independente e tenta desenvolver uma razão substantiva ou teórica para os efeitos das variáveis independentes HAIR JUNIOR et al 2009 p 163 3 Método de mínimos quadrados O problema da determinação de uma equação linear a mais de duas variáveis que melhor descreva certo conjunto de dados consiste em encontrar valores numéricos de Geralmente isso é feito pelo método dos mínimos quadrados Isto é minimizase a soma de quadrados y ŷ2 onde os y são os valores observados e os ŷ são os valores calculados por meio da equa ção linear Em princípio o problema da determinação de é o mesmo que o do caso de duas variáveis mas as soluções manuais podem ser muito trabalhosas porque o método dos mínimos quadrados exige a resolução de tantas equações normais quantas são as constantes desconhecidas Por exemplo quando há duas variáveis independentes x1 e x2 e queremos ajustar a equação FREUND 2007 Aqui vale ressaltar que em algumas bibliografias quando estamos esti mando a reta com dados amostrais podemos usar a notação utilizando o sinal sobre os coeficientes ou então ao invés de utilizar as letras gregas indicar esses coeficientes por letras minúsculas Regressão linear múltipla 10 Para esses dados precisamos primeiramente dos resultados dos somatórios serão substituídos nas 3 equações O autor relata que essas equações poderiam ser resolvidas pelo método da eliminação ou utilizando determinantes mas por envolver muitos cálculos extensos ele indica que isso seja deixado para o computador e apresenta a seguinte saída de um pacote computacional Regressão linear múltipla 12 Os coeficientes podem ser calculados pelo método de mínimos quadrados ou de mínimos quadrados ordinários Você pode perguntarse por que ter conhecimento disso se no final das contas utilizamos somente os pacotes computacionais Essa informação é importante para que saibamos a lógica utilizada pelos pacotes computacionais e assim tenhamos um empoderamento sobre esse tipo de análise É importante que conheçamos a lógica utilizada nos pacotes computacio nais para que possamos entender melhor a maneira com que os dados estão sendo tratados Na análise de regressão dificilmente faremos essa análise ma nualmente mas mesmo assim precisamos entender como as coisas funcionam DOANE D P SEWARD L E Estatística aplicada à administração 4 ed Porto Alegre AMGH Bookman 2014 840 p FREUND J E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2007 HAIR JUNIOR J F et al Análise multivariada de dados 6 ed Porto Alegre Bookman 2009 688 p Leituras recomendadas MORETTIN P A HAZZAN S BUSSAB W O Cálculo funções de uma e várias variáveis 3 ed São Paulo Saraiva 2012 448 p WOOLDRIDGE J M O modelo de regressão linear em forma matricial In WOOLDRIDGE J M Introdução à econometria uma abordagem moderna São Paulo Thomson Lear ning 2006 Apêndice E Resultando na seguinte equação y 65430 16752x1 11235x2 13 Regressão linear múltipla
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
15
Referências de Marketing e Gestão de Marca
Econometria
UCAM
18
Orçamentos, Custos e Finanças no Setor Público: Modelos de Previsão de Receitas
Econometria
UCAM
1
8 Questões Objetivas sobre Estatística e Tratamento de Dados
Econometria
UCAM
20
Conceitos e Aplicações da Inferência Estatística
Econometria
UCAM
12
Coleta e Análise de Dados em Estatística
Econometria
UCAM
12
Fundamentos da Econometria Clássica
Econometria
UCAM
1
Fundamentos e Aplicações da Estatística em Ciência de Dados
Econometria
UCAM
19
Introdução à Estatística Descritiva para Ciência de Dados
Econometria
UCAM
22
Métodos Avançados de Previsão de Demanda
Econometria
UCAM
16
Fundamentos e Metodologias de Matemática: Estatística e Probabilidade
Econometria
UCAM
Texto de pré-visualização
MÉTODOS ESTATÍSTICOS Juliane Silveira Freire da Silva Equação de regressão linear múltipla Yi β0 β1Xi1 β2Xi2 βkXik εi Quando devemos usar um ajuste linear com uma variável independente ou com duas ou mais variáveis independentes Os modelos lineares simples são utilizados sempre que apenas uma va riável independente for suficiente para explicar as variações da dependente Porém muitas vezes apenas uma variável independente não é suficiente para explicar as variações ocorridas com a dependente Então adicionase ao modelo as variáveis correlacionadas que explicam essas variações como visto na Figura 1 a seguir Figura 1 Ideia de um modelo de regressão múltipla Fonte Doane e Seward 2014 p 543 É importante ressaltar que tanto no modelo linear simples quanto no múlti plo todas as variáveis envolvidas devem ser quantitativas Para as qualitativas existem outras análises diferentes do ajuste linear Segundo Hair Junior et al 2009 a análise de regressão é uma ferramenta estatística que deve ser empregada apenas quando a variável dependente e as independentes são métricas Existem casos em que é possível incluir dados Regressão linear múltipla 2 não métricos como variáveis independentes transformando dados ordinais ou nominais com codificação dicotômica ou como a variável dependente pelo uso de uma medida binária na técnica especializada de regressão logística Em resumo para aplicar a análise de regressão múltipla os dados devem ser métricos ou adequadamente transformados E antes de estabelecer a equação de regressão o pesquisador deve decidir sobre qual variável deve ser dependente e quais serão as independentes Em estatística há variáveis qualitativas atributos e quantitativas numé ricas métricas As quantitativas podem ser discretas ou seja resultam de uma contagem ou contínuas quando resultam de uma medição ou operação matemática A regressão múltipla é uma extensão da regressão simples que inclui muitas variáveis independentes chamadas preditoras e usada quando um modelo com um único preditor não é adequado para descrever a verdadeira relação entre a variável dependente Y a variável resposta e seus potenciais preditores X1 X2 X3 A interpretação de regressão múltipla é similar a da regressão simples porque esta é um caso especial da regressão múltipla Na verdade os estatísticos não fazem distinção entre regressão simples e múltipla eles simplesmente a chamam de regressão DOANE SEWARD 2014 Por exemplo desejamos prever valores de gastos mensais Facilmente podemos pensar nas variáveis que podem interferir nesse orçamento gastos com alimentação gastos com vestuário com lazer extras com moradia etc É possível fazer um modelo linear simples para a variável gastos com alimentação explicando o gasto mensal claro que estão correlacionadas e que será possível realizar estimativas que terão um bom ajuste mas será que somente essa é capaz de explicar boa parte do resultado de gastos em um mês É bastante provável que apesar de gastos com alimentação ser uma variável significativa no modelo essa separadamente ou isoladamente não terá um poder explicativo muito alto sobre a variável gasto mensal e poderá gerar um viés na análise Nesse modelo devemos provavelmente inserir mais variáveis para que o poder explicativo da regressão seja mais alto Como já mencionado a análise de regressão simples é muito semelhante a de regressão múltipla No caso da simples os cálculos dos coeficientes da reta bem como os do poder explicativo da variável independente são facilmente realizados Já para a análise de regressão múltipla esses coeficientes além do poder explicativo das variáveis possuem cálculos matemáticos bastante 3 Regressão linear múltipla elaborados Isso acontece também para a representação gráfica por exemplo se tivermos duas variáveis independentes o gráfico já teria 3 dimensões Passando disso já ficaria bastante difícil essa representação Para ter ideia de como cada uma das variáveis independentes relacionase com a variável dependente é possível montar os gráficos de dispersão uma a uma das va riáveis independentes Devido ao fato de a análise de regressão ter ampla utilização muitos pacotes computacionais realizam essa análise facilmente Um dos mais acessíveis é o Excel Podemos citar alguns softwares específicos de estatística como o SPSS SAS MINITAB e R este último é o único livre Vejamos um exemplo de saída no Excel na Figura 2 onde temos a variável dependente como sendo o valor economizado na poupança em um ano e as variáveis independentes sendo idade tempo de experiência profissional e o salário médio Figura 2 Tabela ANOVA Análise de resultados Vamos entender o que precisamos observar na saída de um pacote compu tacional O exemplo foi realizado com o Excel mas independentemente do software utilizado os resultados a serem observados e considerados serão os mesmos O que muda é a estética na saída de cada um dos pacotes Regressão linear múltipla 4 Figura 3 Tabela ANOVA Agora sim temos o modelo significativo de acordo com o F de signifi cação As variáveis são significativas o que indica que estão relacionadas com o valor economizado na popança em um ano Assim sendo a equação de regressão fica assim descrita ŷ 5523439562 590731867x1 019967822x2 ou valor economizado na popança 5523439562 590731867 tempo de experiência profissional 019967822 salário médio Também podemos verificar que de acordo com o R quadrado 9888 das variações ocorridas no valor economizado na poupança y são explicadas pelas variações ocorridas no tempo de experiência profissional x1 e salário médio x2 Um equívoco comum é assumir que a equação que melhor se ajusta aos dados observados é preferível Algumas vezes um modelo com um R quadrado baixo pode fornecer predições úteis enquanto um modelo com um R quadrado maior pode ocultar problemas O ajuste é apenas um dos critérios para avaliar uma regressão DOANE SEWARD 2014 Regressão linear múltipla 6 Deveríamos então preferir o modelo mais simples O princípio da Navalha de Occam Occams Razor afirma que um modelo complexo que seja apenas ligeiramente melhor pode não ser preferível caso um modelo mais simples possa realizar o trabalho DOANE SEWARD 2014 Podemos calcular então o valor estimado para uma pessoa que tenha 10 anos de experiência profissional e um salário médio de R 550000 ŷ 5523439562 590731867 10 019967822 5500 ŷ 170965 Portanto o valor estimado para as economias em poupança em um ano é de R 170965 É importante perceber que se deve observar todos os dados da amostra para que as variáveis sejam corretamente escolhidas e o ajuste linear seja o mais adequado O princípio de Occams Razor coloca que quando duas explicações são relativamente equivalentes damos preferência àquela mais simples mais parcimoniosa DOANE SEWARD 2014 2 Representação matricial Como comentado na seção anterior os cálculos para a determinação dos coeficientes exigem um pouco mais de conhecimento matemático Um dos motivos disso é que as equações lineares podem ser representadas por matrizes e vetores Assim os coeficientes são encontrados de acordo com operações com matrizes Para a regressão linear múltipla vamos primeiramente explicitar a representação matricial para uma regressão múltipla com duas variáveis independentes yi β0 β1xi1 β2xi2 εi 7 Regressão linear múltipla A regressão múltipla é de longe a técnica multivariada mais utilizada Com sua ampla aplicabilidade a ela tem sido usada para muitos propósitos Suas aplicações sempre crescentes recaem em duas grandes classes de problemas de pesquisa previsão e explicação Previsão envolve o quanto que uma variável estatística de regressão uma ou mais variáveis independentes pode prever da variável dependente Explicação examina os coeficientes de regressão magnitude sinal e significância estatística para cada variável independente e tenta desenvolver uma razão substantiva ou teórica para os efeitos das variáveis independentes HAIR JUNIOR et al 2009 p 163 3 Método de mínimos quadrados O problema da determinação de uma equação linear a mais de duas variáveis que melhor descreva certo conjunto de dados consiste em encontrar valores numéricos de Geralmente isso é feito pelo método dos mínimos quadrados Isto é minimizase a soma de quadrados y ŷ2 onde os y são os valores observados e os ŷ são os valores calculados por meio da equa ção linear Em princípio o problema da determinação de é o mesmo que o do caso de duas variáveis mas as soluções manuais podem ser muito trabalhosas porque o método dos mínimos quadrados exige a resolução de tantas equações normais quantas são as constantes desconhecidas Por exemplo quando há duas variáveis independentes x1 e x2 e queremos ajustar a equação FREUND 2007 Aqui vale ressaltar que em algumas bibliografias quando estamos esti mando a reta com dados amostrais podemos usar a notação utilizando o sinal sobre os coeficientes ou então ao invés de utilizar as letras gregas indicar esses coeficientes por letras minúsculas Regressão linear múltipla 10 Para esses dados precisamos primeiramente dos resultados dos somatórios serão substituídos nas 3 equações O autor relata que essas equações poderiam ser resolvidas pelo método da eliminação ou utilizando determinantes mas por envolver muitos cálculos extensos ele indica que isso seja deixado para o computador e apresenta a seguinte saída de um pacote computacional Regressão linear múltipla 12 Os coeficientes podem ser calculados pelo método de mínimos quadrados ou de mínimos quadrados ordinários Você pode perguntarse por que ter conhecimento disso se no final das contas utilizamos somente os pacotes computacionais Essa informação é importante para que saibamos a lógica utilizada pelos pacotes computacionais e assim tenhamos um empoderamento sobre esse tipo de análise É importante que conheçamos a lógica utilizada nos pacotes computacio nais para que possamos entender melhor a maneira com que os dados estão sendo tratados Na análise de regressão dificilmente faremos essa análise ma nualmente mas mesmo assim precisamos entender como as coisas funcionam DOANE D P SEWARD L E Estatística aplicada à administração 4 ed Porto Alegre AMGH Bookman 2014 840 p FREUND J E Estatística aplicada economia administração e contabilidade 11 ed Porto Alegre Bookman 2007 HAIR JUNIOR J F et al Análise multivariada de dados 6 ed Porto Alegre Bookman 2009 688 p Leituras recomendadas MORETTIN P A HAZZAN S BUSSAB W O Cálculo funções de uma e várias variáveis 3 ed São Paulo Saraiva 2012 448 p WOOLDRIDGE J M O modelo de regressão linear em forma matricial In WOOLDRIDGE J M Introdução à econometria uma abordagem moderna São Paulo Thomson Lear ning 2006 Apêndice E Resultando na seguinte equação y 65430 16752x1 11235x2 13 Regressão linear múltipla