·

Economia ·

Econometria

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Recomendado para você

Texto de pré-visualização

Modelo de Regressão Múltipla MQO Assimptótico Bibliografia WOOLDRIDGE JM Introdução à Econometria uma abordagem moderna 4ª ed São Paulo Pioneira Thomson Learning 2015 capítulo 5 Anteriormente Hipóteses padrão para o modelo de regressão múltipla Hipótese RLM1 Linear nos parâmetros Hipótese RLM2 Amostragem aleatória O modelo é linear nos parâmetros Os dados são uma amostra aleatória retirada da população Cada ponto segue a equação populacional Hipótese RLM3 Sem colinearidade perfeita Observações sobre RLM3 A suposição apenas exclui a colinearidadecorrelação perfeita entre as variáveis explicativas correlação imperfeita é permitida Se uma variável explicativa é uma combinação linear perfeita de outras variáveis explicativas ela é supérflua e pode ser eliminada Variáveis constantes também são descartadas Na amostra e portanto na população nenhuma das variáveis independentes é constante e não há relações lineares exatas entre as variáveis independentes Anteriormente Anteriormente Hipótese RLM4 Média condicional zero Em um modelo de regressão múltipla a suposição de média condicional zero é muito mais provável de se manter porque menos valores serão contemplados no erro Exemplo Pontuações médias dos testes O valor das variáveis explicativas não deve conter informações sobre a média dos fatores não observados Se avginc não fosse incluído na regressão acabaria no termo de erro seria difícil defender que o gasto não está correlacionado com o erro Anteriormente Discussão da suposição de média condicional zero As variáveis explicativas que se correlacionam com o termo de erro são chamadas de endógenas endogeneidade é uma violação da hipótese RLM4 As variáveis explicativas não correlacionadas com o termo de erro são chamadas de exógenas RLM4 é válido se todas as variáveis explicativas forem exógenas A exogeneidade é a suposição chave para uma interpretação causal da regressão e para a não tendenciosidade dos estimadores MQO Teorema 31 Inexistência de viés de MQO A inexistência de viés é uma propriedade média em amostras repetidas em uma determinada amostra as estimativas ainda podem estar longe dos valores verdadeiros Anteriormente Hipótese RLM5 Homocedasticidade Exemplo Equação de salários Notação abreviada O valor das variáveis explicativas não deve conter informações sobre a variância dos fatores não observados Essa suposição também pode ser difícil justificar em muitos casos com Todas as variáveis explicativas são coletadas em um vetor aleatório Anteriormente Teorema 32 Variâncias amostrais dos estimadores de inclinação de MQO Sob as hipóteses RLM1 RLM5 Variância do termo de erro Variação amostral total em xj Rquadrado da regressão xj em todas as outras variáveis independentes incluindo uma constante Anteriormente Components das variâncias de MQO 1 A variância do erro Uma maior variância do erro significa variâncias maiores dos estimadores de MQO porque assim há mais ruído na equação Uma grande variância do erro torna as estimativas mais imprecisas A variância do erro não diminui com o tamanho da amostra 2 A variação amostral total na variável explicativa Quanto maior a variação total em xj menor é a variância do estimador A variação total da amostra aumenta automaticamente com o tamanho da amostra Aumentar o tamanho da amostra é portanto uma maneira de obter estimativas mais precisas 3 As relações lineares entre as variáveis independentes A variância amostral de será maior à medida que a variável explicativa puder ser mais bem explicada pela outras variáveis independentes O problema de variáveis explicativas quase linearmente dependentes é chamado de multicolinearidadeie for some Regredir em todas as outras variáveis independentes incluindo uma constante O Rquadrado desta regressão será o maior quanto melhor xj puder ser explicado linearmente pelas outras variáveis explicativas Anteriormente Apenas a variância amostral das variáveis envolvidas na multicolinearidade será inflada as estimativas de outros efeitos podem ser muito precisas Observe que a multicolinearidade não é uma violação de MLR3 no sentido estrito Multicolinearidade pode ser detectada atravé do teste de fator de inflação de variância Anteriormente Como regra geral arbitrária o fator de inflação de variância não deve ser maior que 10 Estimando a variância do erro Teorema 33 Estimador não viesado da variância do erro Uma estimativa não viesada da variância do erro pode ser obtida subtraindo o número de coeficientes de regressão estimados do número de observações O número de observações menos o número de parâmetros estimados também é chamado de graus de liberdade Anteriormente Estimativa das variâncias amostrais dos estimadores de MQO Note que as fórmulas são válidas somente sob as hipóteses RLM1 RLM5 em particular é necessário haver homocedasticidade Desvio padrão populacional Variação amostral estimada erro padrão de Plugar para o desconhecido Anteriormente Inferência estatística no modelo de regressão Testar hipóteses sobre parâmetros da população Construção de intervalos de confiança Distribuições amostrais dos estimadores de MQO Os estimadores de MQO são variáveis aleatórias Nós já conhecemos seus valores esperados e suas variâncias No entanto para testar hipóteses precisamos conhecer suas distribuições Para derivar sua distribuição é necessário assumir hipóteses adicionais Hipótese sobre a distriuição dos erros distribuição Normal Anteriormente Hipótese RLM6 Normalidade do termo de erro Independente de Assumese que os fatores não observados são normalmente distribuídos em torno da função de regressão populacional A forma e a variância da distribuição não depende das variáveis explicativas Segue que Anteriormente Discussão da hipótese de normalidade O termo de erro é a soma de alguns fatores não observados A soma de fatores independentes é normalmente distribuída MLC Problemas Quantos fatores diferentes O número é suficientemente grande Possivelmente distribuições muito heterogêneas de fatores individuais Quão independentes são os diferentes fatores A normalidade do termo de erro é uma questão empírica A distribuição do erro tem que ser pelo menos próxima de uma Normal Em muitos casos a normalidade é questionável ou impossível por definição Anteriormente Exemplos onde a normalidade não pode ser observada Salários positivos também salário mínimo Número de prisões assume um pequeno número de valores inteiros Desemprego assume apenas o valor 1 ou 0 Em alguns casos a normalidade pode ser alcançada por meio de transformações na variável dependente ex usar logwage ao invés de wage Sob normalidade MQO é o melhor mesmo considerando não linear estimador não viesado Importante para o propósito da inferência estatística a hipótese de normalidade pode ser substituída por uma amostra grande Terminologia Anteriormente Hipóteses de GaussMarkov Hipóteses do modelo linear clássico MLC Testando hipóteses sobre um parâmetro populacional Teorema 42 distribuição t para os estimadores padronizados Hipótese nula Sob as hipóteses MLR1 MLR6 O parâmetro populacional é igual a zero ou seja após controlar por todas as outras variáveis independentes não há efeito de xj em y Nota A distribuição t é próxima a uma distribuição Normal padrão se nk1 for grande Anteriormente Estatística t Distribuição da estatística t se a hipótese nula for verdadeira Objetivo definir uma regra de rejeição tal que se ela for verdadeira H0 é rejeitada apenas com uma pequena probabilidade nível de significância 5 por exemplo A estatística t será usada para testar a hipótese nula Quanto mais longe estiver o coeficiente estimado de zero menos provável é que a hipótese nula seja verdadeira Mas o que significa longe de zero Isso depende da variabilidade do coeficiente estimado isto é do seu desvio padrão A estatística t mensura quantos desvios padrão estimado o coeficiente estimado está longe de zero Anteriormente Testando várias restrições lineares o teste F Testando restrições de exclusão Anos na liga Número médio de jogos por ano Salário de um jogador de beisebol da major league Média de rebatidas Home runs por ano Corridas impulsionadas por ano contra Testa se as medidas de desempenho não têm efeitopodem ser excluídas da regressão Anteriormente Estimação do modelo irrestrito Nenhuma dessas variáveis é estatisticamente significativa quando testada individualmente Ideia Como seria o ajuste do modelo se essas variáveis fossem retiradas da regressão Anteriormente Estimação do modelo restrito Estatística de teste A soma dos quadrados dos resíduos necessariamente aumenta mas o aumento é estatisticamente significativo O aumento relativo da soma dos quadrados dos resíduos ao passar de H1 para H0 segue uma distribuição F Número de restrições Anteriormente Modelo de Regressão Múltipla MQO Assimptótico Até agora focamos nas propriedades de MQO que valem para qualquer amostra Propriedades de MQO válidas para qualquer amostratamanho de amostra Valores esperadosausência de viés sob as hipóteses MRL1 MRL4 Fórmulas para as Variâncias sob as hipóteses MRL1 MRL5 Teorema de GaussMarkov sob as MRL1 MRL5 Distribuições amostrais exatastestes sob as hipóteses MRL1 MRL6 Propriedades de MQO para grandes amostras Consistência sob as hipóteses MRL1 MRL4 Normalidade assimptóticatestes sob as hipóteses MRL1 MRL5 Sem assumir a normalidade para o termo de erro Consitência Interpretação Consistência significa que a probabilidade de que a estimativa seja arbitrariamente próxima do verdadeiro valor da população pode ser alta aumentando o tamanho da amostra Consistência é um requisito mínimo para estimadores Um estimador é consistente para um parâmetro populacional se Para um arbitrário e Notação alternativa A estimativa converge em probabilidade para o verdadeiro valor populacional Modelo de Regressão Múltipla MQO Assimptótico Modelo de Regressão Múltipla MQO Assimptótico Teorema 51 Consistência dos estimadores de MQO Caso especial do modelo de regressão simples Hipótese MRL4 Podese ver que a estimativa da inclinação é consistente se a variável explicativa for exógena ou seja não correlacionada com o termo de erro Todas as variáveis explicativas devem ser não correlacionadas com o termo de erro Essa hipótese é mais fraca do que a suposição de média condicional zero MRL4 Modelo de Regressão Múltipla MQO Assimptótico Modelo de Regressão Múltipla MQO Assimptótico Prova መ𝛽1 ൙ 𝑖1 𝑛 𝑥𝑖1 ҧ𝑥1 𝑦𝑖 𝑖1 𝑛 𝑥𝑖1 ҧ𝑥1 2 Substituindo 𝑦𝑖 𝛽1 𝑥𝑖1 𝑢𝑖 𝛽1 ൙ 𝑛1 𝑖1 𝑛 𝑥𝑖1 ҧ𝑥1 𝑢𝑖 𝑛1 𝑖1 𝑛 𝑥𝑖1 ҧ𝑥1 2 Ou 𝑝𝑙𝑖𝑚 መ𝛽1 𝛽1 𝐶𝑜𝑣 𝑥1 𝑢 𝑉𝑎𝑟𝑥1 𝛽1 porque 𝐶𝑜𝑣 𝑥1 𝑢 0 Para a consistência do MQO apenas a hipótese MRL4 é necessária Análogo assintótico do viés de variável omitida Modelo verdadeiro Modelo mal especificado Não há viés de variável omitida se a variável omitida for irrelevante ou não correlacionada com a variável incluída Viés Modelo de Regressão Múltipla MQO Assimptótico Normalidade assintótica e inferência para amostra grande Na prática a suposição de normalidade MRL6 é frequentemente questionável Se MRL6 não for válido os resultados dos testes t ou F podem estar errados Felizmente os testes F e t ainda funcionam se o tamanho da amostra for grande o suficiente Além disso as estimativas de OLS são normais em grandes amostras mesmo sem a hipótese MRL6 Teorema 52 Normalidade Assimptótica do MQO Sob as hipóteses MRL1 MRL5 também Em grandes amostras as estimativas padronizadas são normalmente distribuídas Modelo de Regressão Múltipla MQO Assimptótico Consequências práticas Em amostras grandes a distribuição t tende a uma distribuição Normal01 Como consequência testes t são válidos em amostras grandes sem a hipótese MRL6 O mesmo é verdadeiro para a construção de intervalos de confiança e para testes F Importante MRL1 MRL5 continuam sendo necessárias Análise assintótica dos erros do MQO Converge para Converge para Converge para um número fixo Modelo de Regressão Múltipla MQO Assimptótico Análise assintótica dos erros do MQO cont É por isso que amostras maiores são preferíveis Eemplo Erros padrão na equação de peso ao nascer diminui à taxa diminui à taxa Usando somente metade dos dados Modelo de Regressão Múltipla MQO Assimptótico