Aula 3 - Inferência
Aula 3 - Inferência
4 – Análise de Regressão
Múltipla: Inferência
Introdução à econometria: uma abordagem
moderna
Wooldridge
Var b X = E Guu′ G′
Var b X = GE(uu′ )G′
Com as hipóteses RLM.4 e RLM.5,
E(uu′ ) = 𝜎ො 2 I
Assim,
Var b X = 𝜎ො 2 IGG′ (3)
Agora, admita a existência de uma
matriz de zeros, D, dada por:
D = G − X′X −1
X′ (4)
Pode-se reescrever a equação (4)
como:
G = D + X′X −1
X′ (5)
Ao substituir a equação (5) na equação (3):
Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D +
X′X −1
X′)′ (6)
Transpondo o último termo da equação (6):
Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D′ +
Variância X X′X −1
)
mínima do
Var b X = 𝜎Ƹ 2 I(DD′ + DX X ′ X
estimador 𝛽መ𝑗
−1
+
=0
X′X −1 ′ ′
X D + X′X −1 ′
X 𝑋 X′X −1
)
=0 =I
Var b X = 𝜎Ƹ 2 I(DD′ + X ′ X −1
)
Var b X = 𝜎ො 2 IDD′ + 𝜎ො 2 I X ′ X −1
Var β
Var b|𝑥 = E σ 𝑤𝑖 𝑢𝑖 2
Var b|𝑥 = E 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯ 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯
Var b|𝑥 = E 𝑤12 𝑢12 + 𝑤1 𝑤2 𝑢1 𝑢2 + 𝑤22 𝑢22 + ⋯
Var b|𝑥 = 𝑤12 𝐸(𝑢12 ) + 𝑤1 𝑤2 𝐸(𝑢1 𝑢2 ) + 𝑤22 𝐸(𝑢22 +) ⋯
Variância
Como: 𝐸(𝑢𝑖 𝑢𝑗 ) = 0, com 𝑖 ≠ 𝑗 e 𝐸(𝑢ො 𝑖2 ) = 𝜎ො 2
mínima do Var b|𝑥 = 𝜎ො 2 𝑤12 + 𝑤22 + ⋯
estimador 𝛽መ𝑗 Var b|𝑥 = 𝜎ො 2 σ 𝑤𝑖2
Agora, usando um artifício matemático de somar e
𝑥𝑖
subtrair σ dessa equação:
𝑥𝑖2
𝑥 𝑥
= 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖 2 + σ 𝑥𝑖 2 )2, resolvendo o produto notável e
𝑖 𝑖
simplificando esta equação:
𝑥𝑖 2 σ 𝑥𝑖2 𝑥𝑖 𝑥𝑖
= 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖2
) + 𝜎Ƹ 2
(σ 𝑥𝑖2 )2
+ 2𝜎Ƹ 2 𝑤𝑖 − σ 𝑥𝑖2 σ 𝑥𝑖2
𝑥
Perceba, dado 𝑤𝑖 = σ 𝑥𝑖 2, que o último termo da
𝑖
equação acima soma zero, então:
𝐺ê𝑛𝑒𝑟𝑜
𝐼𝑑𝑎𝑑𝑒
𝐶𝑖 = 𝛽0 + 𝛽1 𝑅𝑒𝑛𝑑𝑎1 + 𝑢𝑖
𝐸𝑑𝑢𝑐𝑎çã𝑜
⋮
Portanto, se há um grande número de variáveis
independentes, compondo o resíduo, todas
com a mesma função densidade de
probabilidade, com média 𝜇 e variância
constante (𝜎 2), então, segundo o TLC, a
distribuição da soma dessas variáveis (aqui
representada por σ Xi ) equivale ao resíduo.
Hipóteses MLC Então, a distribuição desse resíduo tende a
e o TLC uma normal. Essa é a definição mais objetiva
do TLC, ou seja:
σ𝑛𝑖=1 X𝑖 = u𝑖 ~𝑁(0, 𝜎 2 )
em que, média de u𝑖 é: 𝐸(u𝑖 ) = 0 e a variância
de u𝑖 : 𝐸 𝑢𝑖2 = 𝜎 2
Uma variante do TLC estabelece que,
mesmo que esse número de variáveis não
seja tão grande, ainda sim, a soma dessas
variáveis tende a uma distribuição normal.
O problema do TLC é a pressuposição de
Hipóteses MLC que as variáveis aleatórias de u𝑖 afetam Y
de forma isolada e aditiva.
e o TLC
Na prática, é sustentado que as variáveis
que compõe 𝑢 sejam independentes entre
si, o que não é fácil de se encontrar nos
problemas econômicos, em muitos casos.
Daí a justificativa de se testar se 𝑢
segue distribuição normal.
Uma das formas de se encontrar
Hipóteses MLC resíduos com distribuição normal é
e o TLC fazer transformações logarítmicas das
variáveis do modelo. Isso tende gerar
distribuições mais próximas da
normal.
Lembre-se, nesse caso, tem-se
distribuição log-normal, como
retratado na figura a seguir.
Hipóteses MLC Importante: a não normalidade
e o TLC
não é um problema sério com
amostras assintóticas, conforme
será discutido no Capítulo 5.
Distribuição log-
normal
http://www.portalaction.com.br/probabilidades/615-
distribuicao-log-normal
Teorema 4.1: sob as hipóteses do
MRLC, RLM.1 a RLM.6, o
Distribuição parâmetro 𝛽መ𝑗 segue distribuição
amostrais dos normal com média 𝛽𝑗 e 𝑉𝑎𝑟(𝛽𝑗 ),
estimadores 𝛽መ𝑗 formalmente:
𝛽መ𝑗 ~𝑁𝑜𝑟𝑚𝑎𝑙[𝛽𝑗 , Var(𝛽𝑗 )]
Uma distribuição normal é
construída usando somente dois
parâmetros a média e a variância.
Então:
Distribuições 𝑗 −𝛽𝑗 )
(𝛽
amostrais
𝑑𝑝(𝛽𝑗 )
~𝑁𝑃(0,1)
normais
em que, 𝑁𝑃 é uma normal
padrão. Sempre uma NP terá
média 0 e variância 1.
Veja que a fórmula da Var 𝛽መ𝑗 tem
𝜎 2 , que é desconhecido. Devido a
Teste de
dificuldade e até a impossibilidade
hipótese: teste
t. de se trabalhar com 𝜎 2 , usa-se 𝜎ො 2
como estimativas. Assim, o Teorema
4.1 se transforma no Teorema 4.2.
Teorema 4.2: sob as hipóteses do RLM.1
a RLM.6 a distribuição dos estimadores
padronizados segue distribuição t:
𝑗 −𝛽𝑗 )
(𝛽
𝑑𝑝(𝛽 ) ~𝑡𝛽𝑗 , com g𝑙 = 𝑛 − 𝑘 − 1 e
𝑗
Fonte: http://professorguru.com.br/estatistica/inferencia-estatistica/intervalos-de-
confianca.html
O Teorema 4.2 permite testar
hipóteses relacionadas ao 𝛽መ𝑗 .
Teste de
hipótese Na prática, o interesse é testar
a hipótese nula 𝐻0 : 𝛽𝑗 = 0.
Se, por exemplo, no modelo de regressão:
𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋1𝑖 + 𝛽መ2 𝑋2𝑖 + 𝑢ො 𝑖 ,
𝑋1 não tiver efeito parcial sobre Y, então, ao realizar o teste de
hipótese, 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0, não se rejeita a hipótese
nula.
Assim, usa-se a estatística 𝑡 para testar se uma variável 𝑋𝑗
explica, parcialmente, 𝑌. Se ela não explica, 𝛽𝑗 = 0. Esse
Teste de diagnóstico é feito usando a estatística 𝑡 definida como:
hipótese 𝑡𝛽𝑗 =
𝑗 −0
𝛽
𝑑𝑝(𝛽𝑗 )
53
Veja nessa figura que, 𝑡𝛽1 = 3,28,
cai na região de rejeição 𝐻0 , ao
Teste de passo que e 𝑡𝛽2 = 1,21 está na
hipótese
bicaudal região de não rejeição dessa
hipótese.
Exemplo 2. Utilizar os dados da
regressão anterior, mas fazer o
teste monocaudal a 5%, ou seja:
Teste de
hipótese Testar as hipóteses:
monocaudal
𝐻1 : 𝛽1 > 0 𝐻1 : 𝛽2 > 0
ቊ eቊ
𝐻0 : 𝛽1 ≤ 0 𝐻0 : 𝛽2 ≤ 0
𝑡𝛽1 = 3,28 e 𝑡𝛽2 = 1,21 e 𝑔𝑙 = 25
O valor crítico (c) do teste t
monocaudal, com 𝑔𝑙 = 25 e
𝛼 = 5%, é 𝑐 = 1,701.
Teste de Note:
hipótese
monocaudal Para 𝛽1 , não se rejeita 𝐻1 , logo 𝛽መ1
é positivo e estatisticamente
significativo a 5% de
significância.
Para 𝛽2 , não se rejeita 𝐻0 , ou se
rejeita 𝐻1 , logo 𝛽መ2 não é
estatisticamente significativo a
5% de significância.
Teste de Veja, pelo gráfico da distribuição
hipótese t
𝑡, a seguir, que 𝑡𝛽1 = 3,28 está na
região de rejeição da hipótese
nula e 𝑡𝛽2 cai na região de não
rejeição dessa hipótese.
Figura da. Distribuição t
Teste de
hipótese t
Exemplo 3. Considere que 𝑡𝛽1 =
− 1,878 e 𝑔𝑙 = 18 e se deseja
testar a hipótese alternativa:
Teste de 𝐻1 : 𝛽1 < 0, o que implica em
hipótese t 𝐻0 : 𝛽1 ≥ 0.
Para o nível de significância de
5%, 𝑔𝑙 = 18 e o teste 𝑡
unicaudal, o valor crítico do
teste é 𝑐 = −1,734.
Assim, como o 𝑡𝛽1 = −1,878 é
menor, ou em modulo maior,
do que o valor crítico 𝑐 =
− 1,734, não se rejeita 𝐻1 , logo
Teste de o parâmetro 𝛽1 é
hipótese t estatisticamente significativo
e negativo.
Na distribuição 𝑡 seguinte
está retratado este exemplo.
Copyright © 2009 South-Western/Cengage Learning
Figura 3. Distribuição t
61
Pode se estar interessado em
testar se 𝛽መ𝑗 é igual a uma
constante específica, como 1, −1
ou outro valor qualquer.
Teste de
hipótese t Neste caso, a hipótese unilateral
seria estabelecida como:
𝐻1 : 𝛽1 = 1
ቊ e,
𝐻0 : 𝛽1 > 1
A hipótese bilateral:
𝐻0 : 𝛽1 = 1
ቊ
𝐻1 : 𝛽1 ≠ 1
Em ambos casos, a estatística 𝑡
Teste de
hipótese t apropriada é dada por:
1 −𝛽1
𝛽 1 −1
𝛽
𝑡𝛽1 = 𝑑𝑝(𝛽1 ) = 𝑡𝛽1 =
𝑑𝑝(𝛽1 )
, já
que se busca testar 𝛽1 = 1.
Exemplo 4.4:
Considere a relação entre o
número de crimes nos campi e o
número de alunos matriculados
Teste de
hipótese nas universidades dos EUA.
A reta de regressão estimada é:
= −6,63 + 1,27𝑙𝑛𝑀𝑎𝑡𝑟𝑖
𝑙𝑛𝐶𝑟𝑖𝑚𝑒
𝑑𝑝 1,03 0,11 ; 𝑛 = 95
Deseja-se testar se os crimes
nos campi aumentaram,
proporcionalmente, mais que os
universitários. Portanto, o foco é
a hipótese alternativa.
Teste de
hipótese As hipóteses testadas são:
𝐻1 : 𝛽1 > 1
ቊ , então:
𝐻0 : 𝛽1 ≤ 1
1,27−1
𝑡𝛽1 = 0,11
= 2,45
Valor crítico unicaudal, com 5% de
significância e 𝑔𝑙 = 93, é 𝑐 = 1,66.
Como 𝑡𝛽1 = 2,45 > 𝑐 = 1,66, não se rejeita
Teste de 𝐻1 .
hipótese Isso significa que os homicídios nos campi
aumentaram, proporcionalmente, mais que
o número de matrículas nas universidades
americanas.
O gráfico a seguir relaciona o
Teste de crime com a matrícula
hipótese estimada para possíveis
valores de 𝛽1 .
Copyright © 2009 South-Western/Cengage Learning
68
O p-valor
Dado a estatística 𝑡 calculada
(𝑡𝛽𝑗 ), qual é o menor nível de
Cálculos dos p-
valores do teste significância em que se rejeita
t hipótese nula (𝐻0 )? Ou, qual é a
probabilidade exata de se
cometer o Erro Tipo 1.
Por exemplo, admita testar:
𝐻0 : 𝛽1 = 0
ቊ
𝐻1 : 𝛽1 ≠ 0
Considerando a estatística
O p-valor 𝑡 calculada (𝑡𝛽1 = 1,85); com
𝑔𝑙 = 𝑛 − 𝑘 − 1 = 40 e 𝛼 = 5%,
então, 𝑐 = 2,021, com teste
bicaudal. Assim, 𝐻0 não seria
rejeitada, pois, 𝑡𝛽1 < 𝑐.
Contudo a 10%, 𝑐 = 1,684, levaria a
rejeição dessa hipótese.
Portanto, sabe-se que menor nível
de significância para 𝐻0 ser
rejeitada (p-valor) é maior que 5%
O p-valor e menor que 10%, mas qual o p-
valor real?
O gráfico a seguir ajuda a
entender como se chega a esse
valor.
Copyright © 2009 South-Western/Cengage Learning
72
O p-valor é uma probabilidade,
portanto, vai sempre estar entre 0
e 1.
Para se chegar ao p-valor, é
O p-valor necessário programas de
computador para calcular as
áreas da região de rejeição da
função densidade de
probabilidade da distribuição 𝑡.
No gráfico anterior, a área de rejeição
é dada por:
p-valor = 2 ∗ 0,0359 = 0,0718.
Assim, a probabilidade exata para se
rejeitar 𝐻0 : 𝛽1 = 0 é de 7,18%.
Usando o Gretl: os parâmetros para o
O p-valor cálculo do p-valor são os 𝑔𝑙 e o valor
do teste 𝑡. Para 𝑔𝑙 = 40 e 𝑡𝛽1 = 1,85,
𝑝𝑣𝑎𝑙𝑜𝑟 = 0,0717107.
Portanto, quanto menor o p-valor,
menor a probabilidade de se
cometer o Erro Tipo 1.
Qual é a diferença entre aceitar
e não rejeitar 𝐻0 ?
Admita que uma dada
elasticidade seja: 𝛽መ1 = 1,2, 𝑑𝑝 =
Diferença entre 1,07 e 𝑔𝑙 = 30, então 𝑐 = 2,042
aceitar e não
rejeitar 𝐻0. Se o desejo for testar:
𝐻0 : 𝛽1 = 1
ቊ
𝐻1 : 𝛽1 ≠ 1
1,12−1
𝑡𝛽1 = 1,07
= 0,11
Nesse caso, a 5% de significância,
não se rejeita 𝐻0
Porém, pode-se atribuir infinitos
valores ao 𝛽1 , como 𝛽1 = 0,9, o que
implica testar:
Diferença entre
aceitar e não 𝐻0 : 𝛽1 = 0,9
rejeitar 𝐻0. ቊ
𝐻1 : 𝛽1 ≠ 0,9
que, também, leva a não rejeição de
𝐻0 , já que:
1,12−0,9
𝑡𝛽𝑗 = 1,07
= 0,206.
Portanto, as hipóteses 𝛽1 = 1 e
𝛽1 = 0,9 não podem ser
ambas verdadeiras, de modo
Diferença entre que não faz sentido aceitar
aceitar e não uma delas. Por isso, o correto é
rejeitar 𝐻0.
dizer que não se rejeita a
hipótese nula e nunca se
aceita a hipótese nula.
Significância estatística é
determinada pelo tamanho de 𝑡𝛽𝑗 ,
enquanto significância econômica
Significância
econômica e está relacionada à magnitude e ao
significância sinal de 𝛽መ𝑗 .
estatística
Pode acontecer de um parâmetro
ter significância estatística, mas
não ter significância econômica.
Veja o exemplo 4.6, cuja regressão
estimada é:
𝑇𝑎𝑥𝑎𝑝
= 80,29 + 5,4𝑇𝑎𝑥𝑐𝑜𝑛𝑡 + 0,27𝑖𝑑𝑎𝑑𝑒 + 0,00013𝑡𝑜𝑡𝑒𝑚𝑝
100
Em vez de se ter no teste F a
SQR, pode-se usar o 𝑅2 . Das
equações (5) e (6) se obtém os
Testes de coeficientes de determinação
restrições lineares 2
múltiplas: o teste 𝑅𝑖𝑟 e 𝑅𝑟2 .
F
Veja que agora 2
𝑅𝑖𝑟> 2 então, o
𝑅𝑟 ,
teste F passa ser especificado
como:
2
𝑅𝑖𝑟 −𝑅𝑟2 ൗ𝑞
𝐹𝑞, 𝑛−𝑘−1 = 2 )Τ 𝑛−𝑘−1
(1−𝑅𝑖𝑟
(8)
Exemplo:
Estatística F: Considere o modelo de
Tabela ANOVA
regressão:
= 𝛽መ0 + 𝛽መ1 𝑇𝑎𝑥𝑐𝑜𝑛𝑡 +
𝑇𝑎𝑥𝑎𝑝
𝛽መ2 𝑖𝑑𝑎𝑑𝑒 + 𝛽መ3 𝑡𝑜𝑡𝑒𝑚𝑝
A significância geral dessa
regressão é dada ao usar a
estatística F para testar as hipóteses:
𝐻0 :𝛽1 = 𝛽2 = 𝛽3 = 0.
O critério de rejeição é o mesmo do
Estatística F: teste F anterior, isto é:
Tabela ANOVA
Se 𝐹 > 𝑐, implica dizer que
variáveis do modelo de regressão
𝑇𝑎𝑥𝑐𝑜𝑛𝑡, 𝑖𝑑𝑎𝑑𝑒 𝑒 𝑡𝑜𝑡𝑒𝑚𝑝 têm efeito
conjunto sobre a variável 𝑇𝑎𝑥𝑎𝑝.
Pode-se estar interessado em
testar diferentes valores para as
restrições. Por exemplo, considere
Teste de
restrições o modelo de determinação dos
lineares gerais preços dos imóveis.
ln 𝑝𝑟𝑒ç𝑜 = 𝛽0 + 𝛽1 ln 𝑎𝑣𝑎𝑙 +
𝛽2 ln 𝑡𝑎𝑚𝑡𝑒𝑟𝑟eno +𝛽3 ln 𝑎𝑟𝑞𝑢𝑎𝑑 +𝛽4 ln 𝑞𝑡𝑑𝑜𝑟𝑚 +
𝑢 (11)
Deseja-se testar se o preço do
imóvel 𝑝𝑟𝑒ç𝑜 varia na mesma
proporção da avaliação 𝑎𝑣𝑎𝑙 do
mesmo e as demais variáveis não
ajudam a explicar o 𝑝𝑟𝑒ç𝑜.
Teste de
restrições Portanto, as hipóteses testadas:
lineares gerais 𝐻0 : 𝛽1 = 1, 𝛽2 = 0, 𝛽3 = 0 e 𝛽4 = 0
Trata-se de um teste F de restrições:
O modelo (11) é o irrestrito, que
gera 𝑆𝑄𝑅𝑖𝑟 .
Incorporando essas restrições
no modelo (11), tem-se:
114
Utilize o arquivo twoyear para resolver as questões a
seguir.
1) Estime o modelo de regressão abaixo e identifique a
tabela ANOVA :
ln 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑗𝑐 + 𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢.
em que, 𝑤𝑎𝑔𝑒 é o salário do indivíduo, 𝑗𝑐 é o número de
Exercícios anos frequentados em cursos profissionalizantes de dois
anos, 𝑢𝑛𝑖𝑣 é o número de anos frequentados em cursos
superiores de quatro anos e 𝑒𝑥𝑝𝑒𝑟 número de meses
trabalhados pelo indivíduo.
2) Gere o vetor de resíduos e verifique se este vetor se
aproxima de uma distribuição normal, usando a função
densidade Kernel. Qual a sua conclusão?
3) Estabeleça a hipótese nula bicaudal para cada
parâmetro e use o teste t para ver quais deles são
significativos a 5% de significância. O que se pode
concluir?
4) Use o p-valor para testar o nível de significância dos
parâmetros do modelo e descubra o nível exato de
significância do 𝛽1 .
Exercícios 5) Interprete as magnitudes de cada parâmetro estimado.
6) Faça o intervalo de confiança para 𝛽1 , com nível de
significância de 5% e interprete o resultado. Lembre-se: