0% acharam este documento útil (0 voto)
26 visualizações118 páginas

Aula 3 - Inferência

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
26 visualizações118 páginas

Aula 3 - Inferência

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 118

Cap.

4 – Análise de Regressão
Múltipla: Inferência
Introdução à econometria: uma abordagem
moderna
Wooldridge

Prof. Clailton Ataídes de Freitas


Conhecer o valor esperado e a
variância de 𝛽መ𝑗 é útil para
determinar a precisão deste
Distribuições
Amostrais dos estimador.
Estimadores de
MQO Para a inferência estatística, a
distribuição de 𝛽መ𝑗 , a priori, pode
ser de qualquer forma.
Para tornar a distribuição de
Distribuições
𝛽መ𝑗 viável, para fazer
Amostrais dos
Estimadores de inferência, é preciso
MQO pressupor a distribuição
normal dos resíduos. Por quê?
 Veja que:
 β෠ = (X ′ X)−1 X ′ Y e : Y = Xβ + u, então:
β෠ = β + (X ′ X)−1 X ′ u

Distribuições  Como β é um vetor de parâmetros


Amostrais dos fixos e X é um vetor de variáveis
Estimadores de fixas (a parte não estocástica do
MQO
modelo), então ao cabo, β෠ passa a
ser função linear dos resíduos
aleatórios, ou da parte estocástica
do modelo.
 Dessa forma, a distribuição de
probabilidade de 𝛽መ𝑗 está em função
da distribuição de probabilidade
dos resíduos. Formalmente:
Distribuições  β෠ = β + (X ′ X)−1 X ′ 𝑓 u
Amostrais dos  Uma das propriedades da
Estimadores de distribuição normal é que se uma
MQO variável observada está em função
de uma outra com distribuição
normal, então, essa variável
observada segue, também,
distribuição normal.
 Portanto, assumindo a hipótese
da normalidade dos resíduos,
Distribuições se consegue derivar,
Amostrais dos facilmente, os estimadores de
Estimadores de
MQO. Daí a importância de se
MQO
assumir a hipótese da
normalidade dos resíduos.
Hipótese RLM.6.
O vetor de resíduos (u) é
independente das variáveis
explicativas e segue
distribuição normal com
Hipótese RLM.6 média zero e variância 𝜎 2 ,
ou:
u~Normal(0, 𝜎 2 )
RLM.6 é uma hipótese mais
forte que as anteriores,
pois, se pressupõe que u
Hipótese RLM.6 seja independente de X e
homoscedástico,
Formalmente: E u X = 0 e
Var u X = Var u = 𝜎 2 I.
 Portanto, a RLM.6 assume as
hióteses RLM.4 (média
condicional dos resíduos
zero) e a RLM.5
Hipóteses do (homoscedasticidade).
MLC  As hipóteses RLM.1 a RLM.6
formam o conjunto de
hipóteses que sustentam o
modelo linear clássico (MLC).
 Com as seis hipóteses do MLC os
estimadores 𝛽መ𝑗 contemplam a
propriedade de eficiência. Assim, os
estimadores são não viesados e
eficientes.
 Portanto, as seis hipóteses do MLC são
Hipóteses do mais forte do que sob as hipóteses de
MLC Gauss-Markov (RLM.1 a RLM.5).
 Pode se mostrar que os estimadores 𝛽መ𝑗
tem a menor variância entre os
estimadores não viesados. A prova está
a seguir, usando o Greene.
 Considere o modelo de regressão em
notação matricial múltipla:
 Y = Xβ + u (1)
 Sabe-se que: Var β෠ = 𝜎ො 2 I X ′ X −1
e que
 β෠ = (X ′ X)−1 X ′ Y.
Hipóteses do MLC
 Admita que 𝑏𝑗 seja um outro estimador
linear não viesado dado por:
 b = GY (2)
em que, G = X ′ X −1
X′
 G′ =X X ′ X −1
 Substituindo a equação (1) na equação (2):
 b = G(Xβ + u) (2.1)
 b = GXβ + u
 Como GX = I, tem-se:
Variância  b − β = Gu (2.2)
mínima do
 Então, por definição:
estimador 𝛽መ𝑗
 Var b X = E b − β b − β ′
(2.3)
 Var b X = E Gu Gu ′

 Var b X = E Guu′ G′
 Var b X = GE(uu′ )G′
 Com as hipóteses RLM.4 e RLM.5,
E(uu′ ) = 𝜎ො 2 I
 Assim,
 Var b X = 𝜎ො 2 IGG′ (3)
 Agora, admita a existência de uma
matriz de zeros, D, dada por:
 D = G − X′X −1
X′ (4)
 Pode-se reescrever a equação (4)
como:
 G = D + X′X −1
X′ (5)
 Ao substituir a equação (5) na equação (3):
 Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D +
X′X −1
X′)′ (6)
 Transpondo o último termo da equação (6):
 Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D′ +
Variância X X′X −1
)
mínima do
 Var b X = 𝜎Ƹ 2 I(DD′ + DX X ′ X
estimador 𝛽መ𝑗
−1
+
=0
X′X −1 ′ ′
X D + X′X −1 ′
X 𝑋 X′X −1
)
=0 =I

 Var b X = 𝜎Ƹ 2 I(DD′ + X ′ X −1
)
 Var b X = 𝜎ො 2 IDD′ + 𝜎ො 2 I X ′ X −1

Var β

 Var b X = 𝜎ො 2 DD′ + Var β෠

 O termo DD′ é uma forma quadrática, sendo uma


matriz definida não negativa.
 Uma matriz é definida não negativa se o seu
Variância determinante é maior ou igual a zero, ou seja, DD′ ≥
mínima do 0.

estimador 𝛽መ𝑗  Assim, Var b X = Var(β෠) + 𝜎Ƹ 2 IDD′


𝑇𝑒𝑟𝑚𝑜 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜

 Portanto, a Var β෠ , por MQO, tem variância menor do


que qualquer outro estimador, como por exemplo, o
estimador de variável instrumental.
 Var b X > Var β෠ CQD.
 Em notação escalar para um modelo de regressão
simples:
σ 𝑥𝑖 𝑦𝑖 𝑥
 O estimador de MQO é: 𝛽መ = σ 𝑥𝑖2
, definindo 𝑘𝑖 = σ 𝑥𝑖 2,
𝑖
1
então: 𝛽መ = σ 𝑘𝑖 𝑦𝑖 e a V𝑎𝑟 𝛽መ = 𝜎Ƹ 2 σ 𝑥 2
𝑖

 Definindo alternativamente um outro estimador de 𝛽


Variância como: 𝑏 = σ 𝑤𝑖 𝑦𝑖 e o modelo de regressão por desvio
mínima do de média:

estimador 𝛽መ𝑗  𝑦𝑖 = 𝛽𝑥𝑖 +𝑢𝑖


 Então, b = σ 𝑤𝑖 𝛽𝑥𝑖 +𝑢𝑖
 b = 𝛽 σ 𝑤𝑖 𝑥𝑖 + σ 𝑤𝑖 𝑢𝑖
 b = 𝛽 + σ 𝑤𝑖 𝑢𝑖
𝑥𝑖
 em que, se admite que 𝑤𝑖 = σ 𝑥𝑖2
 Sabendo que b − 𝛽 = σ 𝑤𝑖 𝑢𝑖
 Então, Var b|𝑥 = E b − 𝛽 2

 Var b|𝑥 = E σ 𝑤𝑖 𝑢𝑖 2

 Var b|𝑥 = E 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯ 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯
 Var b|𝑥 = E 𝑤12 𝑢12 + 𝑤1 𝑤2 𝑢1 𝑢2 + 𝑤22 𝑢22 + ⋯
 Var b|𝑥 = 𝑤12 𝐸(𝑢12 ) + 𝑤1 𝑤2 𝐸(𝑢1 𝑢2 ) + 𝑤22 𝐸(𝑢22 +) ⋯
Variância
 Como: 𝐸(𝑢𝑖 𝑢𝑗 ) = 0, com 𝑖 ≠ 𝑗 e 𝐸(𝑢ො 𝑖2 ) = 𝜎ො 2
mínima do  Var b|𝑥 = 𝜎ො 2 𝑤12 + 𝑤22 + ⋯
estimador 𝛽መ𝑗  Var b|𝑥 = 𝜎ො 2 σ 𝑤𝑖2
 Agora, usando um artifício matemático de somar e
𝑥𝑖
subtrair σ dessa equação:
𝑥𝑖2
𝑥 𝑥
 = 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖 2 + σ 𝑥𝑖 2 )2, resolvendo o produto notável e
𝑖 𝑖
simplificando esta equação:
𝑥𝑖 2 σ 𝑥𝑖2 𝑥𝑖 𝑥𝑖
= 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖2
) + 𝜎Ƹ 2
(σ 𝑥𝑖2 )2
+ 2𝜎Ƹ 2 𝑤𝑖 − σ 𝑥𝑖2 σ 𝑥𝑖2

𝑥
 Perceba, dado 𝑤𝑖 = σ 𝑥𝑖 2, que o último termo da
𝑖
equação acima soma zero, então:

Variância  𝑉𝑎𝑟 b = 𝜎ො 2 σ(𝑤𝑖 −


𝑥𝑖 2
σ 𝑥𝑖2
) + 𝜎ො 2
σ 𝑥𝑖2
(σ 𝑥𝑖2 )2
, simplificando:
mínima do 𝑥 1
 𝑉𝑎𝑟 b = 𝜎ො 2 σ(𝑤𝑖 − σ 𝑥𝑖 2 )2 + 𝜎ො 2 σ 𝑥 2
estimador 𝛽መ𝑗 𝑖 𝑖

 O último termo da equação é a acima é V𝑎𝑟 𝛽መ , já o


primeiro termo desse equação será sempre maior ou
igual a zero, porque está elevado ao quadrado, então:

 𝑉𝑎𝑟 b > V𝑎𝑟 𝛽መ , CQD.


A maneira mais formal de
resumir as hipóteses MRLC é:
Hipóteses MLC Y|X~N(𝛽0 + 𝛽1 𝑋1 + ⋯ +
e o TLC 2
𝛽𝑘 𝑋𝑘 , 𝜎𝑌|𝑋 ). Isso significa que ao
condicionar Y a X, se tem médias
lineares dos parâmetros em
𝑋1 , ⋯ , 𝑋𝑘 e variância constante.
Hipóteses MLC
e o TLC
Se sabe que o resíduo 𝑢 é
formado por um grande
número de variáveis, então,
Hipóteses MLC pode-se invocar o Teorema
e o TLC do Limite Central (TLC)
para justificar a
distribuição normal dos
resíduos.
 Exemplificando como o vetor de resíduos é formado
por um grande número de variáveis. Considere, por
exemplo, a função consumo keynesiana mais simples
(𝐶) dada por: 𝐶𝑖 = 𝛽0 + 𝛽1 𝑅𝑒𝑛𝑑𝑎1 + 𝑢𝑖 .
 Logicamente, que não é somente a renda que explica
o consumo, outras variáveis (a riqueza, a idade, o
nível educacional, a religião, o gênero, os fatores
Hipóteses MLC étnicos...) podem, também, exercer essa função.
Contudo, estatisticamente, vamos considerar que
e o TLC essas variáveis não foram significativas a níveis
baixos de significância (10%, 5% ou 1%). Por isso,
elas foram desconsideradas do modelo, mas isso não
significa que tais variáveis não exerçam qualquer
tipo de influência sobre o consumo, mas sim que a
influência conjunta dessas variáveis é pequena, ou
residual.
 Isso justifica a exclusão dessas
variáveis, para se ter uma relação
mais parcimoniosa no modelo.
 Portanto, o resíduo é formado, na
prática, por um grande número de
Hipóteses MLC variáveis que foram ignoradas no
e o TLC modelo, como no presente caso:

𝐺ê𝑛𝑒𝑟𝑜
𝐼𝑑𝑎𝑑𝑒
 𝐶𝑖 = 𝛽0 + 𝛽1 𝑅𝑒𝑛𝑑𝑎1 + 𝑢𝑖
𝐸𝑑𝑢𝑐𝑎çã𝑜

 Portanto, se há um grande número de variáveis
independentes, compondo o resíduo, todas
com a mesma função densidade de
probabilidade, com média 𝜇 e variância
constante (𝜎 2), então, segundo o TLC, a
distribuição da soma dessas variáveis (aqui
representada por σ Xi ) equivale ao resíduo.
Hipóteses MLC Então, a distribuição desse resíduo tende a
e o TLC uma normal. Essa é a definição mais objetiva
do TLC, ou seja:
 σ𝑛𝑖=1 X𝑖 = u𝑖 ~𝑁(0, 𝜎 2 )
em que, média de u𝑖 é: 𝐸(u𝑖 ) = 0 e a variância
de u𝑖 : 𝐸 𝑢𝑖2 = 𝜎 2
 Uma variante do TLC estabelece que,
mesmo que esse número de variáveis não
seja tão grande, ainda sim, a soma dessas
variáveis tende a uma distribuição normal.
 O problema do TLC é a pressuposição de
Hipóteses MLC que as variáveis aleatórias de u𝑖 afetam Y
de forma isolada e aditiva.
e o TLC
 Na prática, é sustentado que as variáveis
que compõe 𝑢 sejam independentes entre
si, o que não é fácil de se encontrar nos
problemas econômicos, em muitos casos.
 Daí a justificativa de se testar se 𝑢
segue distribuição normal.
 Uma das formas de se encontrar
Hipóteses MLC resíduos com distribuição normal é
e o TLC fazer transformações logarítmicas das
variáveis do modelo. Isso tende gerar
distribuições mais próximas da
normal.
 Lembre-se, nesse caso, tem-se
distribuição log-normal, como
retratado na figura a seguir.
Hipóteses MLC  Importante: a não normalidade
e o TLC
não é um problema sério com
amostras assintóticas, conforme
será discutido no Capítulo 5.
Distribuição log-
normal

http://www.portalaction.com.br/probabilidades/615-
distribuicao-log-normal
Teorema 4.1: sob as hipóteses do
MRLC, RLM.1 a RLM.6, o
Distribuição parâmetro 𝛽መ𝑗 segue distribuição
amostrais dos normal com média 𝛽𝑗 e 𝑉𝑎𝑟(𝛽𝑗 ),
estimadores 𝛽መ𝑗 formalmente:
 𝛽መ𝑗 ~𝑁𝑜𝑟𝑚𝑎𝑙[𝛽𝑗 , Var(𝛽𝑗 )]
 Uma distribuição normal é
construída usando somente dois
parâmetros a média e a variância.

Distribuição  Foi visto que a média de 𝛽መ𝑗 é dada


amostrais dos por: 𝐸(𝛽መ𝑗 ) = 𝛽𝑗 , estimador não
estimadores 𝛽መ𝑗 viesado.
 A variância de 𝛽መ𝑗 é mínima:
 Var 𝛽መ𝑗 = 𝜎 2 X ′ X −1
෡𝑗 −𝛽𝑗 )
(𝛽
Ao padronizar 𝛽መ𝑗 , tem-se: 𝑑𝑝(𝛽෡ ) .
𝑗

Então:
Distribuições ෡𝑗 −𝛽𝑗 )
(𝛽
amostrais  ෡
𝑑𝑝(𝛽𝑗 )
~𝑁𝑃(0,1)
normais
em que, 𝑁𝑃 é uma normal
padrão. Sempre uma NP terá
média 0 e variância 1.
Veja que a fórmula da Var 𝛽መ𝑗 tem
𝜎 2 , que é desconhecido. Devido a
Teste de
dificuldade e até a impossibilidade
hipótese: teste
t. de se trabalhar com 𝜎 2 , usa-se 𝜎ො 2
como estimativas. Assim, o Teorema
4.1 se transforma no Teorema 4.2.
 Teorema 4.2: sob as hipóteses do RLM.1
a RLM.6 a distribuição dos estimadores
padronizados segue distribuição t:
෡𝑗 −𝛽𝑗 )
(𝛽
 𝑑𝑝(𝛽෡ ) ~𝑡𝛽෡𝑗 , com g𝑙 = 𝑛 − 𝑘 − 1 e
𝑗

Teste de 𝑑𝑝 𝛽መ𝑗 = 𝑉𝑎𝑟 𝛽መ𝑗


hipótese: teste
t. em que, 𝑉𝑎𝑟 𝛽መ𝑗 = 𝜎ො 2 X ′ X −1

 Cabe ressaltar, que a média, mediana e


moda da distribuição 𝑡 é zero e a
medida que 𝑔𝑙 aumenta 𝑔𝑙 > 30 a
distribuição t vai convergindo para
uma normal.
 A distribuição da razão entre
a variância estimada dos
resíduos da amostra (𝜎ො 2 ) e a
variância dos resíduos da
população 𝜎 2 segue uma qui-
quadrada, com 𝑔𝑙 = 𝑛 − 𝑘 − 1:
Distribuição qui
ෝ2
𝜎
quadrada  𝑛−𝑘−1 𝜎 2 ~𝜒 2
𝑛−𝑘−1 .
 A figura a seguir retrata uma
distribuição qui-quadrada
genérica.
Distribuição qui
quadrada

Fonte: http://professorguru.com.br/estatistica/inferencia-estatistica/intervalos-de-
confianca.html
O Teorema 4.2 permite testar
hipóteses relacionadas ao 𝛽መ𝑗 .
Teste de
hipótese Na prática, o interesse é testar
a hipótese nula 𝐻0 : 𝛽𝑗 = 0.
 Se, por exemplo, no modelo de regressão:
 𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋1𝑖 + 𝛽መ2 𝑋2𝑖 + 𝑢ො 𝑖 ,
 𝑋1 não tiver efeito parcial sobre Y, então, ao realizar o teste de
hipótese, 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0, não se rejeita a hipótese
nula.
 Assim, usa-se a estatística 𝑡 para testar se uma variável 𝑋𝑗
explica, parcialmente, 𝑌. Se ela não explica, 𝛽𝑗 = 0. Esse
Teste de diagnóstico é feito usando a estatística 𝑡 definida como:

hipótese  𝑡𝛽෡𝑗 =
෡𝑗 −0
𝛽
𝑑𝑝(𝛽෡𝑗 )

 Essa estatística é a 𝑡 calculada, que deve ser comparada com a


estatística 𝑡 crítica (tabela t).
 Critério de decisão: se 𝑡𝛽෡𝑗 > 𝑐, rejeita-se 𝐻0 , o que implica que
𝛽መ1 é estatisticamente significativo, ou que 𝑋1𝑖 explica 𝑌𝑖 , ou
vice-versa.
Na prática, 𝛽𝑗 nunca será
exatamente zero, pois, ele é
Teste de considerado zero a um
hipótese determinado nível baixo de
signficância (𝛼), como 1%, 5% e
10%.
 Por exemplo:
 Se, 𝑛 = 33, 𝑘 = 2, 𝛽መ1 = 0,36 e
𝑑𝑝(𝛽መ1 ) = 0,38, então: 𝑡𝛽෡1 = 0,94 e
𝑔𝑙 = 𝑛 − 𝑘 − 1 = 30
 em que, 𝑘 é o número de
Teste de regressores.
hipótese
 Os valores críticos (𝑐) do teste 𝑡 são:
a 5% de significância (2,04), a
10%(1,697); a 20%(1,31); a
30%(1,05) e a 40%(0,85).
 Assim, por exemplo, a 5% de
significância e 𝑔𝑙 = 30, o valor crítico do
𝑡 é 𝑐 = 2,04; como o valor calculado do
teste 𝑡 foi de 𝑡𝛽෡1 = 0,94, então, 𝑡𝛽෡1 <
Teste de 𝑐. Portanto, a esse nível de significância
hipótese 𝛽1 = 0, ou seja, não se rejeita a hipótese
nula (𝐻0 ). Isso implica que 𝑋1 não tem
efeito estatisticamente significativo sobre
𝑌.
 No entanto, se o nível de significância for
aumentando, vai se chegar em alguma
estimativa em que vai se rejeitar 𝐻0 . Esse é
Teste de o caso em que o nível de significância for
hipótese de 40% (𝛼 = 0,40). Nesse nível, 𝑡𝛽෡1 > 𝑐,
então, 𝐻0 é rejeitada e 𝑋1 passa a explicar
𝑌. No entanto, trata-se de um nível muito
alto de significância.
 Em estudos empíricos, é aceitável
um nível máximo de 10%, para
amostras moderadas. Para amostras
assintóticas, com centenas ou
milhares de observações, não se
deve abrir mão de um nível de 5%
de significância.
Enfim, valor de 𝑡𝛽෡𝑗 mais distante
de zero aponta para a rejeição
de 𝐻0 .
O sinal do teste t.
Teste de Como 𝑑𝑝(𝛽መ𝑗 ) é o segundo
hipótese
momento da distribuição, então,
𝑑𝑝(𝛽መ𝑗 ) > 0. Assim, o sinal de 𝑡෡
𝛽𝑗

vai depender de 𝛽መ𝑗 .


O teste de hipótese é feito
sobre parâmetros
populacionais. Isso significa
que não faz sentido testar
parâmetros estimados, ou seja,
Teste de 𝐻0 : 𝛽መ𝑗 = 0.
hipótese
Por exemplo, se a estimativa
de 𝛽መ𝑗 = 1,3. Imagine o
absurdo testar:
 𝐻0 : 1,3 = 0.
Hipótese alternativa unilateral:
Considere a hipótese
alternativa como: 𝐻1 : 𝛽1 > 0.

Teste de Quando se estabelece 𝐻1 dessa


hipótese maneira, se admite que a
hipótese nula 𝐻0 : 𝛽1 ≤ 0.
Como definir uma regra de
rejeição ou não de 𝐻0 ?
Primeiro, se decide por algum
nível de significância baixo, 1%
ou 5% ou 10%.
Esse nível de significância é a
probabilidade exata de se
Teste de
hipótese cometer o Erro Tipo 1, que é
rejeitar 𝑯𝟎 quando ela é
verdadeira.
Erro Tipo 2 é não rejeitar 𝑯𝟎
quando ela é falsa.
Portanto,
Regra de rejeição da hipótese:
Teste de
hipótese Se 𝑡𝛽෡𝑗 > 𝑐, rejeita-se 𝐻0 . Isso
aponta para 𝛽𝑗 > 0,
 Exemplificando o teste de hipótese
bicaudal, ou bilateral
 Exemplo 1. Considere a reta de
regressão ajustada:
 𝑌෠ = 𝛽መ0 + 17,41𝑋1 + 3,5𝑋2
Teste de  𝑑𝑝 5,3 2,9 , com 𝑛 = 28
hipótese
 Hipóteses:
 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0 e
 𝐻0 : 𝛽2 = 0 contra 𝐻1 : 𝛽2 ≠ 0
Então, 𝑡𝛽෡1 = 3,28 e 𝑡𝛽෡2 = 1,21 e
𝑔𝑙 = 28 − 2 − 1 = 25
Teste de O valor crítico (𝑐) do teste t
hipótese
bicaudal com 𝑔𝑙 = 25, ao nível de
significância de 5%, é de 𝑐 =
2,06 e a 1%, 𝑐 = 2,79.
Analisando 𝛽1 :
Como 𝑡𝛽෡1 = 3,28 > 𝑐 = 2,79, então,
se rejeita 𝐻0 , indicando que o
parâmetro 𝛽መ1 é estatisticamente
Interpretando o
significativo a 1% de
teste t.
significância.
Assim, 𝑋1 tem efeito parcial
estatisticamente significativo
sobre 𝑌.
 Com relação ao 𝛽2 :
 Como 𝑡𝛽෡2 = 1,21 < 𝑐 = 2,06, então, não
se rejeita 𝐻0 , indicando que o
parâmetro 𝛽መ2 não é estatisticamente
Interpretando o significativo a 5% de significância.
teste t.
 Assim, 𝑋2 não tem efeito parcial
estatisticamente significativo sobre 𝑌 a
5% de significância. Será que 𝛽መ2 seria
significativo a 10%?
Veja que utilizando a
distribuição 𝑡 pode-se definir
a região de rejeição e a de
não rejeição de 𝐻0 .
Teste de Como é um teste bicaudal, a
hipótese
bicaudal 5%, então se tem 0,025% de
significância para cada cauda
da distribuição 𝑡, como retrata
a figura a seguir.
Copyright © 2009 South-Western/Cengage Learning
Figura da Distribuição t.

53
Veja nessa figura que, 𝑡𝛽෡1 = 3,28,
cai na região de rejeição 𝐻0 , ao
Teste de passo que e 𝑡𝛽෡2 = 1,21 está na
hipótese
bicaudal região de não rejeição dessa
hipótese.
Exemplo 2. Utilizar os dados da
regressão anterior, mas fazer o
teste monocaudal a 5%, ou seja:
Teste de
hipótese Testar as hipóteses:
monocaudal
𝐻1 : 𝛽1 > 0 𝐻1 : 𝛽2 > 0
ቊ eቊ
𝐻0 : 𝛽1 ≤ 0 𝐻0 : 𝛽2 ≤ 0
𝑡𝛽෡1 = 3,28 e 𝑡𝛽෡2 = 1,21 e 𝑔𝑙 = 25
O valor crítico (c) do teste t
monocaudal, com 𝑔𝑙 = 25 e
𝛼 = 5%, é 𝑐 = 1,701.
Teste de Note:
hipótese
monocaudal Para 𝛽1 , não se rejeita 𝐻1 , logo 𝛽መ1
é positivo e estatisticamente
significativo a 5% de
significância.
Para 𝛽2 , não se rejeita 𝐻0 , ou se
rejeita 𝐻1 , logo 𝛽መ2 não é
estatisticamente significativo a
5% de significância.
Teste de Veja, pelo gráfico da distribuição
hipótese t
𝑡, a seguir, que 𝑡𝛽෡1 = 3,28 está na
região de rejeição da hipótese
nula e 𝑡𝛽෡2 cai na região de não
rejeição dessa hipótese.
Figura da. Distribuição t

Teste de
hipótese t
Exemplo 3. Considere que 𝑡𝛽෡1 =
− 1,878 e 𝑔𝑙 = 18 e se deseja
testar a hipótese alternativa:
Teste de 𝐻1 : 𝛽1 < 0, o que implica em
hipótese t 𝐻0 : 𝛽1 ≥ 0.
Para o nível de significância de
5%, 𝑔𝑙 = 18 e o teste 𝑡
unicaudal, o valor crítico do
teste é 𝑐 = −1,734.
 Assim, como o 𝑡𝛽෡1 = −1,878 é
menor, ou em modulo maior,
do que o valor crítico 𝑐 =
− 1,734, não se rejeita 𝐻1 , logo
Teste de o parâmetro 𝛽1 é
hipótese t estatisticamente significativo
e negativo.
 Na distribuição 𝑡 seguinte
está retratado este exemplo.
Copyright © 2009 South-Western/Cengage Learning

Figura 3. Distribuição t

61
Pode se estar interessado em
testar se 𝛽መ𝑗 é igual a uma
constante específica, como 1, −1
ou outro valor qualquer.
Teste de
hipótese t  Neste caso, a hipótese unilateral
seria estabelecida como:
𝐻1 : 𝛽1 = 1
ቊ e,
𝐻0 : 𝛽1 > 1
A hipótese bilateral:

𝐻0 : 𝛽1 = 1
ቊ
𝐻1 : 𝛽1 ≠ 1
Em ambos casos, a estatística 𝑡
Teste de
hipótese t apropriada é dada por:
෡1 −𝛽1
𝛽 ෡1 −1
𝛽
 𝑡𝛽෡1 = 𝑑𝑝(𝛽෡1 ) = 𝑡𝛽෡1 = ෡
𝑑𝑝(𝛽1 )
, já
que se busca testar 𝛽1 = 1.
Exemplo 4.4:
Considere a relação entre o
número de crimes nos campi e o
número de alunos matriculados
Teste de
hipótese nas universidades dos EUA.
A reta de regressão estimada é:
෣ = −6,63 + 1,27𝑙𝑛𝑀𝑎𝑡𝑟𝑖
𝑙𝑛𝐶𝑟𝑖𝑚𝑒
𝑑𝑝 1,03 0,11 ; 𝑛 = 95
Deseja-se testar se os crimes
nos campi aumentaram,
proporcionalmente, mais que os
universitários. Portanto, o foco é
a hipótese alternativa.
Teste de
hipótese As hipóteses testadas são:
𝐻1 : 𝛽1 > 1
ቊ , então:
𝐻0 : 𝛽1 ≤ 1
1,27−1
 𝑡𝛽෡1 = 0,11
= 2,45
 Valor crítico unicaudal, com 5% de
significância e 𝑔𝑙 = 93, é 𝑐 = 1,66.
 Como 𝑡𝛽෡1 = 2,45 > 𝑐 = 1,66, não se rejeita
Teste de 𝐻1 .
hipótese  Isso significa que os homicídios nos campi
aumentaram, proporcionalmente, mais que
o número de matrículas nas universidades
americanas.
O gráfico a seguir relaciona o
Teste de crime com a matrícula
hipótese estimada para possíveis
valores de 𝛽1 .
Copyright © 2009 South-Western/Cengage Learning

68
O p-valor
Dado a estatística 𝑡 calculada
(𝑡𝛽෡𝑗 ), qual é o menor nível de
Cálculos dos p-
valores do teste significância em que se rejeita
t hipótese nula (𝐻0 )? Ou, qual é a
probabilidade exata de se
cometer o Erro Tipo 1.
Por exemplo, admita testar:
𝐻0 : 𝛽1 = 0

𝐻1 : 𝛽1 ≠ 0
Considerando a estatística
O p-valor 𝑡 calculada (𝑡𝛽෡1 = 1,85); com
𝑔𝑙 = 𝑛 − 𝑘 − 1 = 40 e 𝛼 = 5%,
então, 𝑐 = 2,021, com teste
bicaudal. Assim, 𝐻0 não seria
rejeitada, pois, 𝑡𝛽෡1 < 𝑐.
 Contudo a 10%, 𝑐 = 1,684, levaria a
rejeição dessa hipótese.
 Portanto, sabe-se que menor nível
de significância para 𝐻0 ser
rejeitada (p-valor) é maior que 5%
O p-valor e menor que 10%, mas qual o p-
valor real?
 O gráfico a seguir ajuda a
entender como se chega a esse
valor.
Copyright © 2009 South-Western/Cengage Learning

72
O p-valor é uma probabilidade,
portanto, vai sempre estar entre 0
e 1.
Para se chegar ao p-valor, é
O p-valor necessário programas de
computador para calcular as
áreas da região de rejeição da
função densidade de
probabilidade da distribuição 𝑡.
 No gráfico anterior, a área de rejeição
é dada por:
 p-valor = 2 ∗ 0,0359 = 0,0718.
Assim, a probabilidade exata para se
rejeitar 𝐻0 : 𝛽1 = 0 é de 7,18%.
 Usando o Gretl: os parâmetros para o
O p-valor cálculo do p-valor são os 𝑔𝑙 e o valor
do teste 𝑡. Para 𝑔𝑙 = 40 e 𝑡𝛽෡1 = 1,85,
𝑝𝑣𝑎𝑙𝑜𝑟 = 0,0717107.
 Portanto, quanto menor o p-valor,
menor a probabilidade de se
cometer o Erro Tipo 1.
Qual é a diferença entre aceitar
e não rejeitar 𝐻0 ?
Admita que uma dada
elasticidade seja: 𝛽መ1 = 1,2, 𝑑𝑝 =
Diferença entre 1,07 e 𝑔𝑙 = 30, então 𝑐 = 2,042
aceitar e não
rejeitar 𝐻0. Se o desejo for testar:
𝐻0 : 𝛽1 = 1

𝐻1 : 𝛽1 ≠ 1
1,12−1
𝑡𝛽෡1 = 1,07
= 0,11
 Nesse caso, a 5% de significância,
não se rejeita 𝐻0
 Porém, pode-se atribuir infinitos
valores ao 𝛽1 , como 𝛽1 = 0,9, o que
implica testar:
Diferença entre
aceitar e não 𝐻0 : 𝛽1 = 0,9
rejeitar 𝐻0. ቊ
𝐻1 : 𝛽1 ≠ 0,9
 que, também, leva a não rejeição de
𝐻0 , já que:
1,12−0,9
 𝑡𝛽෡𝑗 = 1,07
= 0,206.
Portanto, as hipóteses 𝛽1 = 1 e
𝛽1 = 0,9 não podem ser
ambas verdadeiras, de modo
Diferença entre que não faz sentido aceitar
aceitar e não uma delas. Por isso, o correto é
rejeitar 𝐻0.
dizer que não se rejeita a
hipótese nula e nunca se
aceita a hipótese nula.
Significância estatística é
determinada pelo tamanho de 𝑡𝛽෡𝑗 ,
enquanto significância econômica
Significância
econômica e está relacionada à magnitude e ao
significância sinal de 𝛽መ𝑗 .
estatística
Pode acontecer de um parâmetro
ter significância estatística, mas
não ter significância econômica.
 Veja o exemplo 4.6, cuja regressão
estimada é:
 𝑇𝑎𝑥𝑎𝑝
෣ = 80,29 + 5,4𝑇𝑎𝑥𝑐𝑜𝑛𝑡 + 0,27𝑖𝑑𝑎𝑑𝑒 + 0,00013𝑡𝑜𝑡𝑒𝑚𝑝

 𝑑𝑝 0,78 0,52 0,045 (0,00004)


Significância em que, 𝑇𝑎𝑥𝑎𝑝 é a taxa de
econômica e
significância participação dos funcionários em
estatística plano de aposentadoria, 𝑇𝑎𝑥𝑐𝑜𝑛𝑡 é
a taxa de contribuição e 𝑡𝑜𝑡𝑒𝑚𝑝 é
o total de empregado da empresa.
 Note que o parâmetro relacionado ao
𝑡𝑜𝑡𝑒𝑚𝑝 é estatisticamente significativo
(𝑡𝑇𝑜𝑡𝑒𝑚𝑝 = 3,25) a 1% de significância.
 Contudo, veja que 0,00013 não tem
Significância significância econômica, já que uma firma
econômica e precisaria aumentar o número de
significância funcionários em 10.000, para se ter um
estatística aumento em 1,3%, na 𝑇𝑎𝑥𝑎𝑝, já que 10.000 ∗
0,00013 = 1,3%.
 Antes de se interpretar os resultados de
uma regressão, é preciso perceber se há
sentido econômico nas estimativas obtidas.
Sob as hipóteses do MLC, pode-
se construir IC para o parâmetro
populacional 𝛽𝑗 , como:

 𝑃 ቀ𝛽መ𝑗 − 𝑡𝑐 𝑑𝑝 𝛽መ𝑗 ≤ 𝛽𝑗 ≤ 𝛽መ𝑗 +


Intervalos de
confiança (IC)
Admita que 𝛽መ1 = 1,084, 𝑑𝑝(𝛽መ1 ) =
0,06,com 𝛼 = 5% e g𝑙 = 30.
Construa o intervalo para 𝛽1 .
Intervalos de Consultando a tabela da
confiança (IC) distribuição 𝑡, o valor crítico com
𝛼 = 5% e g𝑙 = 30 é de 𝑡𝑐 = 2,042.
Assim: [1,084 − 2,042 0,06 ≤ 𝛽1 ≤
1,084 + 2,042 0,06 ] = 95%
 0,961 ≤ 𝛽1 ≤ 1,21 = 95%
 Interpretando:
 Não é correto afirmar que a
probabilidade de 𝛽1 estar entre
Intervalo de 0,961: 1,21 é de 95%, pois, o IC
confiança calculado já não é mais
probabilístico.
 O correto é dizer que a cada 100
intervalos amostrados, em 95 deles,
o 𝛽1 vai estar entre 0,961 e 1,21.
Considere a possibilidade de se
testar se 𝛽1 = 𝛽2 , ou se 𝛽1 + 𝛽2 = 1,
ou qualquer outra combinação
Teste de Hipótese: linear.
combinação
linear de Por exemplo, deseja-se testar se
parâmetros 𝛽1 = 𝛽2 , então, as hipóteses
𝐻0 : 𝛽1 = 𝛽2
estabelecidas são: ቊ
𝐻1 : 𝛽1 < 𝛽2
 Ou,
𝐻0 : 𝛽1 − 𝛽2 = 0
ቊ
𝐻1 : 𝛽1 − 𝛽2 < 0
 O teste t apropriado, para esse caso, é
෡1 −𝛽
𝛽 ෡2
Teste de Hipótese: dado por: 𝑡 = 𝑑𝑝(𝛽෡1 −𝛽
෡2 )
combinação
linear de  em que, 𝑑𝑝 𝛽መ1 − 𝛽መ2 = 𝑉𝑎𝑟(𝛽መ1 − 𝛽መ2 )
parâmetros
 𝑉𝑎𝑟 𝛽መ1 − 𝛽መ2 = 𝑉𝑎𝑟 𝛽መ1 + 𝑉𝑎𝑟(𝛽መ2 )
− 2Cov(𝛽መ1 , 𝛽መ2 )
 A regra de rejeição é a mesma dos
testes anteriores.
Alternativamente, pode-se testar
𝛽1 = 𝛽2 fazendo: 𝜃1 = 𝛽1 − 𝛽2 .
Teste de Hipótese: Ao isolar 𝛽1 , tem-se: 𝛽1 = 𝜃1 + 𝛽2 .
combinação
linear de O teste de hipótese desejado é:
parâmetros
𝐻1 : 𝜃1 < 0

𝐻0 : 𝜃1 = 0
 Para exemplificar, considere o modelo
de regressão:
 ln 𝑆𝑎𝑙 = 𝛽0 + 𝛽1 𝑐𝑝 + 𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 +
𝑢 (1)

Teste de Hipótese: em que, 𝑐𝑝 e 𝑢𝑛𝑖𝑣 são, respectivamente, o


combinação nº de anos em curso técnico e superior.
linear de Assim, deseja se testar se os cursos
parâmetros superiores e técnicos resultam no mesmo
salário, ou seja, se 𝛽1 = 𝛽2 , então, as
𝐻1 : 𝛽1 < 𝛽2
hipóteses estabelecidas são: ቊ
𝐻0 : 𝛽1 = 𝛽2
 Substituindo 𝛽1 = 𝜃1 + 𝛽2 na equação
(1):
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + (𝜃1 + 𝛽2 )𝑐𝑝 +
𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (2)
Teste de Hipótese:  Aplicando a distributiva na eq. (2):
combinação
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + 𝜃1 𝑐𝑝 +𝛽2 𝑐𝑝 +
linear de
𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (3)
parâmetros
 Colocando 𝛽2 em evidência na equação
(3):
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + 𝜃1 𝑐𝑝 +𝛽2 (𝑐𝑝 +
𝑢𝑛𝑖𝑣) +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (4)
Agora, é só estimar a regressão
Testes de (4) e testar a significância do
restrições lineares
múltiplas: o teste parâmetro 𝜃1 , usando o teste 𝑡
F trivial.
Admita, que se deseje
testar várias restrições,
Testes de como:
restrições lineares
múltiplas: o teste  𝐻0 : 𝛽3 = 0, 𝛽4 = 0, 𝛽5 = 0,
F
no seguinte modelo de
regressão:
𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 +𝛽1 𝑎𝑛𝑜𝑠 +
𝛽2 𝑗𝑜𝑔𝑜𝑠𝑎𝑛𝑜𝑠 +
𝛽3 𝑟𝑒𝑏𝑚𝑒𝑑 +𝛽4 ℎ𝑟𝑢𝑛𝑎𝑛𝑜
Testes de +𝛽5 𝑟𝑒𝑏𝑟𝑢𝑛𝑎𝑛𝑜 + 𝑢 (5)
restrições lineares
múltiplas: o teste O modelo de regressão (5) é
F
conhecido como modelo irrestrito,
ou sem restrição.
 Para testar se 𝛽3 = 0, 𝛽4 = 0 e 𝛽5 = 0,
deve-se reespecificar o modelo
como:
 𝑙𝑛 𝑆𝑎𝑙 = 𝛼0 +
Testes de 𝛼1 𝑎𝑛𝑜𝑠 +𝛽2 𝑗𝑜𝑔𝑜𝑠𝑎𝑛𝑜𝑠 + 𝑒 (6)
restrições lineares
 Este é o modelo restrito.
múltiplas: o teste
F  Para testar o modelo irrestrito contra
o modelo restrito, usa-se a estatística
F especificada como:
𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 Τ𝑞
𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟Τ(𝑛−𝑘−1)
Testes de
restrições lineares Ou,
múltiplas: o teste
F 𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 𝑛−𝑘−1
𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟 𝑞
(7)
em que, 𝑆𝑄𝑅𝑟 é a soma dos
quadrados dos resíduos do modelo
restrito (modelo 6); 𝑆𝑄𝑅𝑖𝑟 é a soma
Testes de dos quadrados dos resíduos do
restrições lineares modelo irrestrito (modelo 5); 𝑛 é o
múltiplas: o teste
F número de observações; 𝑘 é o
número de regressores do modelo
irrestrito e 𝑞 é o número de
restrições impostas.
Para encontrar os valores
críticos do teste F, necessita-se
Testes de do 𝑔𝑙 do numerador, dado por
restrições lineares 𝑞 e do 𝑔𝑙 do denominador dado
múltiplas: o teste
F por 𝑛 − 𝑘 − 1 e do nível de
significância (𝛼) a 1% ou 5%.
Regra de rejeição:
 Se o Fcalc., equação (7), for
menor que os valores críticos do
Testes de teste (c), então, não se rejeita 𝐻0 ,
restrições lineares significando que 𝛽3 , 𝛽4 e 𝛽5 são,
múltiplas: o teste
F conjuntamente, estatisticamente
não significativos, ao nível de
significância estabelecido, ou
vice-versa.
De outro modo, se a hipótese 𝐻0 for
rejeitada, as variáveis 𝑟𝑒𝑏𝑚𝑒𝑑,
ℎ𝑟𝑢𝑛𝑎𝑛𝑜 e 𝑟𝑒𝑏𝑟𝑢𝑛𝑎𝑛𝑜 explicam,
conjuntamente, o salário dos
Testes de jogadores, o que não justificaria
restrições lineares
excluí-las do modelo.
múltiplas: o teste
F Ao se estimar as equações (5) e (6)
tem-se: 𝑆𝑄𝑅𝑟 = 198,311, 𝑆𝑄𝑅𝑖𝑟 =
183,186, 𝑛 = 353, 𝑘 = 5, 𝑞 = 3, e 𝛼 =
5%
 Substituindo esses valores na
estatística F [equação (7)], tem-se:
𝐹3, 347 = 9,55. O valor crítico do teste
F com 𝑔𝑙 = 3 e 347 e 𝛼 = 1% é 𝑐 =
Testes de 3,84.
restrições lineares
múltiplas: o teste  P-valor do teste 𝐹 = 0,00000447523.
F
 Assim, 𝐹 > 𝑐. Isso implica dizer que
variáveis testadas têm efeito
estatisticamente significativo sobre o
salário dos jogadores.
O gráfico a seguir apresenta
a FDP de uma dada
distribuição F, ao nível de
significância de 5%, com
Testes de 𝑔𝑙 = 2 e 60.
restrições lineares
múltiplas: o teste Note que as estatísticas da
F distribuição F são sempre
positivas.
Copyright © 2009 South-Western/Cengage Learning

100
Em vez de se ter no teste F a
SQR, pode-se usar o 𝑅2 . Das
equações (5) e (6) se obtém os
Testes de coeficientes de determinação
restrições lineares 2
múltiplas: o teste 𝑅𝑖𝑟 e 𝑅𝑟2 .
F
Veja que agora 2
𝑅𝑖𝑟> 2 então, o
𝑅𝑟 ,
teste F passa ser especificado
como:
2
𝑅𝑖𝑟 −𝑅𝑟2 ൗ𝑞
𝐹𝑞, 𝑛−𝑘−1 = 2 )Τ 𝑛−𝑘−1
(1−𝑅𝑖𝑟
(8)

O cálculo obtido com a equação


(8) é o mesmo da equação (7).
Testes de
restrições lineares Um cuidado especial com o
múltiplas: o teste teste F, com 𝑅2 é que a variável
F
dependente tem que ser a
mesma nos dois modelos, bem
como o número de
observações.
A estatística F obtida pela
tabela ANOVA permite testar
se todos os regressores,
Estatística F: conjuntamente, explicam a
Tabela ANOVA
variável dependente.
 A tabela ANOVA está
apresentada a seguir.
Estatística F:
Tabela ANOVA
Dessa forma, o teste F para a
significância global dos
regressores é dado a partir da
ANOVA, como:
Estatística F: 𝑆𝑄𝐸Τ𝑘
Tabela ANOVA 𝐹𝑘, 𝑛−𝑘−1 = 𝑆𝑄𝑅Τ 𝑛−𝑘−1
(9)
Usando 𝑅no teste F, tem-se
2

outra especificação para o teste,


como a apresentada a seguir:
𝑅 2 Τ𝑘
𝐹𝑘, 𝑛−𝑘−1 = (1−𝑅2 )Τ 𝑛−𝑘−1
(10)

Exemplo:
Estatística F: Considere o modelo de
Tabela ANOVA
regressão:
෣ = 𝛽መ0 + 𝛽መ1 𝑇𝑎𝑥𝑐𝑜𝑛𝑡 +
𝑇𝑎𝑥𝑎𝑝
𝛽መ2 𝑖𝑑𝑎𝑑𝑒 + 𝛽መ3 𝑡𝑜𝑡𝑒𝑚𝑝
 A significância geral dessa
regressão é dada ao usar a
estatística F para testar as hipóteses:
 𝐻0 :𝛽1 = 𝛽2 = 𝛽3 = 0.
 O critério de rejeição é o mesmo do
Estatística F: teste F anterior, isto é:
Tabela ANOVA
 Se 𝐹 > 𝑐, implica dizer que
variáveis do modelo de regressão
𝑇𝑎𝑥𝑐𝑜𝑛𝑡, 𝑖𝑑𝑎𝑑𝑒 𝑒 𝑡𝑜𝑡𝑒𝑚𝑝 têm efeito
conjunto sobre a variável 𝑇𝑎𝑥𝑎𝑝.
 Pode-se estar interessado em
testar diferentes valores para as
restrições. Por exemplo, considere
Teste de
restrições o modelo de determinação dos
lineares gerais preços dos imóveis.
 ln 𝑝𝑟𝑒ç𝑜 = 𝛽0 + 𝛽1 ln 𝑎𝑣𝑎𝑙 +
𝛽2 ln 𝑡𝑎𝑚𝑡𝑒𝑟𝑟eno +𝛽3 ln 𝑎𝑟𝑞𝑢𝑎𝑑 +𝛽4 ln 𝑞𝑡𝑑𝑜𝑟𝑚 +
𝑢 (11)
 Deseja-se testar se o preço do
imóvel 𝑝𝑟𝑒ç𝑜 varia na mesma
proporção da avaliação 𝑎𝑣𝑎𝑙 do
mesmo e as demais variáveis não
ajudam a explicar o 𝑝𝑟𝑒ç𝑜.
Teste de
restrições  Portanto, as hipóteses testadas:
lineares gerais  𝐻0 : 𝛽1 = 1, 𝛽2 = 0, 𝛽3 = 0 e 𝛽4 = 0
 Trata-se de um teste F de restrições:
 O modelo (11) é o irrestrito, que
gera 𝑆𝑄𝑅𝑖𝑟 .
Incorporando essas restrições
no modelo (11), tem-se:

Teste de ln 𝑝𝑟𝑒ç𝑜 = 𝛼0 + ln 𝑎𝑣𝑎𝑙 + 𝑒


restrições (12)
lineares gerais Reescrevendo o modelo (12)
para permitir estimação:
ln 𝑝𝑟𝑒ç𝑜 − ln 𝑎𝑣𝑎𝑙 = 𝛼0 + 𝑢
(13)
Ao se estimar o modelo
(13) gera-se 𝑆𝑄𝑅𝑟 .
Tendo 𝑆𝑄𝑅𝑖𝑟 e 𝑆𝑄𝑅𝑟 , se
Teste de utiliza o teste F de
restrições
lineares gerais restrições lineares trivial:
O critério de rejeição é o
mesmo do teste F.
É importante ressaltar que,
nesse último caso, a estatística
Teste de F com 𝑅 2 não pode ser usada,
restrições porque a variável dependente
lineares gerais
do modelo restrito mudou.
Os resultados podem ser
apresentados na própria
equação como:
Apresentação  𝑇𝑎𝑥𝑎𝑝
෣ = 80,29 + 5,44𝑇𝑎𝑥𝑐𝑜𝑛𝑡 + 0,269𝑖𝑑𝑎𝑑𝑒
dos resultados  𝑑𝑝 0,78 0,52 0,045
da regressão
Se há várias equações estimadas,
então, é mais elegante apresentar
os resultados num quadro, como o
apresentado a seguir:
Copyright © 2009 South-Western/Cengage Learning

114
 Utilize o arquivo twoyear para resolver as questões a
seguir.
1) Estime o modelo de regressão abaixo e identifique a
tabela ANOVA :
 ln 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑗𝑐 + 𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢.
em que, 𝑤𝑎𝑔𝑒 é o salário do indivíduo, 𝑗𝑐 é o número de
Exercícios anos frequentados em cursos profissionalizantes de dois
anos, 𝑢𝑛𝑖𝑣 é o número de anos frequentados em cursos
superiores de quatro anos e 𝑒𝑥𝑝𝑒𝑟 número de meses
trabalhados pelo indivíduo.
2) Gere o vetor de resíduos e verifique se este vetor se
aproxima de uma distribuição normal, usando a função
densidade Kernel. Qual a sua conclusão?
3) Estabeleça a hipótese nula bicaudal para cada
parâmetro e use o teste t para ver quais deles são
significativos a 5% de significância. O que se pode
concluir?
4) Use o p-valor para testar o nível de significância dos
parâmetros do modelo e descubra o nível exato de
significância do 𝛽1 .
Exercícios 5) Interprete as magnitudes de cada parâmetro estimado.
6) Faça o intervalo de confiança para 𝛽1 , com nível de
significância de 5% e interprete o resultado. Lembre-se:

 𝑃 𝛽መ1 − 𝑡𝑐 𝑑𝑝 𝛽መ1 ≤ 𝛽1 ≤ 𝛽መ1 + 𝑡𝑐 𝑑𝑝 𝛽መ1 =1−𝛼


7) Utilize o teste t para testar 𝐻0 : 𝛽1 = 𝛽2 contra 𝐻1 : 𝛽1 ≠
෡1 −𝛽
𝛽 ෡2
𝛽2 . Lembre-se: 𝑡 = 𝑑𝑝(𝛽 ෡2 ). O
෡1 −𝛽 que se pode concluir?
8) Teste, a 5% de significância, se 𝐻0 : 𝛽0 = 1, contra 𝐻1 :
𝛽0 ≠ 1. Qual a conclusão?
9) Faça o teste de significância conjunta dos
parâmetros dos regressores do modelo (teste F), ou
seja:
 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0.
10) Teste, a 5% de significância, se a variável exper
Exercícios pode ser excluída do modelo de regressão da questão
𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 𝑛−𝑘−1
1. Use a estatística: 𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟 𝑞

11) Para efeito didático, teste as seguintes hipóteses e


interprete os resultados:
 𝐻0 : 𝛽1 = 1, 𝛽2 = 0 𝑒 𝛽3 = 0
 ln 𝑤𝑎𝑔𝑒 − 𝑗𝑐 = 𝛽0 + 𝑢.
Muito obrigado!

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy