0% acharam este documento útil (0 voto)

26 visualizações118 páginas

Aula 3 - Inferência

Enviado por

felipedutraflores

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

26 visualizações118 páginas

Aula 3 - Inferência

Enviado por

felipedutraflores

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 118

Cap.

4 – Análise de Regressão
Múltipla: Inferência
Introdução à econometria: uma abordagem
moderna
Wooldridge

Prof. Clailton Ataídes de Freitas

Conhecer o valor esperado e a
variância de 𝛽መ𝑗 é útil para
determinar a precisão deste
Distribuições
Amostrais dos estimador.
Estimadores de
MQO Para a inferência estatística, a
distribuição de 𝛽መ𝑗 , a priori, pode
ser de qualquer forma.
Para tornar a distribuição de
Distribuições
𝛽መ𝑗 viável, para fazer
Amostrais dos
Estimadores de inferência, é preciso
MQO pressupor a distribuição
normal dos resíduos. Por quê?
 Veja que:
 β෠ = (X ′ X)−1 X ′ Y e : Y = Xβ + u, então:
β෠ = β + (X ′ X)−1 X ′ u

Distribuições  Como β é um vetor de parâmetros

Amostrais dos fixos e X é um vetor de variáveis
Estimadores de fixas (a parte não estocástica do
MQO
modelo), então ao cabo, β෠ passa a
ser função linear dos resíduos
aleatórios, ou da parte estocástica
do modelo.
 Dessa forma, a distribuição de
probabilidade de 𝛽መ𝑗 está em função
da distribuição de probabilidade
dos resíduos. Formalmente:
Distribuições  β෠ = β + (X ′ X)−1 X ′ 𝑓 u
Amostrais dos  Uma das propriedades da
Estimadores de distribuição normal é que se uma
MQO variável observada está em função
de uma outra com distribuição
normal, então, essa variável
observada segue, também,
distribuição normal.
 Portanto, assumindo a hipótese
da normalidade dos resíduos,
Distribuições se consegue derivar,
Amostrais dos facilmente, os estimadores de
Estimadores de
MQO. Daí a importância de se
MQO
assumir a hipótese da
normalidade dos resíduos.
Hipótese RLM.6.
O vetor de resíduos (u) é
independente das variáveis
explicativas e segue
distribuição normal com
Hipótese RLM.6 média zero e variância 𝜎 2 ,
ou:
u~Normal(0, 𝜎 2 )
RLM.6 é uma hipótese mais
forte que as anteriores,
pois, se pressupõe que u
Hipótese RLM.6 seja independente de X e
homoscedástico,
Formalmente: E u X = 0 e
Var u X = Var u = 𝜎 2 I.
 Portanto, a RLM.6 assume as
hióteses RLM.4 (média
condicional dos resíduos
zero) e a RLM.5
Hipóteses do (homoscedasticidade).
MLC  As hipóteses RLM.1 a RLM.6
formam o conjunto de
hipóteses que sustentam o
modelo linear clássico (MLC).
 Com as seis hipóteses do MLC os
estimadores 𝛽መ𝑗 contemplam a
propriedade de eficiência. Assim, os
estimadores são não viesados e
eficientes.
 Portanto, as seis hipóteses do MLC são
Hipóteses do mais forte do que sob as hipóteses de
MLC Gauss-Markov (RLM.1 a RLM.5).
 Pode se mostrar que os estimadores 𝛽መ𝑗
tem a menor variância entre os
estimadores não viesados. A prova está
a seguir, usando o Greene.
 Considere o modelo de regressão em
notação matricial múltipla:
 Y = Xβ + u (1)
 Sabe-se que: Var β෠ = 𝜎ො 2 I X ′ X −1
e que
 β෠ = (X ′ X)−1 X ′ Y.
Hipóteses do MLC
 Admita que 𝑏𝑗 seja um outro estimador
linear não viesado dado por:
 b = GY (2)
em que, G = X ′ X −1
X′
 G′ =X X ′ X −1
 Substituindo a equação (1) na equação (2):
 b = G(Xβ + u) (2.1)
 b = GXβ + u
 Como GX = I, tem-se:
Variância  b − β = Gu (2.2)
mínima do
 Então, por definição:
estimador 𝛽መ𝑗
 Var b X = E b − β b − β ′
(2.3)
 Var b X = E Gu Gu ′

 Var b X = E Guu′ G′
 Var b X = GE(uu′ )G′
 Com as hipóteses RLM.4 e RLM.5,
E(uu′ ) = 𝜎ො 2 I
 Assim,
 Var b X = 𝜎ො 2 IGG′ (3)
 Agora, admita a existência de uma
matriz de zeros, D, dada por:
 D = G − X′X −1
X′ (4)
 Pode-se reescrever a equação (4)
como:
 G = D + X′X −1
X′ (5)
 Ao substituir a equação (5) na equação (3):
 Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D +
X′X −1
X′)′ (6)
 Transpondo o último termo da equação (6):
 Var b X = 𝜎Ƹ 2 I(D + X ′ X −1 ′
X )(D′ +
Variância X X′X −1
)
mínima do
 Var b X = 𝜎Ƹ 2 I(DD′ + DX X ′ X
estimador 𝛽መ𝑗
−1
+
=0
X′X −1 ′ ′
X D + X′X −1 ′
X 𝑋 X′X −1
)
=0 =I

 Var b X = 𝜎Ƹ 2 I(DD′ + X ′ X −1
)
 Var b X = 𝜎ො 2 IDD′ + 𝜎ො 2 I X ′ X −1

Var β

 Var b X = 𝜎ො 2 DD′ + Var β෠

 O termo DD′ é uma forma quadrática, sendo uma

matriz definida não negativa.
 Uma matriz é definida não negativa se o seu
Variância determinante é maior ou igual a zero, ou seja, DD′ ≥
mínima do 0.

estimador 𝛽መ𝑗  Assim, Var b X = Var(β෠) + 𝜎Ƹ 2 IDD′

𝑇𝑒𝑟𝑚𝑜 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜

 Portanto, a Var β෠ , por MQO, tem variância menor do

que qualquer outro estimador, como por exemplo, o
estimador de variável instrumental.
 Var b X > Var β෠ CQD.
 Em notação escalar para um modelo de regressão
simples:
σ 𝑥𝑖 𝑦𝑖 𝑥
 O estimador de MQO é: 𝛽መ = σ 𝑥𝑖2
, definindo 𝑘𝑖 = σ 𝑥𝑖 2,
𝑖
1
então: 𝛽መ = σ 𝑘𝑖 𝑦𝑖 e a V𝑎𝑟 𝛽መ = 𝜎Ƹ 2 σ 𝑥 2
𝑖

 Definindo alternativamente um outro estimador de 𝛽

Variância como: 𝑏 = σ 𝑤𝑖 𝑦𝑖 e o modelo de regressão por desvio
mínima do de média:

estimador 𝛽መ𝑗  𝑦𝑖 = 𝛽𝑥𝑖 +𝑢𝑖

 Então, b = σ 𝑤𝑖 𝛽𝑥𝑖 +𝑢𝑖
 b = 𝛽 σ 𝑤𝑖 𝑥𝑖 + σ 𝑤𝑖 𝑢𝑖
 b = 𝛽 + σ 𝑤𝑖 𝑢𝑖
𝑥𝑖
 em que, se admite que 𝑤𝑖 = σ 𝑥𝑖2
 Sabendo que b − 𝛽 = σ 𝑤𝑖 𝑢𝑖
 Então, Var b|𝑥 = E b − 𝛽 2

 Var b|𝑥 = E σ 𝑤𝑖 𝑢𝑖 2

 Var b|𝑥 = E 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯ 𝑤1 𝑢1 + 𝑤2 𝑢2 + ⋯
 Var b|𝑥 = E 𝑤12 𝑢12 + 𝑤1 𝑤2 𝑢1 𝑢2 + 𝑤22 𝑢22 + ⋯
 Var b|𝑥 = 𝑤12 𝐸(𝑢12 ) + 𝑤1 𝑤2 𝐸(𝑢1 𝑢2 ) + 𝑤22 𝐸(𝑢22 +) ⋯
Variância
 Como: 𝐸(𝑢𝑖 𝑢𝑗 ) = 0, com 𝑖 ≠ 𝑗 e 𝐸(𝑢ො 𝑖2 ) = 𝜎ො 2
mínima do  Var b|𝑥 = 𝜎ො 2 𝑤12 + 𝑤22 + ⋯
estimador 𝛽መ𝑗  Var b|𝑥 = 𝜎ො 2 σ 𝑤𝑖2
 Agora, usando um artifício matemático de somar e
𝑥𝑖
subtrair σ dessa equação:
𝑥𝑖2
𝑥 𝑥
 = 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖 2 + σ 𝑥𝑖 2 )2, resolvendo o produto notável e
𝑖 𝑖
simplificando esta equação:
𝑥𝑖 2 σ 𝑥𝑖2 𝑥𝑖 𝑥𝑖
= 𝜎Ƹ 2 σ(𝑤𝑖 − σ 𝑥𝑖2
) + 𝜎Ƹ 2
(σ 𝑥𝑖2 )2
+ 2𝜎Ƹ 2 𝑤𝑖 − σ 𝑥𝑖2 σ 𝑥𝑖2

𝑥
 Perceba, dado 𝑤𝑖 = σ 𝑥𝑖 2, que o último termo da
𝑖
equação acima soma zero, então:

Variância  𝑉𝑎𝑟 b = 𝜎ො 2 σ(𝑤𝑖 −

𝑥𝑖 2
σ 𝑥𝑖2
) + 𝜎ො 2
σ 𝑥𝑖2
(σ 𝑥𝑖2 )2
, simplificando:
mínima do 𝑥 1
 𝑉𝑎𝑟 b = 𝜎ො 2 σ(𝑤𝑖 − σ 𝑥𝑖 2 )2 + 𝜎ො 2 σ 𝑥 2
estimador 𝛽መ𝑗 𝑖 𝑖

 O último termo da equação é a acima é V𝑎𝑟 𝛽መ , já o

primeiro termo desse equação será sempre maior ou
igual a zero, porque está elevado ao quadrado, então:

 𝑉𝑎𝑟 b > V𝑎𝑟 𝛽መ , CQD.

A maneira mais formal de
resumir as hipóteses MRLC é:
Hipóteses MLC Y|X~N(𝛽0 + 𝛽1 𝑋1 + ⋯ +
e o TLC 2
𝛽𝑘 𝑋𝑘 , 𝜎𝑌|𝑋 ). Isso significa que ao
condicionar Y a X, se tem médias
lineares dos parâmetros em
𝑋1 , ⋯ , 𝑋𝑘 e variância constante.
Hipóteses MLC
e o TLC
Se sabe que o resíduo 𝑢 é
formado por um grande
número de variáveis, então,
Hipóteses MLC pode-se invocar o Teorema
e o TLC do Limite Central (TLC)
para justificar a
distribuição normal dos
resíduos.
 Exemplificando como o vetor de resíduos é formado
por um grande número de variáveis. Considere, por
exemplo, a função consumo keynesiana mais simples
(𝐶) dada por: 𝐶𝑖 = 𝛽0 + 𝛽1 𝑅𝑒𝑛𝑑𝑎1 + 𝑢𝑖 .
 Logicamente, que não é somente a renda que explica
o consumo, outras variáveis (a riqueza, a idade, o
nível educacional, a religião, o gênero, os fatores
Hipóteses MLC étnicos...) podem, também, exercer essa função.
Contudo, estatisticamente, vamos considerar que
e o TLC essas variáveis não foram significativas a níveis
baixos de significância (10%, 5% ou 1%). Por isso,
elas foram desconsideradas do modelo, mas isso não
significa que tais variáveis não exerçam qualquer
tipo de influência sobre o consumo, mas sim que a
influência conjunta dessas variáveis é pequena, ou
residual.
 Isso justifica a exclusão dessas
variáveis, para se ter uma relação
mais parcimoniosa no modelo.
 Portanto, o resíduo é formado, na
prática, por um grande número de
Hipóteses MLC variáveis que foram ignoradas no
e o TLC modelo, como no presente caso:

𝐺ê𝑛𝑒𝑟𝑜
𝐼𝑑𝑎𝑑𝑒
 𝐶𝑖 = 𝛽0 + 𝛽1 𝑅𝑒𝑛𝑑𝑎1 + 𝑢𝑖
𝐸𝑑𝑢𝑐𝑎çã𝑜
⋮
 Portanto, se há um grande número de variáveis
independentes, compondo o resíduo, todas
com a mesma função densidade de
probabilidade, com média 𝜇 e variância
constante (𝜎 2), então, segundo o TLC, a
distribuição da soma dessas variáveis (aqui
representada por σ Xi ) equivale ao resíduo.
Hipóteses MLC Então, a distribuição desse resíduo tende a
e o TLC uma normal. Essa é a definição mais objetiva
do TLC, ou seja:
 σ𝑛𝑖=1 X𝑖 = u𝑖 ~𝑁(0, 𝜎 2 )
em que, média de u𝑖 é: 𝐸(u𝑖 ) = 0 e a variância
de u𝑖 : 𝐸 𝑢𝑖2 = 𝜎 2
 Uma variante do TLC estabelece que,
mesmo que esse número de variáveis não
seja tão grande, ainda sim, a soma dessas
variáveis tende a uma distribuição normal.
 O problema do TLC é a pressuposição de
Hipóteses MLC que as variáveis aleatórias de u𝑖 afetam Y
de forma isolada e aditiva.
e o TLC
 Na prática, é sustentado que as variáveis
que compõe 𝑢 sejam independentes entre
si, o que não é fácil de se encontrar nos
problemas econômicos, em muitos casos.
 Daí a justificativa de se testar se 𝑢
segue distribuição normal.
 Uma das formas de se encontrar
Hipóteses MLC resíduos com distribuição normal é
e o TLC fazer transformações logarítmicas das
variáveis do modelo. Isso tende gerar
distribuições mais próximas da
normal.
 Lembre-se, nesse caso, tem-se
distribuição log-normal, como
retratado na figura a seguir.
Hipóteses MLC  Importante: a não normalidade
e o TLC
não é um problema sério com
amostras assintóticas, conforme
será discutido no Capítulo 5.
Distribuição log-
normal

http://www.portalaction.com.br/probabilidades/615-
distribuicao-log-normal
Teorema 4.1: sob as hipóteses do
MRLC, RLM.1 a RLM.6, o
Distribuição parâmetro 𝛽መ𝑗 segue distribuição
amostrais dos normal com média 𝛽𝑗 e 𝑉𝑎𝑟(𝛽𝑗 ),
estimadores 𝛽መ𝑗 formalmente:
 𝛽መ𝑗 ~𝑁𝑜𝑟𝑚𝑎𝑙[𝛽𝑗 , Var(𝛽𝑗 )]
 Uma distribuição normal é
construída usando somente dois
parâmetros a média e a variância.

Distribuição  Foi visto que a média de 𝛽መ𝑗 é dada

amostrais dos por: 𝐸(𝛽መ𝑗 ) = 𝛽𝑗 , estimador não
estimadores 𝛽መ𝑗 viesado.
 A variância de 𝛽መ𝑗 é mínima:
 Var 𝛽መ𝑗 = 𝜎 2 X ′ X −1
෡𝑗 −𝛽𝑗 )
(𝛽
Ao padronizar 𝛽መ𝑗 , tem-se: 𝑑𝑝(𝛽෡ ) .
𝑗

Então:
Distribuições ෡𝑗 −𝛽𝑗 )
(𝛽
amostrais  ෡
𝑑𝑝(𝛽𝑗 )
~𝑁𝑃(0,1)
normais
em que, 𝑁𝑃 é uma normal
padrão. Sempre uma NP terá
média 0 e variância 1.
Veja que a fórmula da Var 𝛽መ𝑗 tem
𝜎 2 , que é desconhecido. Devido a
Teste de
dificuldade e até a impossibilidade
hipótese: teste
t. de se trabalhar com 𝜎 2 , usa-se 𝜎ො 2
como estimativas. Assim, o Teorema
4.1 se transforma no Teorema 4.2.
 Teorema 4.2: sob as hipóteses do RLM.1
a RLM.6 a distribuição dos estimadores
padronizados segue distribuição t:
෡𝑗 −𝛽𝑗 )
(𝛽
 𝑑𝑝(𝛽෡ ) ~𝑡𝛽෡𝑗 , com g𝑙 = 𝑛 − 𝑘 − 1 e
𝑗

Teste de 𝑑𝑝 𝛽መ𝑗 = 𝑉𝑎𝑟 𝛽መ𝑗

hipótese: teste
t. em que, 𝑉𝑎𝑟 𝛽መ𝑗 = 𝜎ො 2 X ′ X −1

 Cabe ressaltar, que a média, mediana e

moda da distribuição 𝑡 é zero e a
medida que 𝑔𝑙 aumenta 𝑔𝑙 > 30 a
distribuição t vai convergindo para
uma normal.
 A distribuição da razão entre
a variância estimada dos
resíduos da amostra (𝜎ො 2 ) e a
variância dos resíduos da
população 𝜎 2 segue uma qui-
quadrada, com 𝑔𝑙 = 𝑛 − 𝑘 − 1:
Distribuição qui
ෝ2
𝜎
quadrada  𝑛−𝑘−1 𝜎 2 ~𝜒 2
𝑛−𝑘−1 .
 A figura a seguir retrata uma
distribuição qui-quadrada
genérica.
Distribuição qui
quadrada

Fonte: http://professorguru.com.br/estatistica/inferencia-estatistica/intervalos-de-
confianca.html
O Teorema 4.2 permite testar
hipóteses relacionadas ao 𝛽መ𝑗 .
Teste de
hipótese Na prática, o interesse é testar
a hipótese nula 𝐻0 : 𝛽𝑗 = 0.
 Se, por exemplo, no modelo de regressão:
 𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋1𝑖 + 𝛽መ2 𝑋2𝑖 + 𝑢ො 𝑖 ,
 𝑋1 não tiver efeito parcial sobre Y, então, ao realizar o teste de
hipótese, 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0, não se rejeita a hipótese
nula.
 Assim, usa-se a estatística 𝑡 para testar se uma variável 𝑋𝑗
explica, parcialmente, 𝑌. Se ela não explica, 𝛽𝑗 = 0. Esse
Teste de diagnóstico é feito usando a estatística 𝑡 definida como:

hipótese  𝑡𝛽෡𝑗 =
෡𝑗 −0
𝛽
𝑑𝑝(𝛽෡𝑗 )

 Essa estatística é a 𝑡 calculada, que deve ser comparada com a

estatística 𝑡 crítica (tabela t).
 Critério de decisão: se 𝑡𝛽෡𝑗 > 𝑐, rejeita-se 𝐻0 , o que implica que
𝛽መ1 é estatisticamente significativo, ou que 𝑋1𝑖 explica 𝑌𝑖 , ou
vice-versa.
Na prática, 𝛽𝑗 nunca será
exatamente zero, pois, ele é
Teste de considerado zero a um
hipótese determinado nível baixo de
signficância (𝛼), como 1%, 5% e
10%.
 Por exemplo:
 Se, 𝑛 = 33, 𝑘 = 2, 𝛽መ1 = 0,36 e
𝑑𝑝(𝛽መ1 ) = 0,38, então: 𝑡𝛽෡1 = 0,94 e
𝑔𝑙 = 𝑛 − 𝑘 − 1 = 30
 em que, 𝑘 é o número de
Teste de regressores.
hipótese
 Os valores críticos (𝑐) do teste 𝑡 são:
a 5% de significância (2,04), a
10%(1,697); a 20%(1,31); a
30%(1,05) e a 40%(0,85).
 Assim, por exemplo, a 5% de
significância e 𝑔𝑙 = 30, o valor crítico do
𝑡 é 𝑐 = 2,04; como o valor calculado do
teste 𝑡 foi de 𝑡𝛽෡1 = 0,94, então, 𝑡𝛽෡1 <
Teste de 𝑐. Portanto, a esse nível de significância
hipótese 𝛽1 = 0, ou seja, não se rejeita a hipótese
nula (𝐻0 ). Isso implica que 𝑋1 não tem
efeito estatisticamente significativo sobre
𝑌.
 No entanto, se o nível de significância for
aumentando, vai se chegar em alguma
estimativa em que vai se rejeitar 𝐻0 . Esse é
Teste de o caso em que o nível de significância for
hipótese de 40% (𝛼 = 0,40). Nesse nível, 𝑡𝛽෡1 > 𝑐,
então, 𝐻0 é rejeitada e 𝑋1 passa a explicar
𝑌. No entanto, trata-se de um nível muito
alto de significância.
 Em estudos empíricos, é aceitável
um nível máximo de 10%, para
amostras moderadas. Para amostras
assintóticas, com centenas ou
milhares de observações, não se
deve abrir mão de um nível de 5%
de significância.
Enfim, valor de 𝑡𝛽෡𝑗 mais distante
de zero aponta para a rejeição
de 𝐻0 .
O sinal do teste t.
Teste de Como 𝑑𝑝(𝛽መ𝑗 ) é o segundo
hipótese
momento da distribuição, então,
𝑑𝑝(𝛽መ𝑗 ) > 0. Assim, o sinal de 𝑡෡
𝛽𝑗

vai depender de 𝛽መ𝑗 .

O teste de hipótese é feito
sobre parâmetros
populacionais. Isso significa
que não faz sentido testar
parâmetros estimados, ou seja,
Teste de 𝐻0 : 𝛽መ𝑗 = 0.
hipótese
Por exemplo, se a estimativa
de 𝛽መ𝑗 = 1,3. Imagine o
absurdo testar:
 𝐻0 : 1,3 = 0.
Hipótese alternativa unilateral:
Considere a hipótese
alternativa como: 𝐻1 : 𝛽1 > 0.

Teste de Quando se estabelece 𝐻1 dessa

hipótese maneira, se admite que a
hipótese nula 𝐻0 : 𝛽1 ≤ 0.
Como definir uma regra de
rejeição ou não de 𝐻0 ?
Primeiro, se decide por algum
nível de significância baixo, 1%
ou 5% ou 10%.
Esse nível de significância é a
probabilidade exata de se
Teste de
hipótese cometer o Erro Tipo 1, que é
rejeitar 𝑯𝟎 quando ela é
verdadeira.
Erro Tipo 2 é não rejeitar 𝑯𝟎
quando ela é falsa.
Portanto,
Regra de rejeição da hipótese:
Teste de
hipótese Se 𝑡𝛽෡𝑗 > 𝑐, rejeita-se 𝐻0 . Isso
aponta para 𝛽𝑗 > 0,
 Exemplificando o teste de hipótese
bicaudal, ou bilateral
 Exemplo 1. Considere a reta de
regressão ajustada:
 𝑌෠ = 𝛽መ0 + 17,41𝑋1 + 3,5𝑋2
Teste de  𝑑𝑝 5,3 2,9 , com 𝑛 = 28
hipótese
 Hipóteses:
 𝐻0 : 𝛽1 = 0 contra 𝐻1 : 𝛽1 ≠ 0 e
 𝐻0 : 𝛽2 = 0 contra 𝐻1 : 𝛽2 ≠ 0
Então, 𝑡𝛽෡1 = 3,28 e 𝑡𝛽෡2 = 1,21 e
𝑔𝑙 = 28 − 2 − 1 = 25
Teste de O valor crítico (𝑐) do teste t
hipótese
bicaudal com 𝑔𝑙 = 25, ao nível de
significância de 5%, é de 𝑐 =
2,06 e a 1%, 𝑐 = 2,79.
Analisando 𝛽1 :
Como 𝑡𝛽෡1 = 3,28 > 𝑐 = 2,79, então,
se rejeita 𝐻0 , indicando que o
parâmetro 𝛽መ1 é estatisticamente
Interpretando o
significativo a 1% de
teste t.
significância.
Assim, 𝑋1 tem efeito parcial
estatisticamente significativo
sobre 𝑌.
 Com relação ao 𝛽2 :
 Como 𝑡𝛽෡2 = 1,21 < 𝑐 = 2,06, então, não
se rejeita 𝐻0 , indicando que o
parâmetro 𝛽መ2 não é estatisticamente
Interpretando o significativo a 5% de significância.
teste t.
 Assim, 𝑋2 não tem efeito parcial
estatisticamente significativo sobre 𝑌 a
5% de significância. Será que 𝛽መ2 seria
significativo a 10%?
Veja que utilizando a
distribuição 𝑡 pode-se definir
a região de rejeição e a de
não rejeição de 𝐻0 .
Teste de Como é um teste bicaudal, a
hipótese
bicaudal 5%, então se tem 0,025% de
significância para cada cauda
da distribuição 𝑡, como retrata
a figura a seguir.
Copyright © 2009 South-Western/Cengage Learning
Figura da Distribuição t.

53
Veja nessa figura que, 𝑡𝛽෡1 = 3,28,
cai na região de rejeição 𝐻0 , ao
Teste de passo que e 𝑡𝛽෡2 = 1,21 está na
hipótese
bicaudal região de não rejeição dessa
hipótese.
Exemplo 2. Utilizar os dados da
regressão anterior, mas fazer o
teste monocaudal a 5%, ou seja:
Teste de
hipótese Testar as hipóteses:
monocaudal
𝐻1 : 𝛽1 > 0 𝐻1 : 𝛽2 > 0
ቊ eቊ
𝐻0 : 𝛽1 ≤ 0 𝐻0 : 𝛽2 ≤ 0
𝑡𝛽෡1 = 3,28 e 𝑡𝛽෡2 = 1,21 e 𝑔𝑙 = 25
O valor crítico (c) do teste t
monocaudal, com 𝑔𝑙 = 25 e
𝛼 = 5%, é 𝑐 = 1,701.
Teste de Note:
hipótese
monocaudal Para 𝛽1 , não se rejeita 𝐻1 , logo 𝛽መ1
é positivo e estatisticamente
significativo a 5% de
significância.
Para 𝛽2 , não se rejeita 𝐻0 , ou se
rejeita 𝐻1 , logo 𝛽መ2 não é
estatisticamente significativo a
5% de significância.
Teste de Veja, pelo gráfico da distribuição
hipótese t
𝑡, a seguir, que 𝑡𝛽෡1 = 3,28 está na
região de rejeição da hipótese
nula e 𝑡𝛽෡2 cai na região de não
rejeição dessa hipótese.
Figura da. Distribuição t

Teste de
hipótese t
Exemplo 3. Considere que 𝑡𝛽෡1 =
− 1,878 e 𝑔𝑙 = 18 e se deseja
testar a hipótese alternativa:
Teste de 𝐻1 : 𝛽1 < 0, o que implica em
hipótese t 𝐻0 : 𝛽1 ≥ 0.
Para o nível de significância de
5%, 𝑔𝑙 = 18 e o teste 𝑡
unicaudal, o valor crítico do
teste é 𝑐 = −1,734.
 Assim, como o 𝑡𝛽෡1 = −1,878 é
menor, ou em modulo maior,
do que o valor crítico 𝑐 =
− 1,734, não se rejeita 𝐻1 , logo
Teste de o parâmetro 𝛽1 é
hipótese t estatisticamente significativo
e negativo.
 Na distribuição 𝑡 seguinte
está retratado este exemplo.
Copyright © 2009 South-Western/Cengage Learning

Figura 3. Distribuição t

61
Pode se estar interessado em
testar se 𝛽መ𝑗 é igual a uma
constante específica, como 1, −1
ou outro valor qualquer.
Teste de
hipótese t  Neste caso, a hipótese unilateral
seria estabelecida como:
𝐻1 : 𝛽1 = 1
ቊ e,
𝐻0 : 𝛽1 > 1
A hipótese bilateral:

𝐻0 : 𝛽1 = 1
ቊ
𝐻1 : 𝛽1 ≠ 1
Em ambos casos, a estatística 𝑡
Teste de
hipótese t apropriada é dada por:
෡1 −𝛽1
𝛽 ෡1 −1
𝛽
 𝑡𝛽෡1 = 𝑑𝑝(𝛽෡1 ) = 𝑡𝛽෡1 = ෡
𝑑𝑝(𝛽1 )
, já
que se busca testar 𝛽1 = 1.
Exemplo 4.4:
Considere a relação entre o
número de crimes nos campi e o
número de alunos matriculados
Teste de
hipótese nas universidades dos EUA.
A reta de regressão estimada é:
෣ = −6,63 + 1,27𝑙𝑛𝑀𝑎𝑡𝑟𝑖
𝑙𝑛𝐶𝑟𝑖𝑚𝑒
𝑑𝑝 1,03 0,11 ; 𝑛 = 95
Deseja-se testar se os crimes
nos campi aumentaram,
proporcionalmente, mais que os
universitários. Portanto, o foco é
a hipótese alternativa.
Teste de
hipótese As hipóteses testadas são:
𝐻1 : 𝛽1 > 1
ቊ , então:
𝐻0 : 𝛽1 ≤ 1
1,27−1
 𝑡𝛽෡1 = 0,11
= 2,45
 Valor crítico unicaudal, com 5% de
significância e 𝑔𝑙 = 93, é 𝑐 = 1,66.
 Como 𝑡𝛽෡1 = 2,45 > 𝑐 = 1,66, não se rejeita
Teste de 𝐻1 .
hipótese  Isso significa que os homicídios nos campi
aumentaram, proporcionalmente, mais que
o número de matrículas nas universidades
americanas.
O gráfico a seguir relaciona o
Teste de crime com a matrícula
hipótese estimada para possíveis
valores de 𝛽1 .
Copyright © 2009 South-Western/Cengage Learning

68
O p-valor
Dado a estatística 𝑡 calculada
(𝑡𝛽෡𝑗 ), qual é o menor nível de
Cálculos dos p-
valores do teste significância em que se rejeita
t hipótese nula (𝐻0 )? Ou, qual é a
probabilidade exata de se
cometer o Erro Tipo 1.
Por exemplo, admita testar:
𝐻0 : 𝛽1 = 0
ቊ
𝐻1 : 𝛽1 ≠ 0
Considerando a estatística
O p-valor 𝑡 calculada (𝑡𝛽෡1 = 1,85); com
𝑔𝑙 = 𝑛 − 𝑘 − 1 = 40 e 𝛼 = 5%,
então, 𝑐 = 2,021, com teste
bicaudal. Assim, 𝐻0 não seria
rejeitada, pois, 𝑡𝛽෡1 < 𝑐.
 Contudo a 10%, 𝑐 = 1,684, levaria a
rejeição dessa hipótese.
 Portanto, sabe-se que menor nível
de significância para 𝐻0 ser
rejeitada (p-valor) é maior que 5%
O p-valor e menor que 10%, mas qual o p-
valor real?
 O gráfico a seguir ajuda a
entender como se chega a esse
valor.
Copyright © 2009 South-Western/Cengage Learning

72
O p-valor é uma probabilidade,
portanto, vai sempre estar entre 0
e 1.
Para se chegar ao p-valor, é
O p-valor necessário programas de
computador para calcular as
áreas da região de rejeição da
função densidade de
probabilidade da distribuição 𝑡.
 No gráfico anterior, a área de rejeição
é dada por:
 p-valor = 2 ∗ 0,0359 = 0,0718.
Assim, a probabilidade exata para se
rejeitar 𝐻0 : 𝛽1 = 0 é de 7,18%.
 Usando o Gretl: os parâmetros para o
O p-valor cálculo do p-valor são os 𝑔𝑙 e o valor
do teste 𝑡. Para 𝑔𝑙 = 40 e 𝑡𝛽෡1 = 1,85,
𝑝𝑣𝑎𝑙𝑜𝑟 = 0,0717107.
 Portanto, quanto menor o p-valor,
menor a probabilidade de se
cometer o Erro Tipo 1.
Qual é a diferença entre aceitar
e não rejeitar 𝐻0 ?
Admita que uma dada
elasticidade seja: 𝛽መ1 = 1,2, 𝑑𝑝 =
Diferença entre 1,07 e 𝑔𝑙 = 30, então 𝑐 = 2,042
aceitar e não
rejeitar 𝐻0. Se o desejo for testar:
𝐻0 : 𝛽1 = 1
ቊ
𝐻1 : 𝛽1 ≠ 1
1,12−1
𝑡𝛽෡1 = 1,07
= 0,11
 Nesse caso, a 5% de significância,
não se rejeita 𝐻0
 Porém, pode-se atribuir infinitos
valores ao 𝛽1 , como 𝛽1 = 0,9, o que
implica testar:
Diferença entre
aceitar e não 𝐻0 : 𝛽1 = 0,9
rejeitar 𝐻0. ቊ
𝐻1 : 𝛽1 ≠ 0,9
 que, também, leva a não rejeição de
𝐻0 , já que:
1,12−0,9
 𝑡𝛽෡𝑗 = 1,07
= 0,206.
Portanto, as hipóteses 𝛽1 = 1 e
𝛽1 = 0,9 não podem ser
ambas verdadeiras, de modo
Diferença entre que não faz sentido aceitar
aceitar e não uma delas. Por isso, o correto é
rejeitar 𝐻0.
dizer que não se rejeita a
hipótese nula e nunca se
aceita a hipótese nula.
Significância estatística é
determinada pelo tamanho de 𝑡𝛽෡𝑗 ,
enquanto significância econômica
Significância
econômica e está relacionada à magnitude e ao
significância sinal de 𝛽መ𝑗 .
estatística
Pode acontecer de um parâmetro
ter significância estatística, mas
não ter significância econômica.
 Veja o exemplo 4.6, cuja regressão
estimada é:
 𝑇𝑎𝑥𝑎𝑝
෣ = 80,29 + 5,4𝑇𝑎𝑥𝑐𝑜𝑛𝑡 + 0,27𝑖𝑑𝑎𝑑𝑒 + 0,00013𝑡𝑜𝑡𝑒𝑚𝑝

 𝑑𝑝 0,78 0,52 0,045 (0,00004)

Significância em que, 𝑇𝑎𝑥𝑎𝑝 é a taxa de
econômica e
significância participação dos funcionários em
estatística plano de aposentadoria, 𝑇𝑎𝑥𝑐𝑜𝑛𝑡 é
a taxa de contribuição e 𝑡𝑜𝑡𝑒𝑚𝑝 é
o total de empregado da empresa.
 Note que o parâmetro relacionado ao
𝑡𝑜𝑡𝑒𝑚𝑝 é estatisticamente significativo
(𝑡𝑇𝑜𝑡𝑒𝑚𝑝 = 3,25) a 1% de significância.
 Contudo, veja que 0,00013 não tem
Significância significância econômica, já que uma firma
econômica e precisaria aumentar o número de
significância funcionários em 10.000, para se ter um
estatística aumento em 1,3%, na 𝑇𝑎𝑥𝑎𝑝, já que 10.000 ∗
0,00013 = 1,3%.
 Antes de se interpretar os resultados de
uma regressão, é preciso perceber se há
sentido econômico nas estimativas obtidas.
Sob as hipóteses do MLC, pode-
se construir IC para o parâmetro
populacional 𝛽𝑗 , como:

 𝑃 ቀ𝛽መ𝑗 − 𝑡𝑐 𝑑𝑝 𝛽መ𝑗 ≤ 𝛽𝑗 ≤ 𝛽መ𝑗 +

Intervalos de
confiança (IC)
Admita que 𝛽መ1 = 1,084, 𝑑𝑝(𝛽መ1 ) =
0,06,com 𝛼 = 5% e g𝑙 = 30.
Construa o intervalo para 𝛽1 .
Intervalos de Consultando a tabela da
confiança (IC) distribuição 𝑡, o valor crítico com
𝛼 = 5% e g𝑙 = 30 é de 𝑡𝑐 = 2,042.
Assim: [1,084 − 2,042 0,06 ≤ 𝛽1 ≤
1,084 + 2,042 0,06 ] = 95%
 0,961 ≤ 𝛽1 ≤ 1,21 = 95%
 Interpretando:
 Não é correto afirmar que a
probabilidade de 𝛽1 estar entre
Intervalo de 0,961: 1,21 é de 95%, pois, o IC
confiança calculado já não é mais
probabilístico.
 O correto é dizer que a cada 100
intervalos amostrados, em 95 deles,
o 𝛽1 vai estar entre 0,961 e 1,21.
Considere a possibilidade de se
testar se 𝛽1 = 𝛽2 , ou se 𝛽1 + 𝛽2 = 1,
ou qualquer outra combinação
Teste de Hipótese: linear.
combinação
linear de Por exemplo, deseja-se testar se
parâmetros 𝛽1 = 𝛽2 , então, as hipóteses
𝐻0 : 𝛽1 = 𝛽2
estabelecidas são: ቊ
𝐻1 : 𝛽1 < 𝛽2
 Ou,
𝐻0 : 𝛽1 − 𝛽2 = 0
ቊ
𝐻1 : 𝛽1 − 𝛽2 < 0
 O teste t apropriado, para esse caso, é
෡1 −𝛽
𝛽 ෡2
Teste de Hipótese: dado por: 𝑡 = 𝑑𝑝(𝛽෡1 −𝛽
෡2 )
combinação
linear de  em que, 𝑑𝑝 𝛽መ1 − 𝛽መ2 = 𝑉𝑎𝑟(𝛽መ1 − 𝛽መ2 )
parâmetros
 𝑉𝑎𝑟 𝛽መ1 − 𝛽መ2 = 𝑉𝑎𝑟 𝛽መ1 + 𝑉𝑎𝑟(𝛽መ2 )
− 2Cov(𝛽መ1 , 𝛽መ2 )
 A regra de rejeição é a mesma dos
testes anteriores.
Alternativamente, pode-se testar
𝛽1 = 𝛽2 fazendo: 𝜃1 = 𝛽1 − 𝛽2 .
Teste de Hipótese: Ao isolar 𝛽1 , tem-se: 𝛽1 = 𝜃1 + 𝛽2 .
combinação
linear de O teste de hipótese desejado é:
parâmetros
𝐻1 : 𝜃1 < 0
ቊ
𝐻0 : 𝜃1 = 0
 Para exemplificar, considere o modelo
de regressão:
 ln 𝑆𝑎𝑙 = 𝛽0 + 𝛽1 𝑐𝑝 + 𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 +
𝑢 (1)

Teste de Hipótese: em que, 𝑐𝑝 e 𝑢𝑛𝑖𝑣 são, respectivamente, o

combinação nº de anos em curso técnico e superior.
linear de Assim, deseja se testar se os cursos
parâmetros superiores e técnicos resultam no mesmo
salário, ou seja, se 𝛽1 = 𝛽2 , então, as
𝐻1 : 𝛽1 < 𝛽2
hipóteses estabelecidas são: ቊ
𝐻0 : 𝛽1 = 𝛽2
 Substituindo 𝛽1 = 𝜃1 + 𝛽2 na equação
(1):
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + (𝜃1 + 𝛽2 )𝑐𝑝 +
𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (2)
Teste de Hipótese:  Aplicando a distributiva na eq. (2):
combinação
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + 𝜃1 𝑐𝑝 +𝛽2 𝑐𝑝 +
linear de
𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (3)
parâmetros
 Colocando 𝛽2 em evidência na equação
(3):
 𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 + 𝜃1 𝑐𝑝 +𝛽2 (𝑐𝑝 +
𝑢𝑛𝑖𝑣) +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢 (4)
Agora, é só estimar a regressão
Testes de (4) e testar a significância do
restrições lineares
múltiplas: o teste parâmetro 𝜃1 , usando o teste 𝑡
F trivial.
Admita, que se deseje
testar várias restrições,
Testes de como:
restrições lineares
múltiplas: o teste  𝐻0 : 𝛽3 = 0, 𝛽4 = 0, 𝛽5 = 0,
F
no seguinte modelo de
regressão:
𝑙𝑛 𝑆𝑎𝑙 = 𝛽0 +𝛽1 𝑎𝑛𝑜𝑠 +
𝛽2 𝑗𝑜𝑔𝑜𝑠𝑎𝑛𝑜𝑠 +
𝛽3 𝑟𝑒𝑏𝑚𝑒𝑑 +𝛽4 ℎ𝑟𝑢𝑛𝑎𝑛𝑜
Testes de +𝛽5 𝑟𝑒𝑏𝑟𝑢𝑛𝑎𝑛𝑜 + 𝑢 (5)
restrições lineares
múltiplas: o teste O modelo de regressão (5) é
F
conhecido como modelo irrestrito,
ou sem restrição.
 Para testar se 𝛽3 = 0, 𝛽4 = 0 e 𝛽5 = 0,
deve-se reespecificar o modelo
como:
 𝑙𝑛 𝑆𝑎𝑙 = 𝛼0 +
Testes de 𝛼1 𝑎𝑛𝑜𝑠 +𝛽2 𝑗𝑜𝑔𝑜𝑠𝑎𝑛𝑜𝑠 + 𝑒 (6)
restrições lineares
 Este é o modelo restrito.
múltiplas: o teste
F  Para testar o modelo irrestrito contra
o modelo restrito, usa-se a estatística
F especificada como:
𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 Τ𝑞
𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟Τ(𝑛−𝑘−1)
Testes de
restrições lineares Ou,
múltiplas: o teste
F 𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 𝑛−𝑘−1
𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟 𝑞
(7)
em que, 𝑆𝑄𝑅𝑟 é a soma dos
quadrados dos resíduos do modelo
restrito (modelo 6); 𝑆𝑄𝑅𝑖𝑟 é a soma
Testes de dos quadrados dos resíduos do
restrições lineares modelo irrestrito (modelo 5); 𝑛 é o
múltiplas: o teste
F número de observações; 𝑘 é o
número de regressores do modelo
irrestrito e 𝑞 é o número de
restrições impostas.
Para encontrar os valores
críticos do teste F, necessita-se
Testes de do 𝑔𝑙 do numerador, dado por
restrições lineares 𝑞 e do 𝑔𝑙 do denominador dado
múltiplas: o teste
F por 𝑛 − 𝑘 − 1 e do nível de
significância (𝛼) a 1% ou 5%.
Regra de rejeição:
 Se o Fcalc., equação (7), for
menor que os valores críticos do
Testes de teste (c), então, não se rejeita 𝐻0 ,
restrições lineares significando que 𝛽3 , 𝛽4 e 𝛽5 são,
múltiplas: o teste
F conjuntamente, estatisticamente
não significativos, ao nível de
significância estabelecido, ou
vice-versa.
De outro modo, se a hipótese 𝐻0 for
rejeitada, as variáveis 𝑟𝑒𝑏𝑚𝑒𝑑,
ℎ𝑟𝑢𝑛𝑎𝑛𝑜 e 𝑟𝑒𝑏𝑟𝑢𝑛𝑎𝑛𝑜 explicam,
conjuntamente, o salário dos
Testes de jogadores, o que não justificaria
restrições lineares
excluí-las do modelo.
múltiplas: o teste
F Ao se estimar as equações (5) e (6)
tem-se: 𝑆𝑄𝑅𝑟 = 198,311, 𝑆𝑄𝑅𝑖𝑟 =
183,186, 𝑛 = 353, 𝑘 = 5, 𝑞 = 3, e 𝛼 =
5%
 Substituindo esses valores na
estatística F [equação (7)], tem-se:
𝐹3, 347 = 9,55. O valor crítico do teste
F com 𝑔𝑙 = 3 e 347 e 𝛼 = 1% é 𝑐 =
Testes de 3,84.
restrições lineares
múltiplas: o teste  P-valor do teste 𝐹 = 0,00000447523.
F
 Assim, 𝐹 > 𝑐. Isso implica dizer que
variáveis testadas têm efeito
estatisticamente significativo sobre o
salário dos jogadores.
O gráfico a seguir apresenta
a FDP de uma dada
distribuição F, ao nível de
significância de 5%, com
Testes de 𝑔𝑙 = 2 e 60.
restrições lineares
múltiplas: o teste Note que as estatísticas da
F distribuição F são sempre
positivas.
Copyright © 2009 South-Western/Cengage Learning

100
Em vez de se ter no teste F a
SQR, pode-se usar o 𝑅2 . Das
equações (5) e (6) se obtém os
Testes de coeficientes de determinação
restrições lineares 2
múltiplas: o teste 𝑅𝑖𝑟 e 𝑅𝑟2 .
F
Veja que agora 2
𝑅𝑖𝑟> 2 então, o
𝑅𝑟 ,
teste F passa ser especificado
como:
2
𝑅𝑖𝑟 −𝑅𝑟2 ൗ𝑞
𝐹𝑞, 𝑛−𝑘−1 = 2 )Τ 𝑛−𝑘−1
(1−𝑅𝑖𝑟
(8)

O cálculo obtido com a equação

(8) é o mesmo da equação (7).
Testes de
restrições lineares Um cuidado especial com o
múltiplas: o teste teste F, com 𝑅2 é que a variável
F
dependente tem que ser a
mesma nos dois modelos, bem
como o número de
observações.
A estatística F obtida pela
tabela ANOVA permite testar
se todos os regressores,
Estatística F: conjuntamente, explicam a
Tabela ANOVA
variável dependente.
 A tabela ANOVA está
apresentada a seguir.
Estatística F:
Tabela ANOVA
Dessa forma, o teste F para a
significância global dos
regressores é dado a partir da
ANOVA, como:
Estatística F: 𝑆𝑄𝐸Τ𝑘
Tabela ANOVA 𝐹𝑘, 𝑛−𝑘−1 = 𝑆𝑄𝑅Τ 𝑛−𝑘−1
(9)
Usando 𝑅no teste F, tem-se
2

outra especificação para o teste,

como a apresentada a seguir:
𝑅 2 Τ𝑘
𝐹𝑘, 𝑛−𝑘−1 = (1−𝑅2 )Τ 𝑛−𝑘−1
(10)

Exemplo:
Estatística F: Considere o modelo de
Tabela ANOVA
regressão:
෣ = 𝛽መ0 + 𝛽መ1 𝑇𝑎𝑥𝑐𝑜𝑛𝑡 +
𝑇𝑎𝑥𝑎𝑝
𝛽መ2 𝑖𝑑𝑎𝑑𝑒 + 𝛽መ3 𝑡𝑜𝑡𝑒𝑚𝑝
 A significância geral dessa
regressão é dada ao usar a
estatística F para testar as hipóteses:
 𝐻0 :𝛽1 = 𝛽2 = 𝛽3 = 0.
 O critério de rejeição é o mesmo do
Estatística F: teste F anterior, isto é:
Tabela ANOVA
 Se 𝐹 > 𝑐, implica dizer que
variáveis do modelo de regressão
𝑇𝑎𝑥𝑐𝑜𝑛𝑡, 𝑖𝑑𝑎𝑑𝑒 𝑒 𝑡𝑜𝑡𝑒𝑚𝑝 têm efeito
conjunto sobre a variável 𝑇𝑎𝑥𝑎𝑝.
 Pode-se estar interessado em
testar diferentes valores para as
restrições. Por exemplo, considere
Teste de
restrições o modelo de determinação dos
lineares gerais preços dos imóveis.
 ln 𝑝𝑟𝑒ç𝑜 = 𝛽0 + 𝛽1 ln 𝑎𝑣𝑎𝑙 +
𝛽2 ln 𝑡𝑎𝑚𝑡𝑒𝑟𝑟eno +𝛽3 ln 𝑎𝑟𝑞𝑢𝑎𝑑 +𝛽4 ln 𝑞𝑡𝑑𝑜𝑟𝑚 +
𝑢 (11)
 Deseja-se testar se o preço do
imóvel 𝑝𝑟𝑒ç𝑜 varia na mesma
proporção da avaliação 𝑎𝑣𝑎𝑙 do
mesmo e as demais variáveis não
ajudam a explicar o 𝑝𝑟𝑒ç𝑜.
Teste de
restrições  Portanto, as hipóteses testadas:
lineares gerais  𝐻0 : 𝛽1 = 1, 𝛽2 = 0, 𝛽3 = 0 e 𝛽4 = 0
 Trata-se de um teste F de restrições:
 O modelo (11) é o irrestrito, que
gera 𝑆𝑄𝑅𝑖𝑟 .
Incorporando essas restrições
no modelo (11), tem-se:

Teste de ln 𝑝𝑟𝑒ç𝑜 = 𝛼0 + ln 𝑎𝑣𝑎𝑙 + 𝑒

restrições (12)
lineares gerais Reescrevendo o modelo (12)
para permitir estimação:
ln 𝑝𝑟𝑒ç𝑜 − ln 𝑎𝑣𝑎𝑙 = 𝛼0 + 𝑢
(13)
Ao se estimar o modelo
(13) gera-se 𝑆𝑄𝑅𝑟 .
Tendo 𝑆𝑄𝑅𝑖𝑟 e 𝑆𝑄𝑅𝑟 , se
Teste de utiliza o teste F de
restrições
lineares gerais restrições lineares trivial:
O critério de rejeição é o
mesmo do teste F.
É importante ressaltar que,
nesse último caso, a estatística
Teste de F com 𝑅 2 não pode ser usada,
restrições porque a variável dependente
lineares gerais
do modelo restrito mudou.
Os resultados podem ser
apresentados na própria
equação como:
Apresentação  𝑇𝑎𝑥𝑎𝑝
෣ = 80,29 + 5,44𝑇𝑎𝑥𝑐𝑜𝑛𝑡 + 0,269𝑖𝑑𝑎𝑑𝑒
dos resultados  𝑑𝑝 0,78 0,52 0,045
da regressão
Se há várias equações estimadas,
então, é mais elegante apresentar
os resultados num quadro, como o
apresentado a seguir:
Copyright © 2009 South-Western/Cengage Learning

114
 Utilize o arquivo twoyear para resolver as questões a
seguir.
1) Estime o modelo de regressão abaixo e identifique a
tabela ANOVA :
 ln 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑗𝑐 + 𝛽2 𝑢𝑛𝑖𝑣 +𝛽3 𝑒𝑥𝑝𝑒𝑟 + 𝑢.
em que, 𝑤𝑎𝑔𝑒 é o salário do indivíduo, 𝑗𝑐 é o número de
Exercícios anos frequentados em cursos profissionalizantes de dois
anos, 𝑢𝑛𝑖𝑣 é o número de anos frequentados em cursos
superiores de quatro anos e 𝑒𝑥𝑝𝑒𝑟 número de meses
trabalhados pelo indivíduo.
2) Gere o vetor de resíduos e verifique se este vetor se
aproxima de uma distribuição normal, usando a função
densidade Kernel. Qual a sua conclusão?
3) Estabeleça a hipótese nula bicaudal para cada
parâmetro e use o teste t para ver quais deles são
significativos a 5% de significância. O que se pode
concluir?
4) Use o p-valor para testar o nível de significância dos
parâmetros do modelo e descubra o nível exato de
significância do 𝛽1 .
Exercícios 5) Interprete as magnitudes de cada parâmetro estimado.
6) Faça o intervalo de confiança para 𝛽1 , com nível de
significância de 5% e interprete o resultado. Lembre-se:

 𝑃 𝛽መ1 − 𝑡𝑐 𝑑𝑝 𝛽መ1 ≤ 𝛽1 ≤ 𝛽መ1 + 𝑡𝑐 𝑑𝑝 𝛽መ1 =1−𝛼

7) Utilize o teste t para testar 𝐻0 : 𝛽1 = 𝛽2 contra 𝐻1 : 𝛽1 ≠
෡1 −𝛽
𝛽 ෡2
𝛽2 . Lembre-se: 𝑡 = 𝑑𝑝(𝛽 ෡2 ). O
෡1 −𝛽 que se pode concluir?
8) Teste, a 5% de significância, se 𝐻0 : 𝛽0 = 1, contra 𝐻1 :
𝛽0 ≠ 1. Qual a conclusão?
9) Faça o teste de significância conjunta dos
parâmetros dos regressores do modelo (teste F), ou
seja:
 𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0.
10) Teste, a 5% de significância, se a variável exper
Exercícios pode ser excluída do modelo de regressão da questão
𝑆𝑄𝑅𝑟 −𝑆𝑄𝑅𝑖𝑟 𝑛−𝑘−1
1. Use a estatística: 𝐹𝑞, 𝑛−𝑘−1 = 𝑆𝑄𝑅𝑖𝑟 𝑞

11) Para efeito didático, teste as seguintes hipóteses e

interprete os resultados:
 𝐻0 : 𝛽1 = 1, 𝛽2 = 0 𝑒 𝛽3 = 0
 ln 𝑤𝑎𝑔𝑒 − 𝑗𝑐 = 𝛽0 + 𝑢.
Muito obrigado!

Aula 3 - Inferência

Enviado por

Aula 3 - Inferência

Enviado por

Cap.

Prof. Clailton Ataídes de Freitas

Distribuições  Como β é um vetor de parâmetros

 Var b X = 𝜎ො 2 DD′ + Var β෠

 O termo DD′ é uma forma quadrática, sendo uma

estimador 𝛽መ𝑗  Assim, Var b X = Var(β෠) + 𝜎Ƹ 2 IDD′

 Portanto, a Var β෠ , por MQO, tem variância menor do

 Definindo alternativamente um outro estimador de 𝛽

estimador 𝛽መ𝑗  𝑦𝑖 = 𝛽𝑥𝑖 +𝑢𝑖

Variância  𝑉𝑎𝑟 b = 𝜎ො 2 σ(𝑤𝑖 −

 O último termo da equação é a acima é V𝑎𝑟 𝛽መ , já o

 𝑉𝑎𝑟 b > V𝑎𝑟 𝛽መ , CQD.

Distribuição  Foi visto que a média de 𝛽መ𝑗 é dada

Teste de 𝑑𝑝 𝛽መ𝑗 = 𝑉𝑎𝑟 𝛽መ𝑗

 Cabe ressaltar, que a média, mediana e

 Essa estatística é a 𝑡 calculada, que deve ser comparada com a

vai depender de 𝛽መ𝑗 .

Teste de Quando se estabelece 𝐻1 dessa

 𝑑𝑝 0,78 0,52 0,045 (0,00004)

 𝑃 ቀ𝛽መ𝑗 − 𝑡𝑐 𝑑𝑝 𝛽መ𝑗 ≤ 𝛽𝑗 ≤ 𝛽መ𝑗 +

Teste de Hipótese: em que, 𝑐𝑝 e 𝑢𝑛𝑖𝑣 são, respectivamente, o

O cálculo obtido com a equação

outra especificação para o teste,

Teste de ln 𝑝𝑟𝑒ç𝑜 = 𝛼0 + ln 𝑎𝑣𝑎𝑙 + 𝑒

 𝑃 𝛽መ1 − 𝑡𝑐 𝑑𝑝 𝛽መ1 ≤ 𝛽1 ≤ 𝛽መ1 + 𝑡𝑐 𝑑𝑝 𝛽መ1 =1−𝛼

11) Para efeito didático, teste as seguintes hipóteses e

Você também pode gostar

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.