Unidade 12
Unidade 12
ESTATÍSTICA EXPERIMENTAL
UNIDADE 12
a) Conteúdo:
1. Regressão linear simples
b) Objetivo da Semana:
Conceituar a regressão linear simples; calcular os coeficientes da reta.
c) Avaliação:
1. Atividades
Pombal-PB
9. Regressão Linear Simples
9.1. Conceituação
Uma regressão linear simples permite determinar, a partir das estimativas dos parâmetros,
como uma variável independente (X) exerce, ou parece exercer, influência sobre outra variável
(Y), chamada de variável dependente. Por exemplo, qual a influência da proteína sobre a
produção de leite? Esta pergunta poderia ser respondida a partir de uma regressão linear simples
entre as variáveis Y (produção de leite) e X (quantidade de proteína).
O problema básico da teoria da regressão é estimar os parâmetros do modelo estatístico
admitido, deduzir testes de significância para estes parâmetros e calcular seus intervalos de
confiança com base na equação de regressão.
Dados n pares de valores de duas variáveis Xi e Yi (i= 1, 2,..., n), admitindo que Y é função
linear de X, podemos estabelecer uma regressão linear simples, cujo modelo estatístico é:
Yi 0 1 X i ei
Em que:
β0 e β1 são os parâmetros do modelo e ei são os erros aleatórios.
e) o erro de uma observação é independente do erro em outra observação, isto é, E (ei ej)=0 para
i≠j.
f) os erros têm distribuição normal.
XY i i i
n
i
ˆ1 i
2
Xi
X i2 i n
i
E,
Y i X i
ˆ 0 i
ˆ1 i
ou ˆ0 Y ˆ1 X
n n
n
(Yi Y ) 2 (Yˆi Y ) 2 (Yi Yˆi ) 2 y i2 yˆ i2 ei2
i 1 i i ou i i i
Isto é, que a soma de quadrados total (SQT) é igual à soma de quadrados da regressão
(SQRegressão), mais a soma de quadrados residual (SQR) também chamada soma de quadrados
dos desvios.
2
Yi
(Yi Y ) 2 Yi 2 i n SQTotal
i i
2
Yi
i C Correção
n
SQ Re gressão (Yˆi Y ) ( ˆ ˆ1 X i Y ) 2
2
0
i i
X i Yi
2
XY i
i
i i
n
i
( SPXY ) 2
SQRegressão = 2
S .Q.D X
Xi
X i2 i n
i
xy x y x y
2
i i i i
(Yi Y ) 1 xi i x 2
ˆ 2 ˆ 2 2
x 2 i i
ˆ1 xy
i x
i 2
i i i i
CV GL SQ QM F
Regressão 1 SQReg QMReg QMReg/QMres
Resíduo n-2 SQRes QMRes=SQRes/(n-2)
Total n-1 SQtotal
Testam-se as hipóteses:
Ho: β1=0
Ha: β1≠0
9.2. Aplicações
Os dados abaixo se referem aos pesos ao nascer (X) e peso na desmama (Y) de n=6
bezerros machos da raça guzerá (Agronomia);
X Y
i i
X Y i i i
n
i
7.903,45
(159,8) ( 296,6)
ˆ1 i
2
Substituindo, ˆ1 6
(159,8) 2
Xi 4.260,76
6
X i2 i n
i
Terceiro passo
Yˆi ˆ0 ˆ1 X Yˆ 27 ,0049 0,8421 X
Assim,
Geramos o modelo com base em nossa massa de dados, mas ainda não sabemos se ele pode
ser utilizado. Para isso, precisamos realizar a análise de variância para regressão.
Análise de Variância para Regressão
X Y
2
i i
(X Y )
i i
i i
n
159 ,8 .296 ,6 2
i
7.903,45−
SQ Re gressão 2
𝑆𝑄𝑅𝑒𝑔 = 6
(159 ,8)2
= 𝟑, 𝟑𝟔𝟖𝟒
4.260−
Xi
6
X i2 i n
i
CV GL SQ QM F
Regressão 1 3,3684 3,3684 300,75
Resíduo 4 0,0449 0,0112
Total 5 3,4133
Como F calculado (300,75) foi MAIOR do que F tabelado (7,71), rejeitamos H0, logo Beta
1 é diferente de zero. Deste modo, os modelos abaixo são bons estimadores das variáveis em
estudos.
Por fim, faz-se necessário apresentar o quão o modelo estimado representa (explica) os
dados. Para isso, é necessário calcular o coeficiente de determinação. Em outras palavras, ele
determina o quão os dados são explicados pelo modelo de regressão.
9.3. Coeficiente de determinação (R2)
O coeficiente de determinação (R2) indica a proporção da variação de Y que é “explicada”
pela regressão ou quanto da SQT está sendo “explicada” pela regressão ou quanto da variação na
variável dependente Y está sendo explicada pela variável independente X.
SQ Regressão
R2
SQT
3,3684
𝑅2 = = 0,9868
3,4133