0% acharam este documento útil (0 voto)
10 visualizações63 páginas

Regressão Linear

O documento aborda a regressão linear, explicando sua definição, equação e aplicação na previsão de variáveis dependentes a partir de variáveis independentes. A regressão linear simples envolve uma variável independente e uma dependente, enquanto a múltipla considera várias independentes. Exemplos práticos e fórmulas são apresentados para ilustrar como calcular e interpretar a equação de regressão e o coeficiente de correlação.

Enviado por

mayhavila
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PPTX, PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
10 visualizações63 páginas

Regressão Linear

O documento aborda a regressão linear, explicando sua definição, equação e aplicação na previsão de variáveis dependentes a partir de variáveis independentes. A regressão linear simples envolve uma variável independente e uma dependente, enquanto a múltipla considera várias independentes. Exemplos práticos e fórmulas são apresentados para ilustrar como calcular e interpretar a equação de regressão e o coeficiente de correlação.

Enviado por

mayhavila
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PPTX, PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 63

REGRESSÃO

LINEAR
José Cláudio Ranucci
REGRESSÃO LINEAR
De acordo com Moore et al. (2006, p.95), uma reta de
regressão é uma linha reta que descreve como uma
variável de resposta y muda à medida que uma variável
explicativa x também varia. Frequentemente utilizamos
uma reta de regressão para predizer o valor de y a partir
de um determinado valor de x.
Para obtermos a reta de regressão, precisamos da
equação de regressão. Esta equação é estimada
utilizando a técnica de regressão linear simples. A
equação de regressão expressa a relação entre a
REGRESSÃO LINEAR
variável dependente (y). Voltando ao nosso exemplo do
início do capítulo, a idade gestacional do bebê é a variável
independente e, a partir de determinado valor atribuído a
ela, podemos prever o comprimento do bebê (que é
variável dependente) utilizando a equação de regressão.
A regressão linear simples envolve uma variável
independente e uma variável dependente. A análise de
regressão envolvendo duas ou mais variáveis
independentes é chamada de análise de regressão
múltipla.
REGRESSÃO LINEAR
Antes de começarmos o estudo para encontrar a
equação de regressão, vamos relembrar qual é a equação
de uma reta.

A equação típica de uma reta é y = m.x + b, em que


m é o coeficiente angular e b é o intercepto ou
linear. O coeficiente angular informa a inclinação da reta
em relação ao eixo das abscissas (x).
REGRESSÃO LINEAR
Se m for um número:
• positivo, a reta é crescente;
• negativo, a reta é decrescente;
• zero, a reta é paralela ao eixo das abscissas.
O coeficiente linear é a ordenada do ponto em que a
reta corta o eixo das ordenadas (y).
Em Estatística, a equação de regressão é expressa na
forma:
REGRESSÃO LINEAR

y = ax + b
Os coeficientes a e b são estatísticas amostrais
usadas para estimarem os parâmetros populacionais β0
e β1. Portanto, utilizaremos dados amostrais em pares
para estimar a equação de regressão. A notação y (y
“chapéu”) serve para distinguir entre um valor observado
y e o valor correspondente y , que é encontrado utilizando
a reta de regressão.
MAS O QUE É A ANÁLISE DE REGRESSÃO?

 A regressão linear é uma metodologia desenvolvida a partir da


estatística e da econometria. Este método serve para avaliar os
efeitos que outras variáveis causam sobre uma variável
analisada.
 A relação parte de uma variável de interesse (dependente) com
outras que a possam influenciar. Por exemplo: analisar a venda
de um produto relacionada ao crescimento populacional de um
país.
 Com os resultados obtidos, a regressão linear visualiza as
maiores tendências que as variáveis analisadas apresentam. A
regressão consiste em modelar, estatisticamente, os valores que
se quer observar.
Esta regressão é linear quando os acontecimentos
observados em um gráfico de dispersão indicam uma
tendência em um formato de linha reta, como na imagem
a seguir:
ANÁLISE DE REGRESSÃO:
A análise de regressão é mais útil quando
apresentada em um diagrama de dispersão, muito
utilizados na economia, administração de empresas, ou
também para os dados de um país.

Quando os acontecimentos não estão combinados em


forma linear ficam conhecidos como regressão não-linear
e, graficamente, a tendência se apresenta em outros
formatos.
REGRESSÃO LINEAR SIMPLES
 A regressão linear é simples quando são analisadas
apenas duas variáveis, normalmente X e Y (valores
observados), sendo que uma é dependente (Y) e será a
função de outra que se comporta independente (X).

 Assim,
supondo x a variável independente e y
dependente, vamos procurar determinar o ajustamento
de uma reta à relação entres essas variáveis, ou seja,
vamos obter uma função definida por:

= a.x + b
REGRESSÃO LINEAR SIMPLES

Onde a e b são os parâmetros e será o valor


estimado.

Sendo a o coeficiente angular ou de regressão


(coeficiente de inclinação) e b o coeficiente linear
(intercepto).
REGRESSÃO
Em outras palavras:
Sempre que desejamos estudar determinada variável
em função de outra fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por
objetivo descrever, através de um modelos matemático, a
relação entre duas variáveis, partindo de n observações
das mesmas.
A variável sobre a qual desejamos fazer uma
estimativa recebe o nome de variável dependente e a
outra o nome de variável independente.
y = a.x + b
 Vamos, então, calcular os parâmetros a e b com a ajuda
das fórmulas:

a=
b=
Onde:
n: é o número de observações;
: é a média dos valores
: é a média dos valores
EXEMPLIFICANDO:

A tabela abaixo, fornecerá os dados para a


exemplificação sendo peso e a estatura de 10 pessoas
adultas, do sexo feminino.
Altura (X Peso (Y) X2 Y2 X.Y
156 53,5 24.336 2.862,25 8.346

158 58,4 24.964 3.410,56 9.227,2

162 56,4 26.244 3.180,96 9.136,8

163 59,4 26.569 3.528,36 9.682,2

165 61,2 27.225 3.745,44 10.098

172 57,5 29.584 3.306,25 9.890

173 67,3 29.929 4.529,29 11.642,9

174 69,7 30.276 4.858,09 12.127,8

179 77,2 32.041 5.959,84 13.818,8

183 81,6 33.489 6.658,56 14.932,8

∑ = 1.685 ∑ = 642,2 ∑= ∑= ∑=
𝒓 =𝒏. ∑ ( 𝑿 ¿ ¿𝒊.𝒀 𝒊 )− ¿¿¿¿
Vamos determinar a equação dessa reta.

y = a.x + b
y = 0,941865.x – 94,484 equação da reta
Portanto, a equação de regressão é:
y = −94,4843 + 0 9419.x
Agora que já conhecemos a equação de regressão,
a pergunta que surge é: como podemos interpretá-la?
Segundo TRIOLA (2008, p. 434)

Ao se trabalhar com duas variáveis relacionadas por


uma equação de regressão, a mudança marginal em uma
variável é a quantidade que ela varia quando a outra
variável varia de exatamente uma unidade. A inclinação
b1 na equação de regressão representa a mudança
marginal em y quando x varia de uma unidade.
REGRESSÃO
Então, para os dados da tabela dada, referentes ao
peso e altura das 10 mulheres, a equação de regressão
tem uma inclinação 0,9419, que mostra que, se
aumentarmos x (altura) em 1 unidade, o peso aumenta
em 0,9419 unidades, aproximadamente. Esta
interpretação fica fácil de ser verificada se substituirmos
valores para x. Por exemplo, se:
x = 155, y = − 94,4843 + 0,9419.(155) =
y = − 94,4843 + 155,9945 = 51,5102 e, se:
x = 156, y = − 94,4843 + 0,9419.(156) =
y = − 94,4843 + 146,9364 = 52,4521.
REGRESSÃO

A diferença entre os valores de y encontrados:


y= −94,4843 + 0,9419.x = −94,4843 + 0,9419.(171)=
66,58 kg, é exatamente o valor de a, ou seja, para cada
acréscimo de 1 unidade em x, y cresce de 0,9419
unidades.
REGRESSÃO
A Figura abaixo apresenta, no diagrama de dispersão, a
reta de regressão.
REGRESSÃO
Estudaremos, mais adiante, o que significa a informação R2 =
0,817.
Podemos utilizar a equação de regressão para prever valores
de Y para quaisquer valores de X dentro do intervalo estudado,
mesmo que tais valores não estejam na amostra. Por exemplo,
para x = 171 (valor que não está na Tabela dada), podemos
estimar o valor de Y.
Basta substituir este valor na equação da reta, ou seja:
y = −94,4843 + 0,9419.x = − 94,4843 + 0,9419.(171) = 66,58
kg
REGRESSÃO
Interpretamos o valor y = 66,58 kg como uma previsão para o
peso, quando a altura da mulher adulta for 171 cm. Se
atribuirmos à variável x um valor observado no conjunto de dados,
por exemplo, x = 165, vamos encontrar o seguinte valor previsto
para y:
y = −94,4843 + 0,9419.x = − 94,4843 + 0,9419.(165)= 60,93 kg.
Analisando a Tabela, observamos que para a altura x= 165
cm, o peso correspondente é y = 61,2 kg. Esta diferença entre o
valor amostral observado e o valor previsto pela equação de
regressão é denominada resíduo.
REGRESSÃO
Então, temos a seguinte definição:
resíduo = yobservado − yprevisto = y – y
Um gráfico de resíduos é outro instrumento útil para
a análise dos resultados da correlação e regressão e para
a verificação dos requisitos necessários para se fazerem
inferências sobre correlação e regressão. Este gráfico é
construído usando o mesmo eixo x do diagrama de
dispersão, mas no eixo y (vertical) utilizamos os valores
dos resíduos.
REGRESSÃO
Se o gráfico de resíduos não revelar qualquer padrão,
a equação de regressão é uma boa representação da
associação entre as duas variáveis.
A equação de regressão deve ser utilizada para fazer
previsões apenas se ela for um bom modelo para os
dados, ou seja, se for verificado por meio de um teste de
hipóteses que a relação entre as duas variáveis é
significante. Caso a relação não seja significante, o melhor
valor previsto de y é y.
REGRESSÃO
Devemos tomar o cuidado de não fazer extrapolações,
ou seja, utilizar a equação de regressão para fazer previsões
para a variável Y utilizando valores para X muito distantes
dos limites dos dados amostrais disponíveis.
De acordo com Anderson et al. (2003, p. 447), “usar a
equação de regressão estimada fora do intervalo dos
valores da variável independente deve ser feito com
cuidado porque fora deste intervalo nós não podemos
assegurar que a mesma relação seja válida”.
EXEMPLIFICANDO:
Determine o coeficiente de correlação dos dados da tabela abaixo:

3 7
2 5
-1 -1
4 9
()= 8 ()= 20 ()= ()= ()=
EXEMPLIFICANDO:
Determine o coeficiente de correlação dos dados da tabela abaixo:

3 7 9
2 5 4
-1 -1 1
4 9 16
()= 8 ()= 20 ()= 30 ()= ()=
EXEMPLIFICANDO:
Determine o coeficiente de correlação dos dados da tabela abaixo:

3 7 9 49
2 5 4 25
-1 -1 1 1
4 9 16 81
()= 8 ()= 20 ()= 30 ()= 156 ()=
EXEMPLIFICANDO:
Determine o coeficiente de correlação dos dados da tabela abaixo:

3 7 9 49 21
2 5 4 25 10
-1 -1 1 1 1
4 9 16 81 36
()= 8 ()= 20 ()= 30 ()= 156 ()= 68
𝒓 =𝒏. ∑ ( 𝑿 ¿ ¿𝒊.𝒀 𝒊 )− ¿¿¿¿
Resolvendo:
𝒓 =𝒏. ∑ ( 𝑿 ¿ ¿𝒊.𝒀 𝒊 )− ¿¿¿¿

Nesse caso, temos uma correlação perfeita


positiva com r = 1.
Encontre o coeficiente de determinação =

Para encontrar o coeficiente de determinação,


basta, pegarmos o resultado do coeficiente de correlação
(r) e elevarmos ao quadrado:

Ou seja,
Encontre o coeficiente de determinação =

Para encontrar o coeficiente de determinação,


basta, pegarmos o resultado do coeficiente de correlação
(r) e elevarmos ao quadrado:

Ou seja,
Vamos determinar a equação dessa reta.
Vamos determinar a equação dessa reta.

y = a.x + b
y = 2.x + 1 equação da reta
Ex. 01. Uma concessionária de veículos quer verificar
eficácia de seus anúncios em determinado jornal na
venda de carros novos. a tabela abaixo mostra o numero
de anúncios publicados, por mês e o correspondente
números de carros vendidos nos últimos seis meses.
Nº de anúncios Nº de carros vendidos
publicados (x) (y)
28 140
20 110
22 100
14 75
10 60
7 52
DIAGRAMA DE DISPERSÃO
CALCULO DO COEFICIENTE DE CORRELAÇÃO:
CALCULO DO COEFICIENTE DE CORRELAÇÃO:
CALCULO DO COEFICIENTE DE CORRELAÇÃO:
CALCULO DO COEFICIENTE DE CORRELAÇÃO:
APLICANDO NA FÓRMULA:
APLICANDO NA FÓRMULA:
REGRESSÃO
CALCULANDO A REGRESSÃO

= =
CALCULANDO A REGRESSÃO

= = 16,833 = = 89,5
a= b=
a=

b=

Teremos:
= 4,138.x + 19,845
a= b=

a = = = = 4,138

b = 89,5 – 4,138 . 16,833


b = 89,5 – 69,655
b = 19,845

Teremos:
= 4,138.x + 19,845
Ex. 02. Uma empresa resolveu estudar a variação da
demanda (em unidades) de seu produto em função do
preço de venda (em reais) praticado. Para isso, foram
coletados os seguintes dados:
Preço
36 43 49 55 61 63 69 72 74 77
(X)
Demanda
350 330 296 252 230 218 203 196 188 167
(Y)

Determine:
a) O coeficiente de correlação
b) A equação da reta ajustada caso a correlação entre as variáveis
seja significativa.
c) Considerando que a relação entre s variáveis não é alterada
mesmo fora do intervalo observado, determine qual a demanda
esperada para um preço de R$ 80,00?
TABELA
b) = =

a= b=

a=

b=

Teremos:
= – 4,477.x + 511,172
b) = = 59,9 = = 243

a= b=

a = = = = – 4,477

b = 243 – (– 4,477) . 59,9


b = 243 + 268,172
b = 511,172
Teremos:
= – 4,477.x + 511,172
Considerando que a relação entre as variáveis não é
alterada mesmo fora do intervalo observado, determine
qual a demanda esperada para um preço de R$ 80,00?

= – 4,477.x + 511,172
Considerando que a relação entre as variáveis não é
alterada mesmo fora do intervalo observado, determine
qual a demanda esperada para um preço de R$ 80,00?

= – 4,477.x + 511,172
= – 4,477.80 + 511,172
= – 358,16 + 511,172
= 153,012
153 unidades
O mais valioso de todos os
talentos é aquele de nunca usar
duas palavras quando uma
basta.”

Thomas Jefferson

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy