O que é um modelo de regressão linear simples e como funciona

O que é um modelo de regressão linear simples e como funciona

Modelos de regressão linear são usados ​​para mostrar ou prever a relação entre duas variáveis ​​ou fatores. O fator que está sendo previsto (o fator que a equação resolve para) é chamado devariável dependente. Os fatores usados ​​para prever o valor da variável dependente são chamados de variáveis ​​independentes.

Na regressão linear, cada observação consiste em dois valores. Um valor é para a variável dependente e um valor é para a variável independente. Neste modelo simples, uma linha reta se aproxima da relação entre a variável dependente e a variável independente.

Quando duas ou mais variáveis ​​independentes são usadas na análise de regressão, o modelo não é mais linear simples. Isso é conhecido como regressão múltipla.

Fórmula para um modelo de regressão linear simples

Os dois fatores envolvidos na análise de regressão linear simples são designados x e y. A equação que descreve como y está relacionado a x é conhecido como o modelo de regressão.

O modelo de regressão linear simples é representado por:

y = β0 +β1x

O modelo de regressão linear contém um termo de erro representado por ε. O termo de erro é usado para explicar a variabilidade em y que não pode ser explicado pela relação linear entre x e y. Se ε não estivesse presente, isso significaria que conhecer x forneceria informações suficientes para determinar o valor de y.

Lá também parâmetros que representam a população sendo estudada. Esses parâmetros do modelo são representados por β0 e β1.

A equação de regressão linear simples é representada como uma linha reta, onde:

  1. β0 é a interceptação y da linha de regressão.
  2. β1 é a ladeira.
  3. Ε(y) é o valor médio ou esperado de y Para um determinado valor de x.

Uma linha de regressão pode mostrar um relacionamento linear positivo, um relacionamento linear negativo ou nenhum relacionamento.

  1. Nenhum relacionamento: A linha gráfica em uma regressão linear simples é plana (não inclinada). Não há relação entre as duas variáveis.
  2. Relação positiva: A linha de regressão se inclina para cima com a extremidade inferior da linha na interceptação y (eixo) do gráfico e a extremidade superior da linha que se estende para cima para o campo do gráfico, longe da interceptação x (eixo). Existe uma relação linear positiva entre as duas variáveis: à medida que o valor de um aumenta, o valor do outro também aumenta.
  3. Relacionamento negativo: A linha de regressão se inclina para baixo com a extremidade superior da linha na interceptação y (eixo) do gráfico e a extremidade inferior da linha que se estende para baixo no campo do gráfico, em direção à interceptação x (eixo). Existe uma relação linear negativa entre as duas variáveis: à medida que o valor de um aumenta, o valor do outro diminui.

A equação de regressão linear estimada

Se os parâmetros da população fossem conhecidos, a simples equação de regressão linear (mostrada abaixo) poderia ser usada para calcular o valor médio de y por um valor conhecido de x.

Ε(y) = β0 +β1x

Na prática, no entanto, os valores de parâmetros geralmente não são conhecidos, portanto devem ser estimados usando dados de uma amostra da população. Os parâmetros da população são estimados usando estatísticas de amostra. As estatísticas de amostra são representadas por β0 e β1. Quando as estatísticas da amostra são substituídas pelos parâmetros da população, a equação de regressão estimada é formada.

A equação de regressão estimada é:

(ŷ) = β0 +β1x

Observação: (ŷ) é pronunciado seu chapéu.

O gráfico da equação de regressão simples estimada é chamada de linha de regressão estimada.

  1. β0 é a interceptação y da linha de regressão.
  2. β1 é a ladeira.
  3. (ŷ) é o valor estimado de y Para um determinado valor de x.

Limites de regressão linear simples

Mesmo os melhores dados não contam uma história completa. 

A análise de regressão é comumente usada na pesquisa para estabelecer que existe uma correlação entre variáveis. Mas a correlação não é a mesma que a causa: uma relação entre duas variáveis ​​não significa que um faz com que o outro aconteça. Mesmo uma linha em uma regressão linear simples que se encaixa bem nos pontos de dados pode não garantir uma relação de causa e efeito.

Usar um modelo de regressão linear permitirá que você descubra se existe uma relação entre variáveis. Para entender exatamente o que é esse relacionamento e se uma variável causa outra, você precisará de pesquisas adicionais e análise estatística.