Cabeçalhos
...

Correlação e análise de regressão: exemplo, tarefas, aplicação. Método de correlação e análise de regressão

Análise de regressão de correlação - Este é um dos métodos mais comuns para estudar a relação entre valores numéricos. Seu principal objetivo é encontrar a relação entre os dois parâmetros e seu grau com a derivação subseqüente da equação. Por exemplo, temos alunos que passaram no exame de matemática e inglês. Podemos usar a correlação para determinar se o sucesso de um teste afeta os resultados em outro assunto. Quanto à análise de regressão, ajuda a prever as notas de matemática com base nos pontos obtidos em um exame de inglês e vice-versa.

análise de regressão de correlação

O que é um gráfico de correlação?

Qualquer análise começa com a coleta de informações. Quanto mais é, mais precisamente o resultado obtido no final. No exemplo acima, temos duas disciplinas nas quais os alunos precisam passar no exame. Sua taxa de sucesso é uma estimativa. A análise de regressão de correlação mostra se o resultado de um sujeito afeta os pontos marcados no segundo exame. Para responder a essa pergunta, é necessário analisar as avaliações de todos os alunos em paralelo. Mas primeiro você precisa decidir sobre a variável dependente. Neste caso, não é tão importante. Suponha que um exame de matemática tenha ocorrido antes. Pontos nele são uma variável independente (eles são adiados ao longo da abscissa). Inglês está no horário mais tarde. Portanto, as estimativas baseadas nele são uma variável dependente (são plotadas ao longo da ordenada). Quanto mais o gráfico assim obtido se parecer com uma linha reta, mais forte será a correlação linear entre os dois valores selecionados. Isso significa que os estudantes de matemática são mais propensos a receber cinco no exame de inglês.

Suposições e Simplificações

O método de correlação e análise de regressão envolve encontrar uma relação causal. No entanto, no primeiro estágio, é preciso entender que mudanças em ambas as quantidades podem ser devidas a um terço, ainda não levado em consideração pelo pesquisador. Também pode haver relações não lineares entre as variáveis, portanto, obter um coeficiente igual a zero não é o fim do experimento.

exemplo de análise de regressão de correlação

Correlação linear de Pearson

Esse coeficiente pode ser usado sujeito a duas condições. O primeiro - todos os valores das variáveis ​​são números racionais, o segundo - espera-se que os valores mudem proporcionalmente. Este coeficiente é sempre entre -1 e 1. Se for maior que zero, então existe uma dependência diretamente proporcional, menos - inversamente, igual - estes valores não afetam um ao outro de forma alguma. A capacidade de calcular este indicador é a base da análise de correlação e regressão. Pela primeira vez, esse coeficiente foi desenvolvido por Karl Pearson baseado na ideia de Francis Galton.

Propriedades e Cuidados

O coeficiente de correlação de Pearson é uma ferramenta poderosa, mas também deve ser usada com cautela. Os seguintes avisos estão no seu uso:

  1. O coeficiente de Pearson indica a presença ou ausência de uma relação linear. A análise de regressão de correlação não termina aí, pode acontecer que as variáveis ​​estejam, no entanto, interligadas.
  2. É preciso ter cuidado ao interpretar o valor do coeficiente. Uma correlação pode ser encontrada entre o tamanho da perna e o nível de QI.Mas isso não significa que um indicador determine outro.
  3. O coeficiente de Pearson não diz nada sobre a relação causal entre os indicadores.

método de análise de regressão de correlação

Coeficiente de correlação de postos de Spearman

Se uma mudança no valor de um indicador leva a um aumento ou diminuição no valor de outro, isso significa que eles estão relacionados. A análise de regressão de correlação, um exemplo do que será dado abaixo, é precisamente conectada com tais parâmetros. O coeficiente de classificação permite simplificar os cálculos.

Correlação e análise de regressão: um exemplo

Suponha que haja uma avaliação da eficácia de dez empresas. Temos dois juízes que lhes dão pontos. A correlação e a análise de regressão do empreendimento neste caso não podem ser realizadas com base no coeficiente linear de Pearson. Não estamos interessados ​​na relação entre as classificações dos juízes. As fileiras dos empreendimentos de acordo com os juízes são importantes.

Esse tipo de análise tem as seguintes vantagens:

  • Forma não paramétrica de relações entre as quantidades estudadas.
  • Facilidade de uso, porque as classificações podem ser atribuídas tanto em ordem crescente de valor quanto em ordem decrescente.

O único requisito desse tipo de análise é a necessidade de converter os dados de origem.

Noções básicas de análise de regressão de correlação

Problemas de aplicação

A análise de correlação e regressão é baseada nas seguintes suposições:

  • As observações são consideradas independentes (uma perda de cinco vezes da “águia” não afeta o resultado da próxima jogada de moeda).
  • Na análise de correlação, ambas as variáveis ​​são consideradas aleatórias. Na regressão - apenas um (dependente).
  • Ao testar uma hipótese, uma distribuição normal deve ser observada. A mudança na variável dependente deve ser a mesma para cada valor na abscissa.
  • O diagrama de correlação é apenas o primeiro teste da hipótese sobre a relação entre as duas séries de parâmetros, e não o resultado final da análise.

aplicação de análise de regressão de correlação

Dependência e causalidade

Suponha que calculamos o coeficiente de correlação do volume de exportação e do PIB. Acabou sendo igual a unidade módulo. Já fizemos a análise de correlação e regressão até o final? Claro que não. O resultado obtido não significa, em absoluto, que o PIB possa ser expresso através da exportação. Ainda não provamos uma relação causal entre os indicadores. Análise de regressão de correlação - previsão dos valores de uma variável baseada em outra. No entanto, você precisa entender que muitas vezes muitos fatores afetam o parâmetro. A exportação determina o PIB, mas não apenas isso. Existem outros fatores. Aqui há uma correlação e uma relação causal, embora ajustada para outros componentes do produto interno bruto.

Outra situação é muito mais perigosa. No Reino Unido, foi realizada uma pesquisa que mostrou que as crianças cujos pais fumavam eram mais frequentemente infratores. Esta conclusão é baseada em uma forte correlação entre o indicador. Mas ele está correto? Em primeiro lugar, a dependência pode ser inversa. Os pais podem começar a fumar devido ao estresse do fato de que seus filhos constantemente entram em alterações e violam a lei. Em segundo lugar, ambos os parâmetros podem ser devidos ao terceiro. Tais famílias pertencem a classes sociais baixas, caracterizadas por ambos os problemas. Portanto, com base na correlação, não se pode concluir que exista uma relação causal.

análise de regressão de correlação de previsão

Por que usar a análise de regressão?

Dependência de correlação envolve encontrar relações entre quantidades. A relação causal, neste caso, permanece nos bastidores. As tarefas de correlação e análise de regressão coincidem apenas em termos de confirmar a existência de uma relação entre os valores de duas grandezas. No entanto, inicialmente o pesquisador não presta atenção à possibilidade de um relacionamento causal. A análise de regressão sempre tem duas variáveis, uma das quais é dependente. Acontece em várias etapas:

  1. Escolhendo o modelo certo usando o método dos mínimos quadrados.
  2. Derivação de uma equação que descreve o efeito de uma mudança em uma variável independente em outra.

Por exemplo, se estudarmos o efeito da idade no crescimento humano, então uma análise de regressão pode ajudar a prever mudanças ao longo dos anos.

análise de correlação empresarial

Regressão Linear e Múltipla

Suponha que X e Y sejam duas variáveis ​​relacionadas. A análise de regressão nos permite prever a magnitude de um deles com base nos valores do outro. Por exemplo, maturidade e idade são sintomas dependentes. A relação entre eles é refletida usando regressão linear. De fato, você pode expressar X a Y ou vice-versa. Mas muitas vezes apenas uma das linhas de regressão está correta. O sucesso da análise depende em grande parte da determinação correta da variável independente. Por exemplo, temos dois indicadores: rendimento e precipitação. Da experiência cotidiana, fica claro que o primeiro depende do segundo, e não o contrário.

Regressão múltipla permite calcular um valor desconhecido com base nos valores de três ou mais variáveis. Por exemplo, a produtividade do arroz por acre de terra depende da qualidade do grão, fertilidade do solo, fertilizantes, temperatura e precipitação. Todos esses parâmetros afetam o resultado geral. Para simplificar o modelo, as seguintes suposições são usadas:

  • A relação entre características independentes e influenciadoras é linear.
  • A multicolinearidade é excluída. Isso significa que as variáveis ​​dependentes não estão interconectadas.
  • Homoscedasticidade e normalidade de séries de números.

O uso de correlação e análise de regressão

Existem três casos principais de uso desse método:

  1. Testando relações casuais entre quantidades. Nesse caso, o pesquisador determina os valores da variável e descobre se eles afetam a mudança na variável dependente. Por exemplo, você pode dar às pessoas diferentes doses de álcool e medir sua pressão arterial. Nesse caso, o pesquisador sabe com certeza que o primeiro é a causa do segundo, e não o contrário. A análise de regressão de correlação permite detectar uma relação linear diretamente proporcional entre essas duas variáveis ​​e derivar uma fórmula que a descreve. Nesse caso, valores expressos em unidades de medida completamente diferentes podem ser comparados.
  2. Encontrar um relacionamento entre duas variáveis ​​sem estender um relacionamento causal a elas. Nesse caso, não há diferença quanto ao tamanho que o pesquisador chama de dependente. Além disso, na realidade, pode acontecer que ambos sejam afetados pela terceira variável, portanto eles mudam proporcionalmente.
  3. Cálculo de valores de uma quantidade baseada em outra. É baseado em uma equação na qual os números conhecidos são substituídos.

Assim, a análise de correlação envolve encontrar uma conexão (não causal) entre as variáveis, e a análise de regressão explica isso, freqüentemente usando uma função matemática.


Adicione um comentário
×
×
Tem certeza de que deseja excluir o comentário?
Excluir
×
Razão para reclamação

Negócio

Histórias de sucesso

Equipamentos