Qual è la relazione tra R-Squared e il coefficiente di correlazione di un modello?

Qual è la relazione tra R-Squared e il coefficiente di correlazione di un modello?
Anonim

Risposta:

Guarda questo. Ringraziamento a Gaurav Bansal.

Spiegazione:

Stavo cercando di pensare al modo migliore per spiegare questo e mi sono imbattuto in una pagina che fa un ottimo lavoro. Preferirei dare a questo ragazzo il merito della spiegazione. Nel caso in cui il link non funziona per alcuni ho incluso alcune informazioni di seguito.

Detto semplicemente: il # R ^ 2 # valore è semplicemente il quadrato del coefficiente di correlazione # R #.

Il coefficiente di correlazione (# R #) di un modello (diciamo con variabili #X# e # Y #) prende valori tra #-1# e #1#. Descrive come #X# e # Y # sono correlati.

  • Se #X# e # Y # sono perfettamente all'unisono, quindi questo valore sarà positivo #1#
  • Se #X# aumenta mentre # Y # diminuisce esattamente nel modo opposto, allora questo valore sarà #-1#
  • #0# sarebbe una situazione in cui non vi è alcuna correlazione tra #X# e # Y #

Tuttavia, questo # R # valore è utile solo per un modello lineare semplice (solo un #X# e # Y #). Una volta che consideriamo più di una variabile indipendente (ora abbiamo # # X_1, # # X_2, …), è molto difficile capire cosa significhi il coefficiente di correlazione. Tracciare quale variabile contribuisca a cosa correlare non è così chiaro.

Questo è dove il # R ^ 2 # il valore entra in gioco È semplicemente il quadrato del coefficiente di correlazione. Prende valori tra #0# e #1#, dove valori vicini #1# implica più correlazione (correlata positivamente o negativamente) e #0# non implica alcuna correlazione. Un altro modo di pensarla è la variazione frazionaria della variabile dipendente che è il risultato di tutte le variabili indipendenti. Se la variabile dipendente dipende fortemente da tutte le sue variabili indipendenti, il valore sarà vicino a #1#. Così # R ^ 2 # è molto più utile in quanto può essere usato anche per descrivere modelli multivariati.

Se desideri una discussione su alcune delle nozioni matematiche relative alla relazione dei due valori, vedi questo.