corelație

Ce este corelația:

Corelația înseamnă o asemănare sau o relație între două lucruri, oameni sau idei . Este o asemănare sau o echivalență care există între două ipoteze, situații sau obiecte diferite.

În domeniul statisticii și al matematicii, corelația se referă la o măsură între două sau mai multe variabile conexe.

Termenul de corelare este un substantiv feminin care provine din corelatiōne latine .

Corelația cuvântului poate fi înlocuită de sinonime, cum ar fi: relație, ecuație, legătură, corespondență, analogie și conexiune.

Coeficient de corelație

În statistici, coeficientul de corelare Pearson (r), numit și coeficientul de corelație produs-moment, măsoară relația dintre două variabile în aceeași scală măsurată.

Funcția coeficientului de corelație este de a determina intensitatea relației existente între seturi de date sau informații cunoscute.

Valoarea coeficientului de corelație poate varia între -1 și 1, iar rezultatul obținut definește dacă corelația este negativă sau pozitivă.

Pentru a interpreta coeficientul este necesar să știm că 1 înseamnă că corelația dintre variabile este perfect pozitivă și -1 înseamnă că este perfect negativă . Dacă coeficientul este egal cu 0 înseamnă că variabilele nu depind una de cealaltă.

În statistici există și coeficientul de corelație Spearman, care poartă acest nume în onoarea statisticianului Charles Spearman. Funcția acestui coeficient este de a măsura intensitatea relației dintre două variabile, indiferent dacă acestea sunt liniare sau nu.

Corelația Spearman servește pentru a evalua dacă intensitatea relației dintre cele două variabile analizate poate fi măsurată printr-o funcție monotonă (funcție matematică care păstrează sau inversează relația inițială de ordine).

Calculul coeficientului de corelație Pearson

Metoda 1) Calculul coeficientului de corelație Pearson utilizând covarianța și abaterea standard.

unde

S XY este covarianță;

S x și S y reprezintă abaterea standard a variabilelor x și y.

În acest caz, calculul implică mai întâi găsirea covarianței între variabile și abaterea standard a fiecăreia dintre ele. Apoi, covarianța este împărțită prin multiplicarea deviațiilor standard.

Adesea, declarația oferă deja fie deviațiile standard ale variabilelor, fie covarianța dintre ele, doar prin aplicarea formulei.

Metoda 2) Calculul coeficientului de corelație Pearson cu datele brute (fără covarianță sau deviație standard).

Cu această metodă, formula cea mai directă este după cum urmează:

De exemplu, presupunând că avem date cu n = 6 observații ale două variabile: nivelul glucozei (y) și vârsta (x), calculul urmează următoarele etape:

Pasul 1) Construiți tabelul cu datele existente: i, x, y și adăugați coloane goale pentru xy, x² și y²:

Pasul 2: Înmulțiți x și y pentru a umple coloana "xy". De exemplu, în linia 1 vom avea: x1y1 = 43 × 99 = 4257.

Pasul 3: Ridicați valorile coloanei x și înregistrați rezultatele în coloana x². De exemplu, în prima linie vom avea x 1 2 = 43 × 43 = 1849.

Pasul 4: Faceți același lucru ca la pasul 3, folosind acum coloana y și înregistrați pătratul valorilor dvs. în coloana y². De exemplu, în prima linie vom avea: y 1 2 = 99 × 99 = 9801.

Pasul 5: Obțineți suma tuturor numerelor de coloane și plasați rezultatul în subsolul coloanei. De exemplu, suma coloanei Age X este egală cu 43 + 21 + 25 + 42 + 57 + 59 = 247.

Pasul 6: Utilizați formula de mai sus pentru a obține coeficientul de corelare:

Astfel, avem:

Spearman coeficientul de corelație

Calculul coeficientului de corelație Spearman este oarecum diferit. Pentru aceasta, trebuie să ne organizăm datele în următorul tabel:

1. După formularea a 2 perechi de date, trebuie să le prezentăm în tabel. De exemplu:

2. În coloana "Clasament A" vom clasifica observațiile din "Data A" într-o manieră în creștere, cu "1" fiind cea mai mică valoare din coloana, en (numărul total de observații), cea mai mare valoare din coloana " “. În exemplul nostru este:

3. Facem același lucru pentru a obține coloana "Clasament B", folosind acum observațiile din coloana "Date B":

4. În coloana "d" punem diferența între cele două poziții (A - B). Aici semnalul nu contează.

5. Ridicați fiecare dintre valorile din coloana "d" și înregistrați în coloana d²:

6. Adăugați toate datele din coloana "d²". Această valoare este Σd². În exemplul nostru Σd² = 0 + 1 + 0 + 1 = 2

7. Acum folosim formula lui Spearman:

În cazul nostru, n este egal cu 4, pe măsură ce analizăm numărul de rânduri de date (ceea ce corespunde numărului de observații).

8. În final, înlocuiți datele din formula anterioară:

Regresie liniară

Regresia liniară este o formulă utilizată pentru a estima valoarea posibilă a unei variabile (y) când sunt cunoscute valorile altor variabile (x). Valoarea lui "x" este variabila independentă sau explicativă, iar "y" este variabila sau răspunsul dependent.

Regresia liniară este utilizată pentru a verifica modul în care valoarea "y" poate varia în funcție de variabila "x". Linia care conține valorile verificării varianței este numită linia de regresie liniară.

Dacă variabila explicativă "x" are o singură valoare, regresia va fi numită regresie liniară simplă .