Intervalul de încredere

Care este intervalul de încredere:

Este o estimare a unei game utilizate în statistici, care conține un parametru al populației. Acest parametru populațional necunoscut se găsește printr-un model de probă calculat din datele colectate .

Exemplu: media unui eșantion colectat x ^ poate sau nu să corespundă cu media reală a populației μ. Pentru aceasta, este posibil să se ia în considerare o gamă de mijloace de eșantionare în cazul în care această medie a populației poate fi limitată. Cu cât acest interval este mai lung, cu atât este mai mare probabilitatea ca acest lucru să se întâmple.

Intervalul de încredere este exprimat ca procent, exprimat prin nivelul de încredere, cu 90%, 95% și 99% fiind cel mai indicat. În imaginea de mai jos, de exemplu, avem un interval de încredere de 90% între limitele superioare și inferioare (a și -a ).

Exemplu de interval de încredere de 90% între limitele superioare (a) și cele inferioare (-a).

Intervalul de încredere este unul dintre cele mai importante concepte din cadrul testelor de ipoteze din statistici, deoarece este folosit ca măsură de incertitudine. Termenul a fost introdus de matematicianul și statisticianul polonez Jerzy Neyman în 1937.

Care este relevanța unui interval de încredere?

Intervalul de încredere este important pentru a indica marja de incertitudine (sau imprecizia) față de un calcul efectuat. Acest calcul utilizează eșantionul de studiu pentru a estima mărimea reală a rezultatului în populația sursă.

Calculul unui interval de încredere este o strategie care ia în considerare eșantionarea erorilor. Mărimea rezultatului studiului și a intervalului dvs. de încredere caracterizează valorile presupuse pentru populația inițială.

Cu cât intervalul de încredere este mai restrâns, cu atât este mai mare probabilitatea ca procentul populației studiate să reprezinte numărul real al populației sursă, oferind o mai mare certitudine cu privire la rezultatul obiectului studiului.

Cum să interpretați un interval de încredere?

Interpretarea corectă a intervalului de încredere este probabil cel mai provocator aspect al acestui concept statistic. Un exemplu de interpretare cea mai comună a conceptului este următoarea:

Există o probabilitate de 95% ca, în viitor, valoarea reală a parametrului populației (de exemplu, media) să scadă în limitele X (limita inferioară) și Y (limita superioară).

Astfel, intervalul de încredere este interpretat după cum urmează: este de 95% sigură că intervalul dintre X (limita inferioară) și Y (limita superioară) conține adevărata valoare a parametrului populației.

Ar fi complet incorect să afirmăm că: există o probabilitate de 95% ca intervalul dintre X (limita inferioară) și Y (limita superioară) să conțină valoarea reală a parametrului populației.

Declarația de mai sus este cea mai obișnuită concepție greșită despre intervalul de încredere. După ce se calculează intervalul statistic, acesta poate conține sau nu numai parametrul de populație.

Cu toate acestea, intervalele pot varia între eșantioane, în timp ce parametrul real al populației este identic indiferent de eșantion.

Prin urmare, declarația de încredere a intervalului de încredere poate fi făcută numai în cazul în care intervalele de încredere sunt recalculate pentru numărul de eșantioane.

Pașii de calcul al intervalului de încredere

Intervalul este calculat utilizând următorii pași:

  • Colectați datele de probă: n ;
  • Calculați media eșantionului xj;
  • Determinați dacă deviația standard a populației ( σ ) este cunoscută sau necunoscută;
  • Dacă se cunoaște o abatere standard a populației, se poate folosi un z- punct pentru nivelul de încredere corespunzător;
  • Dacă abaterea standard a populației este necunoscută, putem folosi o statistică t pentru nivelul de încredere corespunzător;
  • Astfel, limitele inferioare și superioare ale intervalului de încredere se găsesc folosind următoarele formule:

a) Deviația standard a unei populații cunoscute :

Formula pentru calcularea deviației standard a unei populații cunoscute.

b) Deviația standard a unei populații necunoscute :

Formula pentru calculul abaterii standard a unei populații necunoscute.

Exemplul practic al unui interval de încredere

Un studiu clinic a evaluat asocierea dintre prezența astmului și riscul apariției apneei obstructive de somn la adulți.

Unii adulți au fost recrutați aleatoriu dintr-o listă a funcționarilor de stat care urmează să fie urmată timp de patru ani.

Participantii cu astm, comparativ cu cei fara, au avut un risc mai mare de a dezvolta apnee in patru ani.

În efectuarea cercetărilor clinice, cum ar fi acest exemplu, un subgrup al populației de interes este de obicei recrutat pentru a spori eficiența studiului (costuri mai mici și mai puțin timp).

Acest subgrup de indivizi, populația studiată, este compusă din cei care îndeplinesc criteriile de includere și sunt de acord să participe la studiu, așa cum se arată în imaginea de mai jos.

Grafic explicativ al populației studiate în exemplul respectiv.

Apoi, studiul este finalizat și o dimensiune a efectului (de exemplu, o diferență medie sau un risc relativ ) este calculată pentru a răspunde la întrebarea de cercetare.

Acest proces, numit inferență, implică utilizarea datelor colectate de la populația studiată pentru a estima mărimea efectului efectiv asupra populației de interes, adică a populației de origine.

În exemplul dat, cercetătorii au recrutat un eșantion aleatoriu de angajați de stat (populație sursă) care au fost eligibili și au fost de acord să participe la studiu (populația de studiu) și au raportat că astmul crește riscul apariției apneei la populația studiată.

Pentru a ține cont de o eroare de eșantionare datorată recrutării doar a unui subgrup al populației de interes, ei au calculat, de asemenea, un interval de încredere de 95% (în jurul estimării) de 1, 06 - 1, 82, indicând o probabilitate de 95 % că riscul relativ real în populația sursă ar fi între 1, 06 și 1, 82 .

Intervalul de încredere pentru mediu

Când cineva are informația despre abaterea standard a unei populații, se poate calcula un interval de încredere pentru media sau media acelei populații.

Când o caracteristică statistică care este măsurată (cum ar fi venitul, IQ, prețul, înălțimea, cantitatea sau greutatea) este numerică, în majoritatea cazurilor se estimează că se găsește valoarea medie a populației.

Astfel, încercăm să găsim media populației ( μ ) folosind o medie a eșantionului ( x ), cu o marjă de eroare. Rezultatul acestui calcul este numit intervalul de încredere pentru media populației .

Când deviația standard a populației este cunoscută, formula pentru un interval de încredere (CI) pentru o medie a populației este:

în cazul în care:

  • xrei este media eșantionului;
  • σ este abaterea standard a populației;
  • n este mărimea eșantionului;
  • Z * reprezintă valoarea corespunzătoare a distribuției normale standard pentru nivelul de încredere dorit.

Următoarele sunt valorile diferitelor niveluri de încredere ( Z * ):

Nivel de încredereValoarea lui Z * -
80%01:28
90%1, 645 (convențional)
95%1, 96
98%02:33
99%02:58

Tabelul de mai sus prezintă valorile z * pentru nivelurile de încredere furnizate. Rețineți că aceste valori se obțin din distribuția normală standard (Z-).

Zona dintre fiecare valoare z * și valoarea negativă a acestei valori este procentul de încredere (aproximativ). De exemplu, zona dintre z * = 1, 28 și z = -1, 28 este de aproximativ 0, 80. Prin urmare, acest tabel poate fi extins și la alte procente de încredere. În tabel sunt afișate doar procentele cele mai frecvent utilizate de încredere.

Vezi și înțelesul ipotezei.