Antraštės
...

Reikšmingumo lygis statistikoje

Reikšmingumo lygis statistikoje yra svarbus rodiklis, atspindintis pasitikėjimo gautų (prognozuojamų) duomenų tikslumu ir teisingumu laipsnį. Ši sąvoka plačiai naudojama įvairiose srityse: nuo sociologinių tyrimų atlikimo iki statistinių mokslinių hipotezių tikrinimo.

reikšmingumo lygis

Apibrėžimas

Statistinio reikšmingumo (arba statistiškai reikšmingo rezultato) lygis parodo, kokia tiriamųjų rodiklių atsitiktinio atsiradimo tikimybė. Bendrasis statistinis reiškinio reikšmingumas išreiškiamas koeficientu p-verte (p-lygiu). Atliekant bet kurį eksperimentą ar stebėjimą, tikėtina, kad gauti duomenys atsirado dėl mėginių ėmimo klaidų. Tai ypač pasakytina apie sociologiją.

Tai yra, statistika yra statistiškai reikšminga, jos atsitiktinio įvykio tikimybė yra labai maža arba linkusi į kraštutinumus. Kraštutiniu šiame kontekste laikomas statistikos nukrypimo nuo nulinės hipotezės laipsnis (hipotezės, kurios tikrinimas yra suderinamas su gautais imties duomenimis). Mokslinėje praktikoje reikšmingumo lygis pasirenkamas prieš renkant duomenis ir paprastai jo koeficientas yra 0,05 (5%). Sistemoms, kuriose tikslios vertės yra ypač svarbios, šis rodiklis gali būti 0,01 (1%) ar mažesnis.

reikšmingumo lygis statistikoje

Bendrosios aplinkybės

Svarbumo lygio sąvoką 1925 m. Pristatė britų statistikas ir genetikas Ronaldas Fisheris, sukūręs statistinių hipotezių tikrinimo metodiką. Analizuojant procesą, yra tam tikra tam tikrų reiškinių tikimybė. Sunkumų kyla dirbant su mažomis (arba ne akivaizdžiomis) procentinėmis tikimybėmis, kurios patenka į „matavimo paklaidos“ sąvoką.

Dirbdami su statistika, kuri nėra pakankamai konkreti patikrinti, mokslininkai susidūrė su niekinės hipotezės, kuri „trukdo“ mažiems kiekiams, problema. Fišeris pasiūlė apibrėžti tokias sistemas įvykių tikimybė 5% (0,05) kaip patogi atrankos dalis, leidžianti atmesti nulinę hipotezę skaičiavimuose.

statistinė hipotezė, tirianti statistinio reikšmingumo lygį

Fiksuoto koeficiento įvedimas

1933 m. Mokslininkai Jerzy Neumannas ir Egonas Pearsonas savo darbuose iš anksto (prieš rinkdami duomenis) rekomendavo nustatyti tam tikrą reikšmingumo lygį. Šių taisyklių taikymo pavyzdžiai aiškiai matomi rinkimų metu. Tarkime, yra du kandidatai, iš kurių vienas yra labai populiarus, o antrasis yra mažai žinomas. Akivaizdu, kad rinkimuose laimi pirmasis kandidatas, o antrojo šansai yra nuliniai. Jie siekia, bet nėra lygūs: visada egzistuoja nenugalimos jėgos, sensacingos informacijos, netikėtų sprendimų tikimybė, galinti pakeisti numatomus rinkimų rezultatus.

Neumannas ir Pearsonas sutarė, kad Fišerio siūlomas reikšmingumo lygis 0,05 (žymimas simboliu α) yra pats patogiausias. Tačiau pats Fisheris 1956 m. Nepritarė šios vertės fiksavimui. Jis manė, kad α lygis turėtų būti nustatytas atsižvelgiant į konkrečias aplinkybes. Pavyzdžiui, dalelių fizikoje jis yra 0,01.

reikšmingumo lygio pavyzdžiai

P vertė

Terminas p vertė pirmą kartą buvo panaudotas Brownley darbe 1960 m. P lygis (p vertė) yra rodiklis, kuris yra atvirkščiai susijęs su rezultatų teisingumu. Didžiausia koeficiento p vertė atitinka žemiausią patikimumo lygį priklausomybėje tarp kintamųjų.

Ši vertė atspindi klaidų, susijusių su rezultatų aiškinimu, tikimybę. Tarkime, p lygis = 0,05 (1/20). Tai rodo penkių procentų tikimybę, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinis imties bruožas.Tai yra, jei šios priklausomybės nėra, tada pakartojant tokius eksperimentus, vidutiniškai kiekviename dvidešimtajame tyrime galima tikėtis tokios pačios ar didesnės priklausomybės tarp kintamųjų. Dažnai p lygis laikomas klaidų lygio „priimtina riba“.

Beje, p vertė gali neatspindėti tikrojo kintamųjų santykio, o tik rodo tam tikrą prielaidų vidutinę vertę. Visų pirma, galutinė duomenų analizė taip pat priklausys nuo pasirinktų šio koeficiento verčių. Kai p lygis = 0,05, bus vieni rezultatai, o su koeficientu 0,01 - kiti.

statistinio reikšmingumo lygis

Tikrinamos statistinės hipotezės

Statistinio reikšmingumo lygis yra ypač svarbus tikrinant hipotezes. Pavyzdžiui, apskaičiuojant dvipusį testą, atmetimo sritis yra padalijama vienodai abiejuose imties pasiskirstymo galuose (nulinės koordinatės atžvilgiu) ir apskaičiuojama duomenų tiesa.

Tarkime, stebint tam tikrą procesą (reiškinį) paaiškėjo, kad naujoji statistinė informacija rodo nedidelius pokyčius, palyginti su ankstesnėmis vertėmis. Be to, rezultatų neatitikimai yra maži, nėra akivaizdūs, tačiau svarbūs tyrimui. Specialistui kyla dilema: ar pokyčiai iš tikrųjų vyksta, ar tos imčių klaidos (netikslūs matavimai)?

Tokiu atveju nulinė hipotezė yra naudojama arba atmetama (visa tai priskiriama klaidai, arba sistemos pasikeitimas pripažįstamas fait accompli). Problemos sprendimo procesas grindžiamas bendro statistinio reikšmingumo (p-vertės) ir reikšmingumo lygio (α) santykiu. Jei p lygis <α, tada nulinė hipotezė atmetama. Kuo mažesnė p vertė, tuo reikšmingesnė yra testo statistika.

Naudotos vertės

Reikšmingumo lygis priklauso nuo analizuojamos medžiagos. Praktiškai naudojamos šios fiksuotos vertės:

  • α = 0,1 (arba 10%);
  • α = 0,05 (arba 5%);
  • α = 0,01 (arba 1%);
  • α = 0,001 (arba 0,1%).

Kuo tikslesni skaičiavimai, tuo mažesnis koeficientas α naudojamas. Natūralu, kad statistikos prognozės fizikoje, chemijoje, farmacijoje, genetikoje reikalauja didesnio tikslumo nei politologijoje, sociologijoje.

reikšmingumo lygio samprata

Svarbumo ribos konkrečiose srityse

Didelio tikslumo srityse, tokiose kaip dalelių fizika ir gamybos veikla, statistinis reikšmingumas dažnai išreiškiamas kaip standartinio nuokrypio (žymimo sigmos koeficientu - σ) santykis su normaliu tikimybės pasiskirstymu (Gauso paskirstymas). σ yra statistinis rodiklis, nulemiantis tam tikros vertės verčių pasiskirstymą, palyginti su matematiniais lūkesčiais. Naudojamas įvykių tikimybei nubrėžti.

Priklausomai nuo žinių srities, koeficientas σ labai skiriasi. Pavyzdžiui, prognozuojant Higso bozono egzistavimą, parametras σ yra penki (σ = 5), kuris atitinka vertę p-reikšmė = 1 / 3,5 milijono. Tyrinėjant genomus, reikšmingumo lygis gali būti 5 × 10.-8kurie šioje srityje nėra neįprasti.

Veiksmingumas

Atminkite, kad koeficientai α ir p vertė nėra tikslios charakteristikos. Nepriklausomai nuo to, koks reikšmingumo lygis yra tiriamo reiškinio statistikoje, jis nėra besąlyginis pagrindas hipotezei sutikti. Pavyzdžiui, kuo mažesnė α reikšmė, tuo didesnė tikimybė, kad nustatyta hipotezė yra reikšminga. Tačiau yra klaidų rizika, dėl kurios sumažėja statistinė tyrimo galia (reikšmingumas).

Tyrėjai, sutelkę dėmesį tik į statistiškai reikšmingus rezultatus, gali padaryti klaidingas išvadas. Tuo pačiu metu sunku dar kartą patikrinti jų darbą, nes jie naudojasi prielaidomis (kurios, tiesą sakant, yra α ir p vertės). Todėl visada rekomenduojama kartu su statistinio reikšmingumo skaičiavimu nustatyti kitą rodiklį - statistinio efekto dydį. Poveikio dydis yra kiekybinis poveikio stiprumo matas.


Pridėti komentarą
×
×
Ar tikrai norite ištrinti komentarą?
Ištrinti
×
Skundo priežastis

Verslas

Sėkmės istorijos

Įranga