kategorier
...

Betydningsnivå i statistikk

Betydningsnivået i statistikk er en viktig indikator som gjenspeiler graden av tillit til nøyaktigheten og sannheten til de mottatte (forutsagte) dataene. Konseptet er mye brukt på forskjellige felt: fra å utføre sosiologisk forskning, til statistisk testing av vitenskapelige hypoteser.

betydningsnivå

definisjon

Nivået av statistisk signifikans (eller statistisk signifikant resultat) viser hva som er sannsynligheten for en utilsiktet forekomst av de studerte indikatorene. Fenomenets generelle statistiske betydning uttrykkes ved koeffisienten p-verdi (p-nivå). I ethvert eksperiment eller observasjon er det sannsynlig at de innhentede data skyldes samplingsfeil. Dette gjelder spesielt for sosiologi.

Det vil si at en statistikk er statistisk signifikant hvis sannsynligheten for utilsiktet forekomst er ekstremt liten eller har en tendens til ytterligheter. Ekstrem i denne sammenhengen anses graden av avvik fra statistikk fra nullhypotesen (en hypotese som er sjekket for samsvar med de oppnådde eksempeldata). I vitenskapelig praksis velges signifikansnivået før datainnsamling, og som regel er dens koeffisient 0,05 (5%). For systemer hvor nøyaktige verdier er ekstremt viktige, kan denne indikatoren være 0,01 (1%) eller mindre.

signifikansnivå i statistikk

case historie

Begrepet betydningsnivå ble introdusert av den britiske statistikeren og genetikeren Ronald Fisher i 1925 da han utviklet en metodikk for å teste statistiske hypoteser. Når du analyserer en prosess, er det en viss sannsynlighet for visse fenomener. Vanskeligheter oppstår når du arbeider med små (eller ikke åpenbare) prosent sannsynligheter som faller inn under begrepet "målefeil."

Når de jobbet med statistikk som ikke er spesifikk nok til å verifisere, ble forskere møtt med problemet med nullhypotesen, som "forstyrrer" med små mengder. Fisher foreslo å definere for slike systemer sannsynlighet for hendelser 5% (0,05) som en praktisk selektiv skive, slik at du kan avvise nullhypotesen i beregningene.

statistisk hypotese som tester statistisk signifikansnivå

Innføringen av en fast koeffisient

I 1933 anbefalte forskerne Jerzy Neumann og Egon Pearson i sine arbeider på forhånd (før datainnsamling) for å etablere et visst nivå av betydning. Eksempler på bruk av disse reglene er tydelig synlige under valget. Anta at det er to kandidater, hvorav den ene er veldig populær, og den andre er lite kjent. Det er klart at den første kandidaten vinner valget, og sjansene for den andre har en tendens til å bli null. De streber - men ikke like: det er alltid sannsynligheten for force majeure, oppsiktsvekkende informasjon, uventede avgjørelser som kan endre de spådde valgresultatene.

Neumann og Pearson var enige om at Fishers foreslåtte signifikansnivå på 0,05 (betegnet med symbolet α) er mest praktisk. Fisher selv i 1956 imot imidlertid fiksering av denne verdien. Han mente at nivået av α burde fastsettes i samsvar med spesifikke omstendigheter. For eksempel i partikkelfysikk er det 0,01.

eksempler på betydningsnivå

Signifikansnivå på p-

Begrepet p-verdi ble først brukt i Brownleys arbeid i 1960. P-nivå (p-verdi) er en indikator som er omvendt relatert til resultatene. Den høyeste koeffisienten p-verdien tilsvarer det laveste nivået av tillit i prøven av avhengighet mellom variablene.

Denne verdien reflekterer sannsynligheten for feil knyttet til tolkningen av resultatene. Anta at p-nivå = 0,05 (1/20). Den viser sannsynligheten for fem prosent at forholdet mellom variablene som finnes i prøven bare er en tilfeldig funksjon i prøven.Det vil si at hvis denne avhengigheten er fraværende, kan man med gjentatte slike eksperimenter i gjennomsnitt i hver tjuende studie forvente samme eller større avhengighet mellom variablene. Ofte blir p-nivået betraktet som den "akseptable margin" på feilnivået.

For øvrig reflekterer kanskje ikke p-verdi det reelle forholdet mellom variablene, men viser bare en viss gjennomsnittsverdi innenfor forutsetningene. Spesielt vil den endelige analysen av dataene også avhenge av de valgte verdiene til denne koeffisienten. Med et p-nivå = 0,05 vil det være noen resultater, og med en koeffisient på 0,01, andre.

nivå av statistisk betydning

Testing av statistiske hypoteser

Nivået av statistisk betydning er spesielt viktig når man tester hypoteser. Når du for eksempel beregner en tosidig test, blir avvisningsområdet delt likt i begge ender av prøvedistribusjonen (i forhold til nullkoordinaten), og sannheten til dataene blir beregnet.

Anta at det ved overvåking av en viss prosess (fenomen) viste seg at den nye statistiske informasjonen indikerer små endringer i forhold til tidligere verdier. Dessuten er avvikene i resultatene små, ikke åpenbare, men viktige for studien. Dilemmaet oppstår før spesialisten: foregår endringene virkelig, eller er disse prøvetakingsfeil (unøyaktige målinger)?

I dette tilfellet blir nullhypotesen brukt eller avvist (alt tilskrives en feil, eller endringen i systemet blir gjenkjent som en fait accompli). Prosessen med å løse problemet er basert på forholdet mellom total statistisk signifikans (p-verdi) og signifikansnivå (α). Hvis p-nivået <α, blir nullhypotesen avvist. Jo mindre p-verdi, desto mer signifikant er teststatistikken.

Verdier brukt

Betydningsnivået avhenger av materialet som analyseres. I praksis brukes følgende faste verdier:

  • a = 0,1 (eller 10%);
  • a = 0,05 (eller 5%);
  • a = 0,01 (eller 1%);
  • a = 0,001 (eller 0,1%).

Jo mer nøyaktige beregningene er, desto lavere brukes koeffisienten α. Statistiske prognoser innen fysikk, kjemi, legemidler, genetikk krever naturlig nok større nøyaktighet enn i statsvitenskap, sosiologi.

betydning nivå konsept

Terskler av relevans på spesifikke områder

I områder med høy presisjon, som partikkelfysikk og produksjonsaktiviteter, uttrykkes ofte statistisk betydning som forholdet mellom standardavviket (betegnet med sigma-koeffisienten - σ) i forhold til normal sannsynlighetsfordeling (Gauss-distribusjon). σ er en statistisk indikator som bestemmer spredningen av verdiene til en viss verdi i forhold til matematiske forventninger. Brukes til å plotte sannsynligheten for hendelser.

Avhengig av kunnskapsfeltet, varierer koeffisienten σ sterkt. For eksempel når man forutsier eksistensen av Higgs boson, er parameteren σ fem (σ = 5), som tilsvarer verdien p-verdi = 1 / 3,5 millioner. I studier av genomer kan signifikansnivået være 5 × 10-8som ikke er uvanlig for dette området.

effektivitet

Husk at koeffisientene α og p-verdi ikke er nøyaktige egenskaper. Uansett betydningsnivå i statistikken over det studerte fenomenet, er det ikke et ubetinget grunnlag for å godta hypotesen. For eksempel, jo mindre verdi av a, jo større er sjansen for at den etablerte hypotesen er betydelig. Imidlertid er det en risiko for feil, noe som reduserer den statistiske kraften (betydningen) av studien.

Forskere som utelukkende fokuserer på statistisk signifikante resultater, kan få feilaktige konklusjoner. Samtidig er det vanskelig å dobbeltsjekke arbeidet deres, siden de bruker forutsetninger (som faktisk er verdiene til α og p-verdi). Derfor anbefales det alltid, sammen med beregningen av statistisk betydning, å bestemme en annen indikator - størrelsen på den statistiske effekten. Størrelsen på en effekt er et kvantitativt mål på effektens styrke.


Legg til en kommentar
×
×
Er du sikker på at du vil slette kommentaren?
Slett
×
Årsaken til klage

Forretnings

Suksesshistorier

utstyr