Statistik er en kompleks videnskab til måling og analyse af forskellige data. Som i mange andre discipliner findes begrebet en hypotese i denne branche. Således er en hypotese i statistikker en position, der skal accepteres eller afvises. Derudover er der i denne branche flere typer af sådanne antagelser, svarende til definition, men forskellige i praksis. Nullhypotesen er nutidens studieemne.
Fra generel til særlig: hypoteser i statistikker
En anden, ikke mindre vigtig, afviger fra den grundlæggende definition af antagelser - den statistiske hypotese er studiet af den generelle helhed af objekter, der er vigtige for videnskaben, og som forskere drager konklusioner for. Det kan kontrolleres ved hjælp af en stikprøve (en del af befolkningen). Her er nogle eksempler på statistiske hypoteser:
1. Præstationen for hele klassen kan afhænge af uddannelsesniveauet for hver studerende.
2. Det indledende matematikforløb erhverves ligeledes af både børn, der kom i skole 6 år og børn, der kom 7 år.
I statistik kaldes en simpel hypotese sådan en antagelse, der unikt karakteriserer en bestemt parameter for en mængde, der er taget af en videnskabsmand.
Komplekset består af flere eller et uendeligt antal enkle. Angiv et bestemt område eller ikke et nøjagtigt svar.
Det er nyttigt at forstå flere definitioner af hypoteser i statistikker for ikke at forveksle dem i praksis.
Begrebet nulhypotese
Nullhypotesen er en teori om, at der er nogle to aggregater, der ikke adskiller sig fra hinanden. På det videnskabelige niveau er der imidlertid ikke noget begreb "adskiller sig ikke", men der er "deres lighed er nul." Fra denne definition blev konceptet dannet. I statistik betegnes nulhypotesen som H0. Derudover anses den ekstreme værdi af det umulige (usandsynlige) at være fra 0,01 til 0,05 eller mindre.
Det er bedre at forstå, hvad nulhypotesen er, et eksempel fra livet vil hjælpe. Læreren på universitetet foreslog, at det forskellige niveau af forberedelse af studerende i de to grupper til testarbejdet skyldes ubetydelige parametre, tilfældige grunde, der ikke påvirker det generelle uddannelsesniveau (forskellen i forberedelsen af to grupper af studerende er nul).
Det er dog værd at give et eksempel på en alternativ hypotese - en antagelse, der modbeviser påstanden om nulteorien (H1). For eksempel: direktøren for universitetet foreslog, at de forskellige niveauer i forberedelsen til testarbejdet for studerende i de to grupper skyldes brugen af forskellige undervisningsmetoder fra lærerne (forskellen i forberedelsen af de to grupper er betydelig, og der er en forklaring).
Nu kan du straks se forskellen mellem begreberne "nullhypotese" og "alternativ hypotese". Eksempler illustrerer disse begreber.
Test af hypotese
At skabe en antagelse er halvdelen af besværet. En reel udfordring for begyndere er at teste nulhypotesen. Det er her mange forventer vanskeligheder.
Ved hjælp af den alternative hypotesemetode, der hævder det modsatte af nulteorien, kan du sammenligne begge muligheder og vælge den rigtige. Sådan fungerer statistikker.
Lad nulhypotesen H0 og alternativ H1 derefter:
H0: c = c0;
H1: c ≠ c0.
Her er c en bestemt gennemsnitsværdi af den befolkning, der skal findes, og c0 er den givne værdi indledningsvis i forhold til hvilken hypotesen kontrolleres. Der er også et vist antal X - den gennemsnitlige værdi af den prøve, hvormed c0 bestemmes.
Så kontrollen består i at sammenligne X og c0, hvis X = c0, accepteres nulhypotesen. Hvis X ≠ c0, betragtes alternativet som antagelse ved antagelse.
Metode til tillidelse af bekræftelse
Der er den mest effektive måde, hvorpå den nulstatistiske hypotese let verificeres i praksis. Det består i at opbygge en række værdier op til 95% nøjagtighed.
Først skal du kende formlen til beregning af konfidensintervallet:
X - t * Sx ≤ c ≤ X + t * Sx,
hvor X er det oprindeligt givne tal baseret på en alternativ hypotese;
t - tabelværdier (studerende koefficient);
Sx er standardgennemsnitlig fejl, der beregnes som Sx = σ / √n, hvor tælleren er standardafvigelsen og nævneren er prøvestørrelsen.
Så antag, at situationen. Før reparation producerede transportøren 32,1 kg slutprodukter pr. Dag, og efter reparation, ifølge iværksætteren, steg effektiviteten, og transportøren, ifølge en ugentlig kontrol, begyndte at producere 39,6 kg i gennemsnit.
Nullhypotesen vil hævde, at reparationer ikke påvirkede transportørens effektivitet. En alternativ hypotese vil sige, at reparationen grundlæggende ændrede transportørens effektivitet, så dens produktivitet er forbedret.
Fra tabellen finder vi n = 7, t = 2.447, hvorfra formlen har følgende form:
39,6 - 2,447 * 4,2 ≤ s ≤ 39,6 + 2,477 * 4,2;
29,3 ≤ s ≤ 49,9.
Det viser sig, at værdien 32.1 er i intervallet, og derfor accepteres ikke den foreslåede værdi af alternativet - 39.6 - automatisk. Husk, at nulhypotesen først kontrolleres for rigtighed og derefter det modsatte.
Varianter af benægtelse
Før dette blev en sådan hypotetisk konstruktionsmulighed overvejet, hvor H0 hævder noget, og H1 tilbageviser dette. Fra hvor det var muligt at komponere et lignende system:
H0: c = c0;
H1: c ≠ c0.
Men der er to mere relaterede metoder til tilbagevenden. For eksempel angiver nulhypotesen, at en klasses gennemsnitskarakter er mere end 4,54, og alternativet vil da sige, at den gennemsnitlige karakter for den samme klasse er mindre end 4,54. Og det vil se ud som et system som dette:
H0: s ⩾ 4,54;
H1: c <4,54.
Bemærk, at nulhypotesen angiver, at værdien er større end eller lig, og den statistiske er strengt mindre. Alvorligheden af ulighedstegnet er af stor betydning!
Statistisk verifikation
En statistisk test af nulhypoteser er at bruge et statistisk kriterium. Sådanne kriterier er underlagt forskellige distributionslove.
F.eks. Er der et F-kriterium, der beregnes ved Fisher-distributionen. Der er en T-test, der oftest bruges i praksis, afhængig af den studerendes fordeling. Firkantet kriterium for Pearsons samtykke osv.
Område med accept af nulhypotesen
I algebra er der begrebet "region med tilladte værdier." Dette er et sådant segment eller et punkt på X-aksen, hvorpå der er mange statistiske værdier, hvor nullhypotesen er sand. Segmentets ekstreme punkter er kritiske værdier. Strålerne på højre og venstre side af segmentet er kritiske regioner. Hvis den fundne værdi er inkluderet i dem, tilbagevises nulteorien, og et alternativ accepteres.
Null hypotese afvisning
Nullhypotesen i statistikker er til tider et meget svimlet koncept. Under verificering kan det lave to typer fejl:
1. Afvisning af den rigtige nullhypotese. Vi betegner den første type som a = 1.
2. Accept af den falske nulhypotese. Den anden type betegnes som a = 2.
Det skal forstås, at dette ikke er de samme parametre, at udfaldet af fejl kan variere betydeligt indbyrdes og have forskellige prøver.
Et eksempel på to typer fejl
Komplekse begreber er lettere at finde ud af med et eksempel.
Under produktionen af en bestemt medicin har forskere brug for ekstrem forsigtighed, da overskridelse af dosis af en af komponenterne provoserer en høj toksicitet for det færdige lægemiddel, hvorfra patienter, der tager det, kan dø. På det kemiske niveau kan en overdosis imidlertid ikke påvises.
På grund af dette kontrolleres en lille dosis på rotter eller kaniner, inden lægemidlet sælges, ved at indgive stoffet til dem.Hvis de fleste af personer dør, må medicinen ikke sælges, hvis forsøgspersonerne er i live, må medicinen sælges på apoteker.
Det første tilfælde: medicinen var faktisk ikke giftig, men under eksperimentet blev der begået en fejl, og stoffet blev klassificeret som giftigt og må ikke sælges. A = 1.
Det andet tilfælde: I et andet eksperiment, ved kontrol af en anden batch af medicin, blev det besluttet, at stoffet ikke var giftigt, og det fik lov til at gå i salg, skønt stoffet faktisk var giftigt. A = 2.
Den første mulighed vil medføre store økonomiske omkostninger for leverandøren-iværksætteren, da du er nødt til at ødelægge hele batchet af medicin og starte fra bunden.
Den anden situation vil provokere døden hos patienter, der har købt og anvendt dette lægemiddel.
Sandsynlighedsteori
Ikke kun nul, men alle hypoteser inden for statistik og økonomi er opdelt efter betydningsniveau.
Betydningsniveau - procentdelen af fejl af den første art (afvigelse af den rigtige nullhypotese).
• det første niveau er 5% eller 0,05, det vil sige sandsynligheden for en fejl er 5 til 100 eller 1 til 20.
• det andet niveau er 1% eller 0,01, det vil sige sandsynligheden fra 1 til 100.
• det tredje niveau er 0,1% eller 0,001, sandsynligheden er 1 til 1000.
Kriterier for hypotesetest
Hvis forskere allerede har konkluderet, at nulhypotesen er korrekt, skal den testes. Dette er nødvendigt for at eliminere fejlen. Der er et grundlæggende kriterium til test af nulhypotesen, der består af flere faser:
1. Den tilladte fejlsandsynlighed P = 0,05 tages.
2. Statistikker er valgt til kriterium 1.
3. Ved den velkendte metode er området af acceptable værdier.
4. Nu værdien af statistik T.
5. Hvis T (statistik) hører til domænet for accept af nulhypotesen (som i "tillid" -metoden), betragtes antagelserne som korrekte, hvilket betyder, at nulhypotesen i sig selv forbliver sand.
Sådan fungerer statistikker. Nullhypotesen, med korrekt verifikation, vil blive accepteret eller afvist.
Det er værd at bemærke, at for almindelige iværksættere og brugere kan de første tre faser være meget vanskelige at udføre præcist, så de er tillid til af professionelle matematikere. Men 4 og 5 trin kan udføres af enhver person, der kender nok statistiske verifikationsmetoder.