Ang istatistika ay isang kumplikadong agham ng pagsukat at pagsusuri ng iba't ibang data. Tulad ng sa maraming iba pang mga disiplina, ang konsepto ng isang hypothesis ay umiiral sa industriya na ito. Kaya, ang isang hypothesis sa istatistika ay isang posisyon na dapat tanggapin o tanggihan. Bukod dito, sa industriya na ito mayroong maraming mga uri ng naturang mga pagpapalagay, na katulad ng kahulugan, ngunit naiiba sa kasanayan. Ang null hypothesis ay paksa ng pag-aaral ngayon.
Mula sa pangkalahatan hanggang sa partikular: mga hypotheses sa mga istatistika
Ang isa pa, hindi gaanong mahalaga, ay lumayo mula sa pangunahing kahulugan ng mga pagpapalagay - ang istatistika na teorya ay ang pag-aaral ng pangkalahatang kabuuan ng mga bagay na mahalaga para sa agham, tungkol sa kung saan ang mga siyentipiko ay gumawa ng mga konklusyon. Maaari itong suriin gamit ang isang sample (bahagi ng populasyon). Narito ang ilang mga halimbawa ng mga statistical hypotheses:
1. Ang pagganap ng buong klase ay maaaring nakasalalay sa antas ng edukasyon ng bawat mag-aaral.
2. Ang paunang kurso ng matematika ay pantay na nakuha ng parehong mga bata na nag-aaral sa 6 na taong gulang at mga bata na dumating sa 7.
Sa mga istatistika, ang isang simpleng hypothesis ay tinatawag na tulad ng isang palagay, na natatanging katangian ng isang tiyak na parameter ng isang dami na kinuha ng isang siyentipiko.
Binubuo ang kumplikado ng ilan o isang walang hanggan bilang ng simple. Ipahiwatig ang isang tiyak na lugar o hindi isang eksaktong sagot.
Ito ay kapaki-pakinabang upang maunawaan ang ilang mga kahulugan ng mga hypotheses sa mga istatistika upang hindi malito ang mga ito sa pagsasanay.
Ang konsepto ng null hypothesis
Ang null hypothesis ay isang teorya na mayroong ilang dalawang pinagsama-sama na hindi naiiba sa bawat isa. Gayunpaman, sa antas ng pang-agham ay walang konsepto ng "hindi magkakaiba", ngunit mayroong "ang pagkakapareho nila ay zero." Mula sa kahulugan na ito nabuo ang konsepto. Sa mga istatistika, ang null hypothesis ay itinalaga bilang H0. Bukod dito, ang matinding halaga ng imposible (hindi malamang) ay itinuturing na mula sa 0.01 hanggang 0.05 o mas kaunti.
Mas mahusay na maunawaan kung ano ang null hypothesis, isang halimbawa mula sa buhay ay makakatulong. Iminungkahi ng guro sa unibersidad na ang magkakaibang antas ng paghahanda ng mga mag-aaral ng dalawang pangkat para sa gawain sa pagsubok ay sanhi ng hindi gaanong mga parameter, mga random na kadahilanan na hindi nakakaapekto sa pangkalahatang antas ng edukasyon (ang pagkakaiba sa paghahanda ng dalawang pangkat ng mga mag-aaral ay zero).
Gayunpaman, sulit na magbigay ng isang halimbawa ng isang alternatibong hypothesis - isang palagay na tinatanggihan ang pahayag ng zero theory (H1). Halimbawa: iminungkahi ng direktor ng unibersidad na ang magkakaibang antas sa paghahanda sa gawaing pagsubok para sa mga mag-aaral ng dalawang pangkat ay sanhi ng paggamit ng iba't ibang mga pamamaraan ng pagtuturo ng mga guro (ang pagkakaiba sa paghahanda ng dalawang pangkat ay makabuluhan at mayroong paliwanag).
Ngayon ay makikita mo agad ang pagkakaiba sa pagitan ng mga konsepto ng "null hypothesis" at "alternatibong hypothesis". Ang mga halimbawa ay naglalarawan ng mga konsepto na ito.
Pagsubok ng Hipotesis
Upang lumikha ng isang palagay ay kalahati ng problema. Ang isang tunay na hamon para sa mga nagsisimula ay ang pagsubok sa null hypothesis. Narito na maraming inaasahan ang mga paghihirap.
Gamit ang alternatibong paraan ng hypothesis, na inaangkin ang kabaligtaran ng teorya ng zero, maaari mong ihambing ang parehong mga pagpipilian at piliin ang tama. Ito ay kung paano gumagana ang mga istatistika.
Hayaan ang null hypothesis H0, at ang kahaliling H1, kung gayon:
H0: c = c0;
H1: c ≠ c0.
Narito c ay isang tiyak na average na halaga ng populasyon na matatagpuan, at ang c0 ay ang ibinigay na halaga sa una, na may kaugnayan kung saan nasuri ang hypothesis. Mayroon ding isang tiyak na bilang X - ang average na halaga ng sample na kung saan ang c0 ay tinutukoy.
Kaya, ang tseke ay binubuo sa paghahambing ng X at c0, kung X = c0, pagkatapos ay tinatanggap ang null hypothesis. Kung X ≠ c0, kung gayon sa pamamagitan ng pag-aakala ang kahalili ay itinuturing na totoo.
Mga Pamamaraan sa Pagpapatunay ng Pag-verify
Mayroong ang pinaka-epektibong paraan kung saan ang null statistical hypothesis ay madaling mapatunayan sa pagsasanay. Ito ay binubuo sa pagbuo ng isang hanay ng mga halaga hanggang sa 95% kawastuhan.
Una kailangan mong malaman ang formula para sa pagkalkula ng agwat ng kumpiyansa:
X - t * Sx ≤ c ≤ X + t * Sx,
kung saan ang X ay ang unang ibinigay na numero batay sa isang alternatibong hypothesis;
t - tabular na halaga (koepisyent ng mag-aaral);
Ang Sx ay ang karaniwang average na error, na kinakalkula bilang Sx = σ / √n, kung saan ang numumer ay ang karaniwang paglihis at ang denominador ay ang laki ng halimbawang.
Kaya, ipagpalagay ang sitwasyon. Bago ang pag-aayos, ang conveyor ay gumawa ng 32.1 kg ng mga pangwakas na produkto bawat araw, at pagkatapos ng pag-aayos, ayon sa negosyante, ang pagtaas ng kahusayan, at ang conveyor, ayon sa isang lingguhang tseke, ay nagsimulang gumawa ng 39.6 kg nang average.
Ang null hypothesis ay magtaltalan na ang pag-aayos ay hindi nakakaapekto sa kahusayan ng conveyor. Sasabihin ng isang alternatibong hypothesis na ang panloob na pag-aayos ay nagbago sa kahusayan ng conveyor, kaya napabuti ang pagiging produktibo nito.
Mula sa talahanayan nahanap namin ang n = 7, t = 2,447, mula kung saan kukunin ang formula sa sumusunod na form:
39.6 - 2.447 * 4.2 ≤ s ≤ 39.6 + 2.477 * 4.2;
29.3 ≤ s ≤ 49.9.
Ito ay lumiliko na ang halaga 32.1 ay nasa saklaw, at samakatuwid, ang halaga na iminungkahi ng kahalili - 39.6 - ay hindi awtomatikong tinatanggap. Tandaan na ang null hypothesis ay sinuri muna para sa kawastuhan, at pagkatapos ay kabaligtaran.
Mga pagkakaiba-iba ng pagtanggi
Bago ito, isinasaalang-alang ang tulad ng isang pagpipilian sa konstruksiyon ng hypothesis, kung saan inaangkin ng H0 ang isang bagay, at tinanggihan ito ng H1. Saan maaaring magkaroon ng ganitong sistema mula sa:
H0: c = c0;
H1: c ≠ c0.
Ngunit mayroong dalawang higit pang mga kaugnay na pamamaraan ng refutation. Halimbawa, ang null hypothesis ay nagsasabi na ang average na marka ng marka ng isang klase ay mas malaki kaysa sa 4.54, habang ang kahalili pagkatapos ay nagsasabi na ang average na grado ng parehong grado ay mas mababa sa 4.54. At magiging katulad ito ng isang sistema:
H0: s ⩾ 4.54;
H1: c <4.54.
Tandaan na ang null hypothesis ay nagsasabi na ang halaga ay mas malaki kaysa o katumbas, at ang istatistika ay mahigpit na mas mababa. Ang kalubhaan ng hindi pagkakapantay-pantay na tanda ay may malaking kahalagahan!
Pag-verify ng istatistika
Ang isang pagsubok na istatistika ng mga null hypotheses ay ang paggamit ng isang statiter criterion. Ang nasabing pamantayan ay napapailalim sa iba't ibang mga batas sa pamamahagi.
Halimbawa, mayroong isang F-criterion, na kinakalkula ng pamamahagi ng Fisher. Mayroong isang pagsubok na T, na kadalasang ginagamit sa pagsasanay, depende sa pamamahagi ng mag-aaral. Criterion ng square para sa pahintulot ni Pearson, atbp.
Lugar ng pagtanggap ng null hypothesis
Sa algebra mayroong konsepto ng "rehiyon ng pinahihintulutang mga halaga." Ito ay tulad ng isang segment o punto sa X axis, kung saan maraming mga istatistika ng mga istatistika kung saan ang null hypothesis ay totoo. Ang matinding puntos ng segment ay mga kritikal na halaga. Ang mga sinag sa kanan at kaliwang bahagi ng segment ay mga kritikal na rehiyon. Kung ang nahanap na halaga ay kasama sa kanila, kung gayon ang teorya ng zero ay pinabulaanan at tinatanggap ang isang kahalili.
Null hypothesis rebuttal
Ang null hypothesis sa mga istatistika ay paminsan-minsan isang napaka-dodgy konsepto. Sa panahon ng pag-verify, maaari itong gumawa ng dalawang uri ng mga error:
1. Ang pagtanggi ng totoong null hypothesis. Ipinapahiwatig namin ang unang uri bilang isang = 1.
2. Ang pagtanggap ng maling null hypothesis. Ang pangalawang uri ay ipinapahiwatig bilang isang = 2.
Dapat itong maunawaan na ang mga ito ay hindi magkatulad na mga parameter, ang mga kinalabasan ng mga pagkakamali ay maaaring magkakaiba nang malaki sa kanilang sarili at magkaroon ng iba't ibang mga sample.
Isang halimbawa ng dalawang uri ng mga pagkakamali
Ang mga kumplikadong konsepto ay mas madaling malaman kung may isang halimbawa.
Sa panahon ng paggawa ng isang tiyak na gamot, ang mga siyentipiko ay nangangailangan ng matinding pag-iingat, dahil lumampas sa dosis ng isa sa mga sangkap na nagpapasiklab ng isang mataas na antas ng pagkakalason ng tapos na gamot, mula sa kung saan ang mga pasyente na kumukuha nito ay maaaring mamatay. Gayunpaman, sa antas ng kemikal, ang isang labis na dosis ay hindi maaaring makita.
Dahil dito, bago ilabas ang gamot na ipinagbebenta, isang maliit na dosis ang nasuri sa mga daga o kuneho sa pamamagitan ng pangangasiwa ng gamot sa kanila.Kung ang karamihan sa mga paksa ay namatay, kung gayon ang gamot ay hindi pinapayagan na ibenta, kung ang mga pang-eksperimentong paksa ay buhay, kung gayon ang gamot ay pinapayagan na ibenta sa mga parmasya.
Ang unang kaso: sa katunayan, ang gamot ay hindi nakakalason, ngunit sa panahon ng eksperimento ang isang pagkakamali ay nagawa at ang gamot ay inuri bilang nakakalason at hindi pinapayagan na ibenta. A = 1.
Ang pangalawang kaso: sa isa pang eksperimento, kapag sinuri ang isa pang batch ng gamot, napagpasyahan na ang gamot ay hindi nakakalason, at pinapayagan itong ibenta, bagaman sa katunayan ang gamot ay nakakalason. A = 2.
Ang unang pagpipilian ay magkakaloob ng malaking gastos sa pananalapi para sa supplier-negosyante, dahil kailangan mong sirain ang buong pangkat ng gamot at magsimula mula sa simula.
Ang pangalawang sitwasyon ay magpapasigla sa pagkamatay ng mga pasyente na bumili at gumamit ng gamot na ito.
Teorya ng posibilidad
Hindi lamang zero, ngunit ang lahat ng mga hypotheses sa mga istatistika at ekonomiya ay nahahati sa antas ng kabuluhan.
Antas ng kahalagahan - ang porsyento ng mga pagkakamali ng unang uri (paglihis ng tunay na null hypothesis).
• ang unang antas ay 5% o 0.05, iyon ay, ang posibilidad ng isang pagkakamali ay 5 hanggang 100 o 1 hanggang 20.
• ang pangalawang antas ay 1% o 0.01, iyon ay, ang posibilidad ay 1 hanggang 100.
• ang pangatlong antas ay 0.1% o 0.001, ang posibilidad ay 1 hanggang 1000.
Mga Pamantayan sa Pagsubok sa Hipotesis
Kung natapos na ng mga siyentipiko na tama ang null hypothesis, dapat itong masuri. Ito ay kinakailangan upang maalis ang error. Mayroong isang pangunahing criterion para sa pagsubok sa null hypothesis, na binubuo ng ilang mga yugto:
1. Ang pinahihintulutang error na error P = 0.05 ay nakuha.
2. Napili ang mga istatistika para sa criterion 1.
3. Sa pamamagitan ng kilalang pamamaraan ay ang saklaw ng mga katanggap-tanggap na halaga.
4. Ngayon ang halaga ng mga istatistika T.
5. Kung ang T (istatistika) ay kabilang sa domain ng pagtanggap ng null hypothesis (tulad ng "tiwala" na pamamaraan), kung gayon ang mga pagpapalagay ay itinuturing na tama, na nangangahulugan na ang null hypothesis mismo ay nananatiling totoo.
Ito ay kung paano gumagana ang mga istatistika. Ang null hypothesis, na may wastong pag-verify, tatanggapin o tatanggihan.
Kapansin-pansin na para sa mga ordinaryong negosyante at mga gumagamit, ang unang tatlong yugto ay maaaring napakahirap upang maisagawa nang tumpak, kaya't pinagkakatiwalaan sila ng mga propesyonal na matematika. Ngunit ang mga yugto ng 4 at 5 ay maaaring isagawa ng sinumang tao na nakakaalam ng sapat na mga istatistikong pamamaraan ng pagpapatunay.