Dispersijas analīze ir statistisko metožu kopums, kas paredzēts, lai pārbaudītu hipotēzes par saistību starp noteiktām pazīmēm un pētāmajiem faktoriem, kurām nav kvantitatīva apraksta, kā arī lai noteiktu faktoru ietekmes pakāpi un to mijiedarbību. Specializētajā literatūrā to bieži sauc par ANOVA (no angļu valodas nosaukuma Analysis of Var variations). Pirmoreiz šo metodi izstrādāja R. Fišers 1925. gadā.
Dispersijas analīzes veidi un kritēriji
Šo metodi izmanto, lai pētītu sakarību starp kvalitatīvajiem (nominālajiem) atribūtiem un kvantitatīvo (nepārtraukto) mainīgo. Faktiski viņš pārbauda hipotēzi, ka vairāku paraugu vidējais aritmētiskais ir vienāds. Tādējādi to var uzskatīt par parametru kritēriju vairāku paraugu centru salīdzināšanai vienlaikus. Ja šo metodi izmantojat diviem paraugiem, dispersijas analīzes rezultāti būs identiski t-studenta testa rezultātiem. Tomēr atšķirībā no citiem kritērijiem šis pētījums ļauj mums detalizētāk izpētīt problēmu.
Statistikas dispersijas analīze balstās uz likumu: apvienotās izlases noviržu kvadrātu summa ir vienāda ar grupas iekšējo noviržu un kvadrātu summu starp grupas novirzēm. Pētījumam izmanto Fišera testu, lai noteiktu atšķirību starp grupu atšķirībām no grupas iekšējām variācijām nozīmīgumu. Tomēr, lai to panāktu, paraugu normālais sadalījums un homoskedasticitāte (dispersiju vienādība) ir nepieciešami. Atšķirt viendimensiju (vienveidīgo) dispersijas analīzi no daudzdimensiju (daudzdimensiju). Pirmais apsver pētāmā daudzuma atkarību no viena atribūta, otrais - uzreiz no daudziem, kā arī ļauj noteikt attiecības starp tiem.
Faktori
Par faktoriem sauc kontrolētus apstākļus, kas ietekmē gala rezultātu. Tās līmeni vai apstrādes metodi sauc par vērtību, kas raksturo šī stāvokļa īpašo izpausmi. Šie skaitļi parasti tiek norādīti nominālā vai sērijas skalā. Bieži vien izejas vērtības mēra kvantitatīvā vai kārtējā skalā. Tad rodas problēma, sagrupējot izejas datus novērojumu sērijās, kuras atbilst aptuveni vienādām skaitliskām vērtībām. Ja grupu skaits tiek uzskatīts par pārāk lielu, novērojumu skaits tajās var būt nepietiekams, lai iegūtu ticamus rezultātus. Ja esat pieņēmis skaitli par mazu, tas var novest pie nozīmīgu pazīmju ietekmes uz sistēmu zaudēšanas. Konkrētais datu grupēšanas veids ir atkarīgs no vērtību variācijas apjoma un rakstura. Intervālu skaitu un lielumu vienvirziena analīzē visbiežāk nosaka pēc vienlīdzīgu intervālu principa vai pēc vienlīdzīgu frekvenču principa.
Dispersijas problēmu analīze
Tātad, ir gadījumi, kad jums jāsalīdzina divi vai vairāki paraugi. Tieši tad ir ieteicams izmantot dispersijas analīzi. Metodes nosaukums norāda, ka no dispersijas sastāvdaļu izpētes tiek izdarīti secinājumi. Pētījuma būtība ir tāda, ka indikatora vispārējās izmaiņas tiek sadalītas sastāvdaļās, kas atbilst katra atsevišķā faktora darbībai. Apsveriet vairākas problēmas, kuras tipiska dispersijas analīze atrisina.
1. piemērs
Darbnīcā ir virkne darbgaldu - automātiskās mašīnas, kas ražo noteiktu detaļu. Katras detaļas lielums ir nejauša vērtība, kas ir atkarīga no katras mašīnas iestatījumiem un nejaušām novirzēm, kas rodas detaļu ražošanas laikā.Ir jānosaka, vai mašīnas ir vienādi konfigurētas atbilstoši detaļu izmēru mērījumiem.
2. piemērs
Elektriskā aparāta ražošanas laikā tiek izmantots dažādu veidu izolācijas papīrs: kondensatoru, elektrisko utt. Aparātu var piesūcināt ar dažādām vielām: epoksīdsveķiem, lakām, ML-2 sveķiem utt. Noplūdes var novērst vakuumā pie augsta spiediena, karsējot. To var piesūcināt, iegremdējot lakā, zem nepārtrauktas lakas plūsmas utt. Elektrisko aparātu kopumā ielej ar noteiktu savienojumu, kuram ir vairākas iespējas. Kvalitātes rādītāji ir izolācijas dielektriskā izturība, tinuma pārkaršanas temperatūra darba režīmā un virkne citu. Pārbaudot aparātu ražošanas tehnoloģisko procesu, ir jānosaka, kā katrs no uzskaitītajiem faktoriem ietekmē aparāta darbību.
3. piemērs
Trolejbusu depo apkalpo vairākus trolejbusu maršrutus. Viņiem strādā dažāda veida trolejbusi, un braukšanas maksas iekasē 125 kontrolieri. Depo vadību interesē jautājums: kā salīdzināt katra dispečera ekonomiskos rādītājus (ieņēmumus), ņemot vērā dažādus maršrutus, dažādus trolejbusu veidus? Kā noteikt ekonomisko iespējamību atbrīvot noteikta veida trolejbusus noteiktā maršrutā? Kā noteikt pamatotas prasības ieņēmumu apmēram, ko konduktors dod katram maršrutam dažāda veida trolejbusos?
Metodes izvēles uzdevums ir iegūt maksimālu informāciju par katra faktora ietekmi uz gala rezultātu, noteikt šādas ietekmes skaitliskās īpašības, to ticamību ar viszemākajām izmaksām un pēc iespējas īsākā laikā. Šādu problēmu risināšana pieļauj dispersijas analīzes metodes.
Vienvirziena analīze
Pētījuma mērķis ir novērtēt, cik liela ir konkrētā gadījuma ietekme uz analizēto pārskatu. Vēl viens vienvirziena analīzes uzdevums var būt divu vai vairāku apstākļu salīdzināšana viens ar otru, lai noteiktu atšķirību to ietekmē uz atsaukšanu. Ja nulles hipotēze tiek noraidīta, nākamais solis būs iegūto raksturlielumu kvantitatīvs novērtējums un ticamības intervālu veidošana. Gadījumā, kad nulle hipotēze nevar izmest, to parasti pieņem un tiek izdarīts secinājums par ietekmes būtību.
Viendabīgā dispersijas analīze var kļūt par Kraskel-Wallis ranga metodes neparametrisku analogu. To izstrādāja amerikāņu matemātiķis Viljams Kraskels un ekonomists Vils Voliss 1952. gadā. Šis kritērijs tika piešķirts, lai pārbaudītu nulles hipotēzi, ka ietekme uz pētītajiem paraugiem ir vienāda ar nezināmām, bet vienādām vidējām vērtībām. Paraugu skaitam jābūt lielākam par diviem.
Jonkhier kritēriju (Jonkhier-Terpstra) patstāvīgi ierosināja holandiešu matemātiķis T. J. Terpstroms 1952. gadā un britu psihologs E. R. Jonkhier 1954. gadā. To izmanto, ja jau iepriekš ir zināms, ka pieejamās rezultātu grupas pasūta pētāmā faktora ietekmes pieaugums, ko mēra kārtējā skalā.
M - Bartleta tests, ko 1937. gadā ierosināja britu statistiķis Maurice Stevenson Bartlett, tiek izmantots, lai pārbaudītu nulles hipotēzi par vairāku normālu vispārējo populāciju, no kurām tika ņemti pētāmie paraugi, dispersiju vienādību, kam parasti ir atšķirīgi tilpumi (katra parauga skaitam jābūt vismaz četriem )
G ir Kočrena tests, kuru 1941. gadā atklāja amerikānis Viljams Gemmel Košrens. To izmanto, lai pārbaudītu nulles hipotēzi, ka normālu vispārējo populāciju dispersijas ir vienādas neatkarīgiem vienāda tilpuma paraugiem.
Neparametriskais Levenes kritērijs, ko 1960. gadā ierosināja amerikāņu matemātiķis Hovards Levene, ir alternatīva Bartletas kritērijam apstākļos, kad nav pārliecības, ka pētītie paraugi atbilst normālajam sadalījumam.
1974. gadā amerikāņu statistiķi Mortons B. Brauns un Alans B. Forsītijs ierosināja testu (Brauna-Forsīti kritērijs), kas nedaudz atšķiras no Lēvena kritērija.
Divu faktoru analīze
Saistītajiem normāli sadalītajiem paraugiem izmanto divvirzienu dispersijas analīzi. Praksē bieži tiek izmantotas sarežģītas šīs metodes tabulas, jo īpaši tās, kurās katra šūna satur datu kopumu (atkārtotus mērījumus), kas atbilst fiksētā līmeņa vērtībām. Ja pieņēmumi, kas nepieciešami divvirzienu dispersijas analīzes piemērošanai, nav izpildīti, tad tiek izmantots amerikāņu ekonomista Miltona Frīdmana 1930. gada beigās neparametriskais Frīdmena ranga kritērijs (Frīdmens, Kendals un Smits). Šis kritērijs nav atkarīgs no izplatības veida.
Tikai tiek pieņemts, ka daudzumu sadalījums ir vienāds un nepārtraukts, un tie ir savstarpēji neatkarīgi. Pārbaudot nulles hipotēzi, izvade tiek parādīta taisnstūrveida matricas formā, kurā rindas atbilst koeficienta B līmeņiem un kolonnas atbilst A. līmeņiem. Katra tabulas (bloka) šūna var būt parametru mērījumu rezultāts vienam objektam vai objektu grupai pie abu faktoru līmeņu nemainīgām vērtībām. . Šajā gadījumā atbilstošie dati tiek piegādāti kā noteikta parametra vidējās vērtības visiem pētītā parauga mērījumiem vai objektiem. Lai piemērotu izejas datu kritēriju, ir jāpāriet no tiešo mērījumu rezultātiem uz to rangu. Klasifikāciju veic katrai rindai atsevišķi, tas ir, vērtības tiek pasūtītas katrai fiksētajai vērtībai.
Lapas kritērijs (L-kritērijs), ko 1963. gadā ierosināja amerikāņu statistiķis E. B. Peidžs, ir paredzēts, lai pārbaudītu nulles hipotēzi. Lieliem paraugiem tiek izmantota lapas tuvināšana. Viņi, ievērojot attiecīgo nulles hipotēžu realitāti, ievēro parasto normālo sadalījumu. Gadījumā, ja avota tabulas rindām ir vienādas vērtības, ir jāizmanto vidējās kārtas. Turklāt secinājumu precizitāte būs sliktāka, jo vairāk būs tādu sakritību.
Q ir Kohena kritērijs, ko 1937. gadā ierosinājis V. Kohrens. To izmanto gadījumos, kad viendabīgu subjektu grupas ir pakļautas vairāk nekā diviem un kurām ir iespējamas divas atbildes - nosacīti negatīva (0) un nosacīti pozitīva (1). . Nulles hipotēze sastāv no vienādām ietekmes sekām. Divvirzienu dispersijas analīze ļauj noteikt apstrādes efektu esamību, bet neļauj noteikt, kurām ailēm šī ietekme pastāv. Lai atrisinātu šo problēmu, tiek izmantota vairāku Šefa vienādojumu metode savienotajiem paraugiem.
Daudzveidīga analīze
Daudzveidīgas dispersijas analīzes uzdevums rodas, kad ir nepieciešams noteikt divu vai vairāku apstākļu ietekmi uz noteiktu izlases mainīgo. Pētījums paredz viena atkarīga izlases veida mainīgā lieluma klātbūtni, ko mēra atšķirību vai attiecību skalā, un vairākus neatkarīgus mainīgos, no kuriem katrs ir izteikts vārdu skalā vai rangā. Datu dispersijas analīze ir diezgan attīstīta matemātiskās statistikas sadaļa, kurai ir daudz iespēju. Pētījuma koncepcija ir izplatīta gan vienfaktoriem, gan daudzfaktoriem. Tās būtība ir tāda, ka kopējā dispersija tiek sadalīta komponentos, kas atbilst noteiktai datu grupai. Katrai datu grupai ir savs modelis.Šeit mēs apsvērsim tikai pamatnoteikumus, kas nepieciešami, lai izprastu un praktiski izmantotu tā visizplatītākās iespējas.
Faktoru dispersijas analīzei nepieciešama diezgan rūpīga attieksme pret ievades datu vākšanu un noformēšanu, un jo īpaši rezultātu interpretāciju. Atšķirībā no viena faktora, kura rezultātus var patvaļīgi ievietot noteiktā secībā, divu faktoru rezultātiem ir nepieciešama sarežģītāka attēlošana. Vēl grūtāka situācija rodas, ja ir trīs, četri vai vairāk apstākļi. Tāpēc modelī reti iekļauj vairāk nekā trīs (četrus) nosacījumus. Piemērs ir rezonanses rašanās ar noteiktu elektriskā loka kapacitātes un induktivitātes vērtību; ķīmiskās reakcijas izpausme ar noteiktu elementu kopumu, no kura sistēma tiek veidota; anomālās ietekmes rašanās sarežģītās sistēmās ar noteiktu apstākļu sakritību. Mijiedarbības klātbūtne var būtiski mainīt sistēmas modeli un dažreiz izraisīt to parādību rakstura pārdomāšanu, ar kurām eksperiments nodarbojas.
Daudzveidīga dispersijas analīze ar atkārtotiem eksperimentiem
Mērījumu datus bieži var grupēt nevis pēc diviem, bet pēc lielāka skaita faktoru. Tātad, ja trolejbusu riteņu riepu kalpošanas laika dispersijas analīzi uzskatām, ņemot vērā apstākļus (ražotājs un riepu ekspluatācijas ceļš), tad kā atsevišķu nosacījumu mēs varam atšķirt sezonu, kurā riepas tiek darbinātas (proti, ziemas un vasaras režīms). Tā rezultātā mums būs jāizmanto trīs faktoru metode.
Ja ir vairāk nosacījumu, pieeja ir tāda pati kā divu faktoru analīzē. Visos gadījumos viņi cenšas vienkāršot modeli. Divu faktoru mijiedarbības parādība tik bieži neizpaužas, un trīskāršā mijiedarbība notiek tikai izņēmuma gadījumos. Tajos ietilpst mijiedarbība, par kuru ir iepriekšēja informācija, un ir pamatoti iemesli to ņemt vērā modelī. Atsevišķu faktoru izolēšanas un ņemšanas process ir samērā vienkāršs. Tāpēc bieži rodas vēlme izcelt vairāk apstākļu. To nevajadzētu aizdzīt. Jo vairāk nosacījumu, jo mazāk ticams kļūst modelis un jo lielāka ir kļūdas iespējamība. Pats modelis, kas ietver lielu skaitu neatkarīgu mainīgo, kļūst pietiekami grūti interpretējams un praktiski neizdevīgs.
Dispersijas analīzes vispārējā ideja
Statistikas dispersijas analīze ir metode, kā iegūt novērojumu rezultātus, kas ir atkarīgi no dažādiem vienlaikus pastāvošiem apstākļiem, un novērtēt to ietekmi. Kontrolētu mainīgo, kas atbilst pētāmā objekta ietekmēšanas metodei un noteiktā laika posmā iegūst noteiktu vērtību, sauc par koeficientu. Tie var būt kvalitatīvi un kvantitatīvi. Kvantitatīvo apstākļu līmeņi iegūst noteiktu vērtību skaitliskā skalā. Piemēri ir temperatūra, spiediens, vielas daudzums. Kvalitatīvie faktori ir dažādas vielas, dažādas tehnoloģiskās metodes, ierīces, pildvielas. Viņu līmeņi atbilst vārdu skalai.
Kvalitāte var ietvert arī iepakojuma materiāla veidu, zāļu formas glabāšanas apstākļus. Ir arī racionāli piedēvēt izejvielu malšanas pakāpi, granulu frakcionālo sastāvu, kuriem ir kvantitatīva nozīme, bet kurus ir grūti kontrolēt, ja tiek izmantota kvantitatīva skala. Kvalitātes faktoru skaits ir atkarīgs no zāļu formas veida, kā arī no zāļu fizikālajām un tehnoloģiskajām īpašībām. Piemēram, tabletes var iegūt no kristāliskām vielām, tieši saspiežot. Šajā gadījumā pietiek ar bīdāmo un eļļojošo vielu izvēli.
Kvalitatīvo faktoru piemēri dažāda veida zāļu formām
- Tinktūras. Ekstrakta sastāvs, ekstraktora tips, izejvielu sagatavošanas metode, ražošanas metode, filtrēšanas metode.
- Ekstrakti (šķidri, biezi, sausi). Ekstrakta sastāvs, ekstrakcijas metode, uzstādīšanas veids, ekstrakcijas līdzekļa un balasta vielu noņemšanas metode.
- Tabletes Palīgvielu, pildvielu, dezintegrantu, saistvielu, smērvielu un slīdvielu sastāvs. Tablešu ražošanas metode, apstrādes iekārtas tips. Apvalka tips un tā sastāvdaļas, plēvju veidotāji, pigmenti, krāsvielas, plastifikatori, šķīdinātāji.
- Injekcijas šķīdumi. Šķīdinātāja tips, filtrēšanas metode, stabilizatoru un konservantu veids, sterilizācijas apstākļi, ampulu iepildīšanas metode.
- Svecītes. Svecīšu bāzes sastāvs, svecīšu, pildvielu, iesaiņojuma ražošanas metode.
- Ziedes. Pamatnes sastāvs, struktūras komponenti, ziedes pagatavošanas metode, aprīkojuma veids, iepakojums.
- Kapsulas Čaumalas materiāla tips, kapsulu izgatavošanas metode, plastifikatora veids, konservants, krāsviela.
- Liniment. Pagatavošanas metode, sastāvs, aprīkojuma tips, emulgatora tips.
- Suspensijas Šķīdinātāja tips, stabilizatora tips, dispersijas metode.
Tablešu ražošanas procesā izpētīto kvalitatīvo faktoru un to līmeņu piemēri
- Cepamais pulveris. Kartupeļu ciete, baltais māls, nātrija bikarbonāta un citronskābes maisījums, bāzes magnija karbonāts.
- Saistošs šķīdums. Ūdens, cietes pasta, cukura sīrups, metilcelulozes šķīdums, hidroksipropilmetilcelulozes šķīdums, polivinilpirolidona šķīdums, polivinilspirta šķīdums.
- Slīdēšanas viela. Aerosils, ciete, talks.
- Pildviela. Cukurs, glikoze, laktoze, nātrija hlorīds, kalcija fosfāts.
- Smērviela. Stearīnskābe, polietilēnglikols, parafīns.
Dispersijas modeļu analīze valsts konkurētspējas izpētē
Viens no svarīgākajiem valsts stāvokļa novērtēšanas kritērijiem, kas novērtē tās labklājības un sociāli ekonomiskās attīstības līmeni, ir konkurētspēja, tas ir, tautsaimniecībai raksturīgais īpašību kopums, kas nosaka valsts spēju konkurēt ar citām valstīm. Nosakot valsts vietu un lomu pasaules tirgū, mēs varam izveidot skaidru nodrošināšanas stratēģiju ekonomiskā drošība starptautiskā mērogā, jo tas ir pozitīvu attiecību atslēga starp Krieviju un visiem pasaules tirgus dalībniekiem: investoriem, kreditoriem, štatu valdībām.
Lai salīdzinātu valstu konkurētspējas līmeni, valstis tiek sarindotas, izmantojot sarežģītus indeksus, kas ietver dažādus svērtos rādītājus. Šo indeksu pamatā ir galvenie faktori, kas ietekmē ekonomisko, politisko utt. Situāciju. Modeļu komplekts valsts konkurētspējas izpētei paredz daudzfaktoru statistiskās analīzes metožu izmantošanu (it īpaši dispersijas (statistikas) analīzi, ekonometrisko modelēšanu, lēmumu pieņemšanu) un ietver šādus galvenos soļus:
- Indikatoru-indikatoru sistēmas izveidošana.
- Valsts konkurētspējas rādītāju novērtēšana un prognozēšana.
- Valstu konkurētspējas rādītāju-rādītāju salīdzinājums.
Tagad apsveriet modeļa saturu katrā no šī kompleksa posmiem.
Pirmajā posmā Ar ekspertu pētījumu metožu palīdzību tiek veidots pamatots ekonomisko rādītāju-rādītāju kopums, lai novērtētu valsts konkurētspēju, ņemot vērā tās attīstības specifiku, balstoties uz starptautiskajiem reitingiem un statistikas departamentu datiem, kas atspoguļo sistēmas stāvokli kopumā un tās procesus.Šo rādītāju izvēle ir pamatota ar nepieciešamību izvēlēties tos, kas no prakses viedokļa vispilnīgāk ļauj noteikt valsts līmeni, tās investīciju pievilcību un esošo potenciālo un reālās dzīves draudu relatīvas lokalizācijas iespējas.
Galvenie starptautisko reitingu sistēmu rādītāji-rādītāji ir indeksi:
- Globālā konkurētspēja (SVK).
- Ekonomiskā brīvība (IES).
- Cilvēka attīstība (HDI).
- Korupcijas uztvere (PCI).
- Iekšējie un ārējie draudi.
- Starptautiskās ietekmes (IPMV) potenciāls.
Otrais posms Tas paredz novērtēt un prognozēt valsts konkurētspējas rādītājus atbilstoši starptautiskajiem reitingiem pētītajām 139 pasaules valstīm.
Trešais posms ietver valstu konkurētspējas salīdzināšanu, izmantojot metodes korelācijas un regresijas analīze.
Izmantojot pētījuma rezultātus, ir iespējams noteikt procesu būtību kopumā un pēc atsevišķām valsts konkurētspējas sastāvdaļām; pārbaudīt hipotēzi par faktoru ietekmi un to attiecībām ar atbilstošo nozīmīguma līmenis.
Piedāvātā modeļa kopuma ieviešana ļaus ne tikai novērtēt pašreizējo situāciju valstu konkurētspējas un investīciju pievilcības līmenī, bet arī analizēt vadības vājās vietas, novērst kļūdainus lēmumus kļūdaini un novērst krīzes attīstību valstī.