Dispersijos analizė - tai statistinių metodų rinkinys, skirtas patikrinti hipotezes apie ryšį tarp tam tikrų požymių ir tiriamų veiksnių, kurie neturi kiekybinio aprašymo, taip pat nustatyti veiksnių įtakos laipsnį ir jų sąveiką. Specializuotoje literatūroje jis dažnai vadinamas ANOVA (iš angliško pavadinimo Analysis of Var variations). Šį metodą pirmą kartą sukūrė R. Fisheris 1925 m.
Dispersijos analizės tipai ir kriterijai
Šis metodas naudojamas tiriant ryšį tarp kokybinių (vardinių) požymių ir kiekybinio (nenutrūkstamo) kintamojo. Tiesą sakant, jis patikrina hipotezę, kad kelių pavyzdžių aritmetinis vidurkis yra lygus. Taigi tai gali būti laikoma parametriniu kriterijumi lyginant kelių pavyzdžių centrus vienu metu. Jei naudosite šį metodą dviem mėginiams, dispersijos analizės rezultatai bus identiški „t-student“ testo rezultatams. Tačiau skirtingai nuo kitų kriterijų, šis tyrimas leidžia išsamiau išnagrinėti problemą.
Statistikos dispersijos analizė pagrįsta dėsniu: jungtinės imties nuokrypių kvadratų suma yra lygi grupių nuokrypių kvadratų ir grupių grupių nuokrypių kvadratų sumai. Tyrimui naudojamas Fišerio testas, norint nustatyti skirtumų tarp grupių grupių ir grupės viduje skirtumų reikšmingumą. Tačiau tam būtinos sąlygos yra normalus mėginių pasiskirstymas ir homoskedastumas (dispersijų lygybė). Atskirti vienmatės (vienmatės) dispersijos analizę ir daugiamatę (daugiamatę). Pirmasis nagrinėja tiriamo kiekio priklausomybę nuo vieno požymio, antrasis - iškart nuo daugelio, taip pat leidžia nustatyti ryšį tarp jų.
Veiksniai
Veiksniais vadinamos kontroliuojamos aplinkybės, turinčios įtakos galutiniam rezultatui. Jos apdorojimo lygis arba metodas vadinamas verte, apibūdinančia specifinį šios būklės pasireiškimą. Šie skaičiai paprastai pateikiami vardine ar nuoseklia skale. Dažnai išvesties vertės matuojamos kiekybine ar eiline skalėmis. Tuomet iškyla problema suskirstyti išvestinius duomenis į keletą stebėjimų, kurie atitinka maždaug tas pačias skaitines vertes. Jei laikoma, kad grupių skaičius yra per didelis, stebėjimų skaičius jose gali būti nepakankamas, kad būtų galima gauti patikimus rezultatus. Jei pasirinksite skaičių per mažą, tai gali prarasti reikšmingas poveikio sistemai ypatybes. Konkretus duomenų grupavimo būdas priklauso nuo verčių kitimo apimties ir pobūdžio. Intervalų skaičius ir dydis atliekant vienpusę analizę dažniausiai nustatomi remiantis vienodų intervalų principu arba vienodų dažnių principu.
Dispersijos problemų analizė
Taigi, yra atvejų, kai reikia palyginti du ar daugiau mėginių. Būtent tada tikslinga naudoti dispersijos analizę. Metodo pavadinimas rodo, kad tiriant dispersijos komponentus daromos išvados. Tyrimo esmė ta, kad bendras rodiklio pokytis yra padalijamas į sudėtines dalis, kurios atitinka kiekvieno atskiro veiksnio veikimą. Apsvarstykite keletą problemų, kurias išsprendžia tipinė dispersijos analizė.
1 pavyzdys
Dirbtuvėje yra nemažai staklių - automatų, gaminančių tam tikrą dalį. Kiekvienos dalies dydis yra atsitiktinė vertė, kuri priklauso nuo kiekvienos mašinos nustatymų ir atsitiktinių nukrypimų, kurie atsiranda gaminant dalis.Būtina nustatyti, ar mašinos yra vienodai sukonfigūruotos atsižvelgiant į dalių matmenis.
2 pavyzdys
Elektros aparato gamybos metu naudojamas įvairių tipų izoliacinis popierius: kondensatorius, elektrinis ir kt. Aparatą galima impregnuoti įvairiomis medžiagomis: epoksidine derva, laku, ML-2 derva ir kt. Nuotėkiai gali būti pašalinti vakuume esant aukštam slėgiui, kaitinant. Jį galima impregnuoti panardinant į laką, po nenutrūkstamu lako srautu ir tt Elektrinis aparatas, kaip visuma, pilamas su tam tikru junginiu, iš kurio yra keletas variantų. Kokybės rodikliai yra izoliacijos dielektrinis stipris, apvijos perkaitimo temperatūra veikiant darbo režimui ir daugybė kitų. Testuojant aparatų gamybos technologinį procesą, būtina nustatyti, kaip kiekvienas iš išvardytų veiksnių veikia aparato veikimą.
3 pavyzdys
Troleibusų depas aptarnauja kelis troleibusų maršrutus. Juose dirba įvairių tipų troleibusai, o bilietų kainas surenka 125 kontrolieriai. Depo vadovybę domina klausimas: kaip palyginti kiekvieno valdiklio ekonominius rodiklius (pajamas) atsižvelgiant į skirtingus maršrutus, skirtingus troleibusų tipus? Kaip nustatyti tam tikro maršruto troleibusų išleidimo ekonominį pagrįstumą? Kaip nustatyti pagrįstus reikalavimus pajamų sumai, kurią konduktorius atneša kiekvienam maršrutui skirtinguose troleibusų tipuose?
Metodo pasirinkimo užduotis yra kaip gauti maksimalią informaciją apie poveikį kiekvieno veiksnio galutiniam rezultatui, nustatyti tokio efekto skaitines charakteristikas, jų patikimumą mažiausiomis sąnaudomis ir per trumpiausią įmanomą laiką. Išspręskite tokias problemas, naudodamiesi dispersijos analizės metodais.
Vienetinė analizė
Tyrimu siekiama įvertinti konkretaus atvejo įtakos analizuojamai apžvalgai mastą. Kita analizės vienpusė užduotis gali būti dviejų ar daugiau aplinkybių palyginimas tarpusavyje, siekiant nustatyti jų įtakos skirtumui skirtumą. Jei negaliojanti hipotezė bus atmesta, kitas žingsnis bus kiekybinis gautų charakteristikų įvertinimas ir pasitikėjimo intervalų sudarymas. Tuo atveju, kai niekinė hipotezė negalima atsisakyti, jis paprastai priimamas ir daroma išvada apie įtakos esmę.
Vienmatė dispersijos analizė gali tapti neparametriniu Kraskelio-Walliso rango metodo analogu. Jį sukūrė amerikiečių matematikas Williamas Kraskelis ir ekonomistas Wilsonas Wallisas 1952 m. Šis kriterijus buvo paskirtas patikrinti niekinę hipotezę, kad poveikis tiriamiems mėginiams yra lygus nežinomoms, bet vienodoms vidutinėms vertėms. Mėginių skaičius turėtų būti didesnis nei du.
Jonkhier kriterijų (Jonkhier-Terpstra) savarankiškai pasiūlė olandų matematikas T. J. Terpstromas 1952 m. Ir britų psichologas E. R. Jonkhier 1954 m. Jis naudojamas, kai iš anksto žinoma, kad turimas rezultatų grupes užsako tiriamojo faktoriaus įtakos augimas, kuris matuojamas eilės skalėje.
M - Bartlett'io testas, kurį 1937 m. Pasiūlė britų statistikas Maurice'as Stevenson'as Bartlett'as, yra naudojamas norint patikrinti niekinę hipotezę apie kelių normalių bendrųjų populiacijų, iš kurių buvo paimti tirti mėginiai, dispersijų vienodumą, paprastai turinčius skirtingą tūrį (kiekvieno mėginio skaičius turėtų būti bent keturi )
G yra Cochreno testas, kurį 1941 m. Atrado amerikietis Williamas Gemmelis Cochrenas. Jis naudojamas norint patikrinti niekinę hipotezę, kad normalios bendros populiacijos dispersijos yra vienodos nepriklausomo vienodo tūrio mėginiams.
Neparametrinis Levene kriterijus, kurį 1960 m. Pasiūlė amerikiečių matematikas Howardas Levene, yra alternatyva Bartlett kriterijui tokiomis sąlygomis, kai nėra aiškumo, ar tirti mėginiai atitinka normalų pasiskirstymą.
1974 m. Amerikiečių statistikai Mortonas B. Brownas ir Alanas B. Forsytas pasiūlė testą (Browno-Forsythe'io kriterijus), kuris šiek tiek skiriasi nuo Leuveno kriterijaus.
Dviejų faktorių analizė
Sukabintiems normaliai paskirstytiems mėginiams naudojama dvipusė dispersijos analizė. Praktikoje dažnai naudojamos sudėtingos šio metodo lentelės, ypač tos, kuriose kiekvienoje ląstelėje yra duomenų rinkinys (pakartotiniai matavimai), atitinkantis fiksuotas lygio vertes. Jei neįvykdytos prielaidos, būtinos pritaikant dvipusę dispersijos analizę, naudojamas neparametrinis Friedmano rango kriterijus (Friedmanas, Kendall ir Smithas), kurį 1930 m. Pabaigoje sukūrė amerikiečių ekonomistas Miltonas Friedmanas. Šis kriterijus nepriklauso nuo paskirstymo tipo.
Tik daroma prielaida, kad kiekių pasiskirstymas yra vienodas ir nenutrūkstamas, ir jie yra vienas nuo kito nepriklausomi. Tikrinant nulinę hipotezę, išėjimas pateikiamas stačiakampės matricos pavidalu, kurioje eilutės atitinka faktoriaus B lygius, o stulpeliai atitinka A. lygius. Kiekviena lentelės ląstelė (blokas) gali būti vieno objekto ar objektų grupės parametrų matavimų rezultatas esant pastovioms abiejų veiksnių lygių vertėms. . Šiuo atveju atitinkami duomenys pateikiami kaip tam tikro parametro visų matavimų ar tiriamojo mėginio objektų vidutinės vertės. Norint pritaikyti išvesties duomenų kriterijų, būtina pereiti nuo tiesioginių matavimų rezultatų prie jų eiliškumo. Reitingas atliekamas kiekvienai eilutei atskirai, tai yra, vertės nurodomos kiekvienai fiksuotai vertei.
Puslapio kriterijus (L kriterijus), kurį 1963 m. Pasiūlė amerikietis statistikas E. B. Page, yra skirtas nulio hipotezei patikrinti. Dideliams mėginiams naudojamas apytikslis puslapis. Jie, atsižvelgiant į atitinkamų niekinių hipotezių realumą, paklūsta normaliam normaliam pasiskirstymui. Tuo atveju, kai šaltinio lentelės eilutės turi tas pačias reikšmes, būtina naudoti vidutines gretas. Be to, kuo blogesnės išvados, tuo daugiau tokių sutapimų bus.
Q yra Kochreno kriterijus, pasiūlytas 1937 m. . Nulinę hipotezę sudaro vienodi įtakos padariniai. Dvipusė dispersijos analizė leidžia nustatyti perdirbimo efektų egzistavimą, tačiau neleidžia nustatyti, kurioms stulpelėms šis poveikis egzistuoja. Šiai problemai išspręsti naudojamas daugybinių Šefo lygčių metodas susietiems mėginiams.
Daugiamatė analizė
Daugiamatės dispersijos analizės užduotis iškyla, kai reikia nustatyti dviejų ar daugiau sąlygų įtaką tam tikram atsitiktiniam kintamajam. Tyrime numatyta, kad yra vienas priklausomas atsitiktinis kintamasis, matuojamas skirtumų ar ryšių skalėje, ir keli nepriklausomi kintamieji, kurių kiekvienas išreiškiamas vardų skalėje arba rangu. Duomenų dispersijos analizė yra gana išplėtota matematinės statistikos dalis, kuri turi daug galimybių. Tyrimo koncepcija yra bendra tiek vienfaktoriams, tiek daugiafaktoriams. Jo esmė ta, kad visas dispersija yra padalinta į komponentus, o tai atitinka tam tikrą duomenų grupę. Kiekviena duomenų grupė turi savo modelį.Mes apsvarstysime tik pagrindines nuostatas, būtinas plačiausiai naudojamoms galimybėms suprasti ir praktiškai naudoti.
Veiksnių dispersijos analizei reikalingas gana kruopštus požiūris į įvestų duomenų rinkimą ir pateikimą, ypač į rezultatų aiškinimą. Skirtingai nuo vieno faktoriaus, kurio rezultatus galima savavališkai sudėti į tam tikrą seką, dviejų faktorių rezultatams reikia sudėtingesnio pateikimo. Dar sunkesnė situacija susidaro, kai yra trys, keturios ar daugiau aplinkybių. Dėl šios priežasties daugiau kaip trys (keturios) sąlygos retai įtraukiamos į modelį. Pavyzdys yra rezonanso atsiradimas esant tam tikrai elektrinio apskritimo talpos ir induktyvumo vertei; cheminės reakcijos pasireiškimas tam tikru elementų rinkiniu, iš kurio sistema yra pastatyta; anomalių padarinių atsiradimas sudėtingose sistemose su tam tikru aplinkybių sutapimu. Sąveikos buvimas gali iš esmės pakeisti sistemos modelį ir kartais priversti permąstyti reiškinių, su kuriais susiduria eksperimentatorius, pobūdį.
Daugiamatė dispersijos analizė su pakartotiniais eksperimentais
Matavimo duomenis dažnai galima sugrupuoti ne pagal du, bet pagal didesnį skaičių veiksnių. Taigi, jei troleibuso padangų padangų tarnavimo laiko dispersijos analizę įvertinsime atsižvelgiant į aplinkybes (gamintoją ir maršrutą, kuriuo eksploatuojamos padangos), tuomet galime atskirti sezoną, kuriuo padangos eksploatuojamos (būtent, žiemą ir vasarą), kaip atskirą sąlygą. Todėl turėsime atlikti trijų veiksnių metodo užduotį.
Jei yra daugiau sąlygų, požiūris yra tas pats kaip ir dviejų faktorių analizėje. Visais atvejais jie stengiasi supaprastinti modelį. Dviejų veiksnių sąveikos reiškinys nėra taip dažnai pasireiškiantis, o triguba sąveika įvyksta tik išimtiniais atvejais. Tai apima sąveiką, apie kurią yra ankstesnės informacijos, ir svarių priežasčių į ją atsižvelgti modelyje. Atskirų veiksnių atskyrimo ir į juos atsižvelgimo procesas yra gana paprastas. Todėl dažnai kyla noras išryškinti daugiau aplinkybių. Tai neturėtų būti pašalinta. Kuo daugiau sąlygų, tuo mažiau patikimas modelis tampa ir tuo didesnė klaidos tikimybė. Pats modelis, apimantis daugybę nepriklausomų kintamųjų, tampa pakankamai sunkiai interpretuojamas ir nepatogus praktiniam naudojimui.
Bendroji dispersijos analizės idėja
Statistikos dispersijos analizė yra būdas gauti stebėjimų, kurie priklauso nuo įvairių tuo pat metu egzistuojančių aplinkybių, rezultatus ir įvertinti jų poveikį. Kontroliuojamas kintamasis, kuris atitinka įtakos tyrimo objektui metodą ir per tam tikrą laiką įgyja tam tikrą vertę, vadinamas koeficientu. Jie gali būti kokybiniai ir kiekybiniai. Kiekybinių sąlygų lygiai įgyja tam tikrą reikšmę skaitine skalėje. Pavyzdžiai: temperatūra, slėgis, medžiagos kiekis. Kokybiniai veiksniai yra skirtingos medžiagos, skirtingi technologiniai metodai, prietaisai, užpildai. Jų lygiai atitinka vardų skalę.
Kokybė taip pat gali apimti pakavimo medžiagos rūšį, vaisto formos laikymo sąlygas. Taip pat racionalu priskirti žaliavų malimo laipsnį, frakcinę granulių kompoziciją, kuri turi kiekybinę reikšmę, tačiau kurią sunku kontroliuoti, jei naudojama kiekybinė skalė. Kokybės veiksnių skaičius priklauso nuo vaisto formos tipo, taip pat nuo fizikinių ir technologinių vaistinių medžiagų savybių. Pavyzdžiui, tabletes galima gauti iš kristalinių medžiagų tiesioginio suspaudimo būdu. Tokiu atveju pakanka pasirinkti stumdomas ir tepamas medžiagas.
Įvairių tipų dozavimo formų kokybiniai veiksniai
- Tinktūros. Ekstraktanto sudėtis, ekstraktoriaus rūšis, žaliavų paruošimo būdas, gamybos būdas, filtravimo metodas.
- Ekstraktai (skysti, stori, sausi). Ekstraktanto sudėtis, ekstrahavimo būdas, įrengimo tipas, ekstrahento ir balastinių medžiagų pašalinimo būdas.
- Tabletes Pagalbinių medžiagų, užpildų, dezintegruojančių medžiagų, rišiklių, tepalų ir šlifavimo medžiagų sudėtis. Tablečių gamybos būdas, apdorojimo įrangos tipas. Korpuso rūšis ir jos komponentai, plėvelės formavimo priemonės, pigmentai, dažikliai, plastifikatoriai, tirpikliai.
- Injekciniai tirpalai. Tirpiklio tipas, filtravimo būdas, stabilizatorių ir konservantų pobūdis, sterilizacijos sąlygos, ampulių užpildymo būdas.
- Žvakutės. Žvakučių bazės sudėtis, žvakučių, užpildų, pakuotės gamybos būdas.
- Tepalai. Pagrindo sudėtis, struktūriniai komponentai, tepalo paruošimo būdas, įrangos rūšis, pakuotė.
- Kapsulės Lukšto medžiagos tipas, kapsulių gamybos būdas, plastifikatoriaus rūšis, konservantas, dažiklis.
- Linimentas. Paruošimo būdas, sudėtis, įrangos tipas, emulsiklio tipas.
- Pakabos Tirpiklio tipas, stabilizatoriaus tipas, dispersinis metodas.
Kokybinių veiksnių pavyzdžiai ir jų lygiai, ištirti tablečių gamybos procese
- Kepimo milteliai. Bulvių krakmolas, baltasis molis, natrio bikarbonato ir citrinos rūgšties mišinys, bazinis magnio karbonatas.
- Įrišimo tirpalas. Vanduo, krakmolo pasta, cukraus sirupas, metilceliuliozės tirpalas, hidroksipropilmetilceliuliozės tirpalas, polivinilpirolidono tirpalas, polivinilo alkoholio tirpalas.
- Slydimo medžiaga. Aerozolis, krakmolas, talkas.
- Užpildas. Cukrus, gliukozė, laktozė, natrio chloridas, kalcio fosfatas.
- Tepalas. Stearino rūgštis, polietilenglikolis, parafinas.
Dispersijos modelių analizė tiriant valstybės konkurencingumą
Vienas iš svarbiausių kriterijų, vertinant valstybės būklę, vertinantis jos gerovės ir socialinio bei ekonominio išsivystymo lygį, yra konkurencingumas, tai yra savybė, būdinga nacionalinei ekonomikai, lemianti valstybės galimybes konkuruoti su kitomis šalimis. Išsiaiškinę valstybės vietą ir vaidmenį pasaulinėje rinkoje, galime sukurti aiškią užtikrinimo strategiją ekonominis saugumas tarptautiniu mastu, nes tai yra raktas į teigiamus Rusijos ir visų pasaulio rinkos dalyvių: investuotojų, kreditorių, valstijų vyriausybių santykius.
Norėdami palyginti šalių konkurencingumo lygį, šalys reitinguojamos pagal sudėtinius indeksus, kurie apima įvairius svertinius rodiklius. Šių indeksų pagrindas yra pagrindiniai veiksniai, turintys įtakos ekonominei, politinei ir kt. Situacijai. Valstybės konkurencingumo tyrimo modelių rinkinys numato daugiamatės statistinės analizės metodų naudojimą (visų pirma dispersijos analizę (statistiką), ekonometrinį modeliavimą, sprendimų priėmimą) ir apima šiuos pagrindinius žingsnius:
- Rodiklių-rodiklių sistemos formavimas.
- Valstybės konkurencingumo rodiklių įvertinimas ir prognozavimas.
- Valstybių konkurencingumo rodiklių-rodiklių palyginimas.
Dabar apsvarstykite kiekvieno šio komplekso etapo modelių turinį.
Pirmame etape Pasitelkiant ekspertinius tyrimo metodus, formuojamas pagrįstas valstybės konkurencingumo vertinimo rodiklių-rodiklių rinkinys, atsižvelgiant į jos plėtros specifiką, pagrįstą tarptautiniais reitingais ir statistikos departamentų duomenimis, atspindinčiais visos sistemos būklę ir jos procesus.Šių rodiklių pasirinkimas pateisinamas tuo, kad reikia parinkti tuos, kurie, atsižvelgiant į praktiką, leidžia nustatyti valstybės lygį, jos patrauklumą investicijoms ir esamų galimų bei realaus gyvenimo grėsmių santykinio lokalizavimo galimybes.
Pagrindiniai tarptautinių reitingų sistemų rodikliai-rodikliai yra šie indeksai:
- Visuotinis konkurencingumas (TVK).
- Ekonominė laisvė (IES).
- Žmogaus raida (HDI).
- Korupcijos suvokimas (VKI).
- Vidinės ir išorinės grėsmės.
- Tarptautinės įtakos (IPMV) potencialas.
Antrasis etapas Tai suteikia galimybę įvertinti ir prognozuoti valstybės konkurencingumo rodiklius pagal tarptautinius reitingus tirtose 139 pasaulio šalyse.
Trečias etapas pateikiamas valstybių konkurencingumo sąlygų palyginimas naudojant metodus koreliacijos ir regresijos analizė.
Pasinaudojus tyrimo rezultatais, galima nustatyti procesų pobūdį kaip visumą ir pagal atskirus valstybės konkurencingumo komponentus; patikrinkite veiksnių įtakos hipotezę ir jų santykį su tinkamais reikšmingumo lygis.
Siūlomo modelių rinkinio įgyvendinimas leis ne tik įvertinti esamą valstybių konkurencingumo ir investicijų patrauklumo lygio situaciją, bet ir išanalizuoti valdymo silpnybes, užkirsti kelią klaidingiems sprendimams klaidoms ir užkirsti kelią krizės išsivystymui valstybėje.