Variansanalyse er et sett med statistiske metoder designet for å teste hypoteser om forholdet mellom visse tegn og faktorene som studeres, som ikke har en kvantitativ beskrivelse, samt for å fastslå graden av påvirkning av faktorer og deres interaksjon. I den spesialiserte litteraturen kalles det ofte ANOVA (fra det engelske navnet Analyse av variasjoner). Denne metoden ble først utviklet av R. Fisher i 1925.
Typer og kriterier for variansanalyse
Denne metoden brukes til å studere forholdet mellom kvalitative (nominelle) attributter og en kvantitativ (kontinuerlig) variabel. Faktisk tester han hypotesen om at det aritmetiske gjennomsnittet av flere prøver er lik. Dermed kan det betraktes som et parametrisk kriterium for å sammenligne sentrene for flere prøver på en gang. Hvis du bruker denne metoden for to prøver, vil resultatene av variansanalyse være identiske med resultatene fra t-studenttesten. I motsetning til andre kriterier, lar denne studien oss imidlertid studere problemet mer detaljert.
Analyse av varians i statistikk er basert på loven: summen av de kvadratiske avvikene til det kombinerte prøven er summen av kvadratene for intragruppeavvikene og summen av kvadratene for mellomgruppeavvikene. For studien brukes Fisher-testen for å fastslå betydningen av forskjellen mellom intergruppevariasjoner fra interngruppevariasjoner. For dette er de nødvendige forutsetningene imidlertid normalfordeling og homoskedastisitet (like varianser) av prøvene. Skille mellom endimensjonal (univariat) variansanalyse og multivariat (multivariat). Den første vurderer avhengigheten av den studerte mengden på ett attributt, den andre - umiddelbart på mange, og lar deg også identifisere forholdet mellom dem.
faktorer
Faktorer kalles kontrollerte omstendigheter som påvirker sluttresultatet. Nivået eller behandlingsmetoden kalles verdien som kjennetegner den spesifikke manifestasjonen av denne tilstanden. Disse tallene er vanligvis gitt i en nominell eller seriell skala. Ofte blir outputverdier målt i kvantitative eller ordinære skalaer. Da oppstår problemet med å gruppere outputdataene i en serie observasjoner, som tilsvarer omtrent de samme tallverdiene. Hvis antallet grupper antas å være for stort, kan antallet observasjoner i dem være utilstrekkelig for å oppnå pålitelige resultater. Hvis du tar antallet for lite, kan dette føre til tap av betydelige funksjoner i påvirkningen på systemet. Den spesifikke måten data grupperes på, avhenger av volumet og arten av variasjonen i verdiene. Antall og størrelse på intervaller i enveisanalyse bestemmes oftest av prinsippet om like intervaller eller av prinsippet om like frekvenser.
Analyse av variansproblemer
Så det er tilfeller når du trenger å sammenligne to eller flere prøver. Det er da bruk av variansanalyse tilrådelig. Navnet på metoden indikerer at konklusjoner trekkes fra studien av komponentene i variansen. Essensen av studien er at den generelle endringen i indikatoren er delt inn i komponentdeler som tilsvarer handlingen til hver enkelt faktor. Tenk på en rekke problemer som en typisk variansanalyse løser.
Eksempel 1
Verkstedet har en rekke maskinverktøy - automatiske maskiner som produserer en bestemt del. Størrelsen på hver del er en tilfeldig verdi, som avhenger av innstillingene til hver maskin og tilfeldige avvik som oppstår under fremstillingen av deler.Det er nødvendig å bestemme om maskinene er like konfigurert i henhold til målingene av dimensjonene til delene.
Eksempel 2
Under fremstillingen av det elektriske apparatet brukes forskjellige typer isolasjonspapir: kondensator, elektrisk osv. Apparatet kan impregneres med forskjellige stoffer: epoksyharpiks, lakk, ML-2-harpiks, etc. Lekkasjer kan elimineres under vakuum ved høyt trykk, ved oppvarming. Det kan impregneres ved nedsenking i lakk, under en kontinuerlig strøm av lakk, etc. Det elektriske apparatet som helhet helles med en viss forbindelse, hvorav det er flere alternativer. Kvalitetsindikatorer er den dielektriske styrken til isolasjonen, temperaturen på overopphetingen av viklingen i driftsmodus og en rekke andre. Under testing av den teknologiske prosessen med produksjonsapparater er det nødvendig å bestemme hvordan hver av de listede faktorene påvirker ytelsen til apparatet.
Eksempel 3
Trolleybus depot serverer flere trolleybus ruter. Ulike typer trolleybusser fungerer for dem, og takstsamlingen blir samlet inn av 125 kontrollører. Depotstyringen er interessert i spørsmålet: hvordan sammenligne den økonomiske ytelsen til hver enkelt kontrollør (inntekt) under hensyntagen til forskjellige ruter, forskjellige typer trallebusser? Hvordan bestemme den økonomiske muligheten for å frigjøre en bestemt type trolleybuss på en bestemt rute? Hvordan etablere fornuftige krav til mengden inntekter som lederen bringer på hver rute i forskjellige typer trallebusser?
Oppgaven med å velge en metode er hvordan du får maksimal informasjon om innvirkningen på det endelige resultatet av hver faktor, for å bestemme de numeriske egenskapene til en slik effekt, deres pålitelighet til lavest mulig pris og på kortest mulig tid. Løs slike problemer tillat metoder for variansanalyse.
Enveis analyse
Studien tar sikte på å vurdere størrelsen på virkningen av en spesiell sak på den analyserte gjennomgangen. En annen oppgave med enveisanalyse kan være å sammenligne to eller flere omstendigheter med hverandre for å bestemme forskjellen i deres effekt på tilbakekallingen. Hvis nullhypotesen avvises, vil neste trinn være den kvantitative vurderingen og konstruksjonen av konfidensintervaller for de oppnådde karakteristikkene. I tilfelle når nullhypotese kan ikke kastes, det blir vanligvis akseptert og det trekkes en konklusjon om essensen av innflytelse.
Univariat variansanalyse kan bli en ikke-parametrisk analog til Kraskel-Wallis rangmetode. Det ble utviklet av den amerikanske matematikeren William Kraskel og økonomen Wilson Wallis i 1952. Dette kriteriet ble tildelt for å teste nullhypotesen om at virkningene på de undersøkte prøvene er like med ukjente, men like gjennomsnittlige verdier. Antall prøver bør være mer enn to.
Jonkhier-kriteriet (Jonkhier-Terpstra) ble foreslått uavhengig av den nederlandske matematikeren T.J. Terpstrom i 1952 og den britiske psykologen E.R. Jonkhier i 1954. Det brukes når det på forhånd er kjent at de tilgjengelige gruppene av resultater er bestilt av veksten av påvirkningen av den studerte faktoren, som måles i en ordinær skala.
M - Bartlett-testen, foreslått av den britiske statistikeren Maurice Stevenson Bartlett i 1937, brukes til å teste nullhypotesen om likhetstrekket i variansene i flere normale generelle populasjoner som de undersøkte prøvene ble tatt fra, generelt med forskjellige volumer (antallet av hver prøve skal være minst fire ).
G er Cochren-testen, som ble oppdaget av amerikaneren William Gemmel Cochren i 1941. Den brukes til å teste nullhypotesen om at variansene til normale generelle populasjoner er like for uavhengige prøver med like volum.
Det ikke-parametriske Levene-kriteriet, foreslått av den amerikanske matematikeren Howard Levene i 1960, er et alternativ til Bartlett-kriteriet under forhold der det ikke er sikkerhet for at de undersøkte prøvene overholder normalfordelingen.
I 1974 foreslo de amerikanske statistikerne Morton B. Brown og Alan B. Forsyth en test (Brown-Forsythe-kriteriet), som er noe annerledes enn Leuven-kriteriet.
To-faktor analyse
Toveis variansanalyse brukes for koblede normalt distribuerte prøver. I praksis brukes ofte komplekse tabeller for denne metoden, spesielt de der hver celle inneholder et sett med data (gjentatte målinger) som tilsvarer faste nivåverdier. Hvis forutsetningene som er nødvendige for å anvende toveis variansanalyse ikke blir oppfylt, brukes det ikke-parametriske Friedman rangskriteriet (Friedman, Kendall og Smith) utviklet av den amerikanske økonomen Milton Friedman i slutten av 1930. Dette kriteriet er uavhengig av distribusjonsformen.
Det antas bare at fordelingen av mengder er den samme og kontinuerlig, og de er uavhengige av hverandre. Når du tester nullhypotesen, presenteres utgangen i form av en rektangulær matrise hvor radene tilsvarer nivåene til faktor B og kolonnene tilsvarer nivåene til A. Hver celle i tabellen (blokk) kan være et resultat av målinger av parametere på ett objekt eller på en gruppe objekter med konstante verdier for nivåene til begge faktorene . I dette tilfellet blir tilsvarende data levert som gjennomsnittsverdiene for en viss parameter for alle målinger eller objekter av den undersøkte prøven. For å anvende kriteriet for utgangsdataene, er det nødvendig å bytte fra de direkte måleresultatene til deres rangering. Rangeringen utføres for hver rad separat, det vil si at verdiene er bestilt for hver faste verdi.
Sidekriterium (L-kriterium), foreslått av den amerikanske statistikeren E. B. Page i 1963, er ment å teste nullhypotesen. For store prøver brukes side-tilnærmingen. De overholder virkeligheten til de tilsvarende nullhypotesene, og følger den vanlige normalfordelingen. I tilfelle når radene i kildetabellen har de samme verdiene, er det nødvendig å bruke gjennomsnittlige rekker. Dessuten vil nøyaktigheten av konklusjonene være verre, jo mer vil det være antall slike tilfeldigheter.
Q er Cochren-kriteriet foreslått av V. Cohren i 1937. Det brukes i tilfeller der grupper av homogene personer blir utsatt for mer enn to og hvor to svar er mulig - betinget negativ (0) og betinget positive (1) . Nullhypotesen består av like effekter av innflytelse. Toveis variansanalyse gjør det mulig å bestemme eksistensen av prosesseringseffekter, men gjør det ikke mulig å fastslå for hvilke kolonner denne effekten eksisterer. For å løse dette problemet brukes metoden for flere Sheffe-ligninger for koblede prøver.
Multivariat analyse
Oppgaven med multivariat variansanalyse oppstår når det er nødvendig å bestemme påvirkningen av to eller flere forhold på en viss tilfeldig variabel. Studien sørger for tilstedeværelsen av en avhengig tilfeldig variabel, målt på skalaen mellom forskjell eller relasjoner, og flere uavhengige variabler, som hver er uttrykt i skalaen med navn eller i rang. Analyse av variansdata er en ganske utviklet del av matematisk statistikk, som har mange alternativer. Forskningskonseptet er vanlig for både enkeltfaktor og flerfaktor. Essensen er at den totale variansen er delt inn i komponenter, som tilsvarer en viss datagruppering. Hver datagruppering har sin egen modell.Her vil vi bare vurdere de grunnleggende bestemmelsene som er nødvendige for forståelse og praktisk bruk av de mest brukte alternativene.
Analyse av varians av faktorer krever en ganske nøye holdning til innsamling og presentasjon av inputdata, og spesielt til tolkning av resultatene. I motsetning til en-faktor, hvis resultater kan plasseres vilkårlig i en viss sekvens, krever to-faktor-resultatene en mer kompleks representasjon. En enda vanskeligere situasjon oppstår når det er tre, fire eller flere omstendigheter. På grunn av dette er mer enn tre (fire) forhold sjelden inkludert i en modell. Et eksempel er forekomsten av resonans ved en viss verdi av kapasitansen og induktansen til den elektriske sirkelen; manifestasjonen av en kjemisk reaksjon med et visst sett med elementer som systemet er bygget fra; forekomsten av anomale effekter i komplekse systemer med en viss sammenfall av omstendigheter. Tilstedeværelsen av samhandling kan fundamentalt endre modellen til systemet og noen ganger føre til en nytenkning av arten av fenomenene som eksperimentøren har å gjøre med.
Multivariat variansanalyse med gjentatte eksperimenter
Måledata kan ofte grupperes ikke av to, men etter et større antall faktorer. Så hvis vi vurderer analysen av variansen i levetiden til dekkene til trallebusshjulene under hensyntagen til omstendighetene (produsenten og ruten som dekkene brukes på), kan vi skille sesongen som dekkene brukes på (nemlig vinter- og sommerdrift) som en egen tilstand. Som et resultat vil vi ha oppgaven med en tre-faktor metode.
Hvis det er flere forhold, er tilnærmingen den samme som i to-faktoranalysen. I alle tilfeller prøver de å forenkle modellen. Fenomenet interaksjon mellom to faktorer manifesteres ikke så ofte, og trippel samhandling forekommer bare unntaksvis. De inkluderer samspillet som det er tidligere informasjon for, og gode grunner til å ta det med i modellen. Prosessen med å isolere enkeltfaktorer og ta hensyn til dem er relativt enkel. Derfor er det ofte et ønske om å fremheve flere omstendigheter. Dette skal ikke føres bort. Jo flere forhold, jo mindre pålitelig blir modellen, og jo større er sannsynligheten for feil. Selve modellen, som inkluderer et stort antall uavhengige variabler, blir vanskelig nok til å tolke og upraktisk for praktisk bruk.
Den generelle ideen om variansanalyse
Variansanalyse i statistikk er en metode for å oppnå resultatene av observasjoner som er avhengige av ulike samtidig eksisterende forhold, og vurdere effekten av dem. En kontrollert variabel som tilsvarer metoden for å påvirke studieobjektet og i en viss tidsperiode tilegne seg en viss verdi kalles en faktor. De kan være kvalitative og kvantitative. Nivåer av kvantitative forhold oppnår en viss verdi i en numerisk skala. Eksempler er temperatur, trykk, mengde stoff. Kvalitative faktorer er forskjellige stoffer, forskjellige teknologiske metoder, enheter, fyllstoffer. Nivåene deres tilsvarer skalaen med navn.
Kvaliteten kan også omfatte typen pakkemateriale, lagringsbetingelser for doseringsformen. Det er også rasjonelt å tillegge malingsgraden av råvarer, den brøkdelige sammensetningen av granuler som er av kvantitativ betydning, men som er vanskelige å kontrollere om en kvantitativ skala brukes. Antall kvalitetsfaktorer avhenger av type doseringsform, så vel som de fysiske og teknologiske egenskapene til medisinske stoffer. For eksempel kan tabletter oppnås fra krystallinske stoffer ved direkte kompresjon. I dette tilfellet er det nok å ta et valg av glidende og smørende stoffer.
Eksempler på kvalitative faktorer for forskjellige typer doseringsformer
- Tinkturer. Sammensetningen av ekstraksjonsmidlet, typen avtrekk, metoden for tilberedning av råvarer, produksjonsmetoden, filtreringsmetoden.
- Ekstrakter (flytende, tykk, tørr). Sammensetningen av ekstraksjonsmiddelet, ekstraksjonsmetoden, installasjonstypen, metoden for å fjerne ekstraksjonsmiddelet og ballaststoffer.
- Tabletter. Sammensetningen av hjelpestoffer, fyllstoffer, desintegreringsmidler, permer, smøremidler og glidemidler. En metode for å produsere tabletter, type prosessutstyr. Type skall og dets komponenter, filmdannere, pigmenter, fargestoffer, myknere, løsemidler.
- Injiseringsløsninger. Type løsningsmiddel, filtreringsmetode, art av stabilisatorer og konserveringsmidler, steriliseringsbetingelser, metode for fylling av ampuller.
- Stikkpiller. Sammensetningen av stikkpillerens base, en metode for å produsere stikkpiller, fyllstoffer, emballasje.
- Salve. Sammensetningen av basen, strukturelle komponenter, metoden for tilberedning av salven, type utstyr, emballasje.
- Kapsler. Type skallmateriale, metode for fremstilling av kapsler, type mykner, konserveringsmiddel, fargestoff.
- Liniment. Metoden for tilberedning, sammensetning, type utstyr, type emulgator.
- Suspensjon. Type løsningsmiddel, type stabilisator, dispersjonsmetode.
Eksempler på kvalitative faktorer og deres nivåer studert i fremstillingsprosessen av tabletter
- Bakepulver. Potetstivelse, hvit leire, en blanding av natriumbikarbonat med sitronsyre, basisk magnesiumkarbonat.
- Bindemiddelløsning. Vann, stivelsespasta, sukkersirup, metylcelluloseløsning, hydroksypropylmetylcelluloseløsning, polyvinylpyrrolidonløsning, polyvinylalkoholoppløsning.
- Glidende stoff. Aerosil, stivelse, talkum.
- Filler. Sukker, glukose, laktose, natriumklorid, kalsiumfosfat.
- Smøremiddel. Stearinsyre, polyetylenglykol, parafin.
Analyse av variansmodeller i studien av statens konkurranseevne
Et av de viktigste kriteriene for å vurdere tilstanden i staten, som vurderer nivået på dets velvære og sosioøkonomiske utvikling, er konkurranseevne, det vil si et sett med egenskaper som er iboende i den nasjonale økonomien som avgjør statens evne til å konkurrere med andre land. Etter å ha bestemt staten og rollen i det globale markedet, kan vi etablere en klar strategi for å sikre økonomisk sikkerhet internasjonalt, fordi det er nøkkelen til positive forhold mellom Russland og alle aktørene i verdensmarkedet: investorer, kreditorer, statlige myndigheter.
For å sammenligne landenes konkurranseevne blir rangerte land ved hjelp av komplekse indekser, som inkluderer forskjellige vektede indikatorer. Grunnlaget for disse indeksene er de viktigste faktorene som påvirker den økonomiske, politiske osv. Situasjonen. Et sett med modeller for å studere konkurransekraften i staten sørger for bruk av multivariate statistiske analysemetoder (spesielt analyse av varians (statistikk), økonometrisk modellering, beslutningsprosesser) og inkluderer følgende hovedtrinn:
- Dannelse av et system av indikatorer-indikatorer.
- Vurdering og prognoser av indikatorer for statens konkurranseevne.
- Sammenligning av indikatorer-indikatorer for staters konkurranseevne.
Vurder nå innholdet i modellene i hvert av trinnene i dette komplekset.
I første etappe Ved hjelp av ekspertstudiemetoder dannes et berettiget sett med økonomiske indikatorer-indikatorer for å vurdere statens konkurranseevne under hensyntagen til detaljene i dens utvikling basert på internasjonale rangeringer og data fra statistiske avdelinger som gjenspeiler tilstanden i systemet som helhet og dets prosesser.Valget av disse indikatorene begrunnes med behovet for å velge dem som mest fullstendig sett fra praksis synspunkt gjør det mulig å bestemme nivået på staten, dens investeringsattraktivitet og mulighetene for relativ lokalisering av eksisterende potensielle og virkelighetsnære trusler.
De viktigste indikatorene-indikatorene for internasjonale rangeringssystemer er indeksene:
- Global Competitivity (IGC).
- Økonomisk frihet (IES).
- Human Development (HDI).
- Oppfatninger av korrupsjon (KPI).
- Interne og eksterne trusler.
- Potensialet for internasjonal påvirkning (IPMV).
Andre etappe Den sørger for vurdering og prognoser av indikatorer for statens konkurranseevne i henhold til internasjonale rangeringer for de studerte 139 land i verden.
Tredje trinn gir en sammenligning av tilstandenes konkurranseevne ved bruk av metoder korrelasjons- og regresjonsanalyse.
Ved å bruke resultatene fra studien er det mulig å bestemme arten av prosessene som helhet og av individuelle komponenter i statens konkurranseevne; test hypotesen om påvirkning av faktorer og deres forhold til passende betydningsnivå.
Implementeringen av det foreslåtte settet med modeller vil tillate ikke bare å vurdere den nåværende situasjonen for statenes konkurranseevne og investeringsattraktivitet, men også å analysere svakhetene ved ledelsen, forhindre feil ved uriktige beslutninger og forhindre utvikling av en krise i staten.