kategorier
...

Multivariat variansanalyse

Variansanalyse er et sæt statistiske metoder designet til at teste hypoteser om forholdet mellem visse tegn og de faktorer, der undersøges, som ikke har en kvantitativ beskrivelse, samt til at bestemme graden af ​​påvirkning af faktorer og deres interaktion. I den specialiserede litteratur kaldes det ofte ANOVA (fra det engelske navn Analyse af variationer). Denne metode blev først udviklet af R. Fisher i 1925.

Typer og kriterier for analyse af varians

Denne metode bruges til at undersøge forholdet mellem kvalitative (nominelle) attributter og en kvantitativ (kontinuerlig) variabel. Faktisk tester han hypotesen om, at det aritmetiske middelværdi af flere prøver er ens. Således kan det betragtes som et parametrisk kriterium til sammenligning af centre for flere prøver på én gang. Hvis du bruger denne metode til to prøver, vil resultaterne af variansanalysen være identiske med resultaterne af t-elevtesten. I modsætning til andre kriterier giver denne undersøgelse os imidlertid mulighed for at undersøge problemet mere detaljeret.

Variansanalyse

Analyse af varians i statistik er baseret på loven: summen af ​​kvadraterne for afvigelserne for den kombinerede prøve er lig med summen af ​​kvadraterne for koncernafvigelserne og summen af ​​kvadraterne for intergruppeavvigelserne. Til undersøgelsen bruges Fisher-testen til at bestemme betydningen af ​​forskellen mellem intergruppevariationer fra intragruppeafvigelser. Til dette er de nødvendige forudsætninger imidlertid den normale fordeling og homoskedasticitet (ligevægt af variationer) af prøverne. Skelne mellem en-dimensionel (univariat) variansanalyse og multivariat (multivariat). Den første overvejer afhængigheden af ​​den studerede mængde af en attribut, den anden - straks af mange, og giver dig også mulighed for at identificere forholdet mellem dem.

faktorer

Faktorer kaldes kontrollerede omstændigheder, der påvirker slutresultatet. Dets niveau eller behandlingsmetode kaldes den værdi, der kendetegner den specifikke manifestation af denne tilstand. Disse numre er normalt angivet i en nominel eller seriel skala. Ofte måles outputværdier i kvantitative eller ordinære skalaer. Derefter opstår problemet med at gruppere outputdataene i en række observationer, der svarer til omtrent de samme numeriske værdier. Hvis antallet af grupper anses for at være for stort, kan antallet af observationer i dem muligvis være utilstrækkeligt til at opnå pålidelige resultater. Hvis du tager antallet for lille, kan dette føre til tab af betydelige egenskaber ved påvirkningen på systemet. Den specifikke måde, hvorpå data grupperes, afhænger af lydstyrken og arten af ​​variationen i værdierne. Antallet og størrelsen af ​​intervaller i envejsanalyse bestemmes ofte af princippet om lige intervaller eller af princippet om lige frekvenser.

Analyse af variansproblemer

Så der er tilfælde, hvor du har brug for at sammenligne to eller flere prøver. Det er så, at brugen af ​​variansanalyse tilrådes. Metodens navn indikerer, at der drages konklusioner fra undersøgelsen af ​​varianskomponenterne. Essensen af ​​undersøgelsen er, at den generelle ændring i indikatoren er opdelt i komponentdele, der svarer til handlingen for hver enkelt faktor. Overvej et antal problemer, som en typisk variansanalyse løser.

Eksempel 1

Værkstedet har et antal værktøjsmaskiner - automatiske maskiner, der producerer en bestemt del. Størrelsen på hver del er en tilfældig værdi, der afhænger af indstillingerne for hver maskine og tilfældige afvigelser, der opstår under fremstillingen af ​​dele.Det er nødvendigt at bestemme, om maskinerne er lige konfigureret i henhold til målinger af dimensionerne på delene.

analyse af variansmetoder

Eksempel 2

Under fremstillingen af ​​det elektriske apparat bruges forskellige typer isoleringspapir: kondensator, elektrisk osv. Apparatet kan imprægneres med forskellige stoffer: epoxyharpiks, lak, ML-2 harpiks osv. Lækager kan fjernes under vakuum ved højt tryk ved opvarmning. Det kan imprægneres ved nedsænkning i lak, under en kontinuerlig strøm af lak osv. Det elektriske apparat som helhed hældes med en bestemt forbindelse, hvoraf der er flere muligheder. Kvalitetsindikatorer er den dielektriske styrke af isoleringen, temperaturen på overophedningen af ​​viklingen i driftstilstand og et antal andre. Under testning af den teknologiske proces ved fremstillingsapparater er det nødvendigt at bestemme, hvordan hver af de anførte faktorer påvirker apparatets ydelse.

Eksempel 3

Trolleybus depot betjener flere trolleybus ruter. Forskellige typer trolleybusser fungerer for dem, og billetprisen indsamles af 125 controllere. Depotstyringen er interesseret i spørgsmålet: hvordan man sammenligner den økonomiske ydeevne for hver enkelt controller (indtægter) under hensyntagen til forskellige ruter, forskellige typer trolleybusser? Hvordan fastlægges den økonomiske gennemførlighed ved at frigive en bestemt type trolleybus på en bestemt rute? Hvordan fastlægger man rimelige krav til det indtægtsmængde, som lederen medbringer på hver rute i forskellige typer trolleybusser?

Opgaven med at vælge en metode er, hvordan man får den maksimale information om indvirkningen på det endelige resultat af hver faktor, at bestemme de numeriske egenskaber ved en sådan effekt, deres pålidelighed til de laveste omkostninger og på kortest mulig tid. Løs sådanne problemer, tillad metoder til variansanalyse.

Envejsanalyse

Undersøgelsen sigter mod at vurdere størrelsen af ​​virkningen af ​​en bestemt sag på den analyserede gennemgang. En anden opgave med envejsanalyse kan være at sammenligne to eller flere omstændigheder med hinanden for at bestemme forskellen i deres virkning på tilbagekaldelsen. Hvis nulhypotesen afvises, vil det næste trin være den kvantitative vurdering og konstruktion af konfidensintervaller for de opnåede egenskaber. I det tilfælde, hvornår nul hypotese kan ikke kasseres, det accepteres normalt, og der drages en konklusion om essensen af ​​indflydelse.

Univariat variansanalyse kan blive en ikke-parametrisk analog til Kraskel-Wallis rangmetoden. Det blev udviklet af den amerikanske matematiker William Kraskel og økonomen Wilson Wallis i 1952. Dette kriterium blev tildelt til at teste nulhypotesen om, at virkningerne på de undersøgte prøver er ens med ukendte, men lige gennemsnitlige værdier. Antallet af prøver skal være mere end to.

analyse af variansstatistikker

Jonkhier-kriteriet (Jonkhier-Terpstra) blev foreslået uafhængigt af den hollandske matematiker T.J. Terpstrom i 1952 og den britiske psykolog E.R. Jonkhier i 1954. Det bruges, når det på forhånd vides, at de tilgængelige grupper af resultater er bestilt af væksten af ​​påvirkningen af ​​den studerede faktor, der måles i en ordinal skala.

M - Bartlett-testen, foreslået af den britiske statistiker Maurice Stevenson Bartlett i 1937, bruges til at teste nulhypotesen om ligevægt af variationer i flere normale generelle populationer, hvorfra de undersøgte prøver blev udtaget, generelt med forskellige volumener (antallet af hver prøve skulle være mindst fire ).

G er Cochren-testen, som blev opdaget af amerikaneren William Gemmel Cochren i 1941. Den bruges til at teste nulhypotesen om, at variationerne i normale generelle populationer er ens for uafhængige prøver med samme volumen.

Det ikke-parametriske Levene-kriterium, der blev foreslået af den amerikanske matematiker Howard Levene i 1960, er et alternativ til Bartlett-kriteriet under forhold, hvor der ikke er sikkerhed for, at de studerede prøver overholder den normale distribution.

I 1974 foreslog de amerikanske statistikere Morton B. Brown og Alan B. Forsyth en test (Brown-Forsythe-kriteriet), som er noget anderledes end Leuven-kriteriet.

To-faktor analyse

To-vejs variansanalyse anvendes til koblede normalt distribuerede prøver. I praksis bruges ofte komplekse tabeller til denne metode, især dem, hvor hver celle indeholder et sæt data (gentagne målinger) svarende til faste niveauværdier. Hvis de antagelser, der er nødvendige for at anvende to-vejs variansanalyse, ikke er opfyldt, anvendes det ikke-parametriske Friedman-rangskriterium (Friedman, Kendall og Smith) udviklet af den amerikanske økonom Milton Friedman i slutningen af ​​1930. Dette kriterium er uafhængigt af distributionstypen.

Det antages kun, at fordelingen af ​​mængder er den samme og kontinuerlig, og de er uafhængige af hinanden. Ved test af nulhypotesen præsenteres output i form af en rektangulær matrix, hvor rækkerne svarer til niveauerne af faktor B, og søjlerne svarer til niveauer af A. Hver celle i tabellen (blok) kan være resultatet af målinger af parametre på et objekt eller på en gruppe af objekter ved konstante værdier af niveauerne for begge faktorer . I dette tilfælde leveres de tilsvarende data som gennemsnitsværdierne for en bestemt parameter for alle målinger eller objekter af den studerede prøve. For at anvende kriteriet for outputdataene er det nødvendigt at skifte fra de direkte måleresultater til deres rang. Rangeringen udføres for hver række separat, dvs. værdierne ordnes for hver fast værdi.

analyse af varians i statistik

Sidekriterium (L-kriterium), foreslået af den amerikanske statistiker E. B. Page i 1963, er beregnet til at teste nulhypotesen. Ved store prøver bruges side-tilnærmelsen. De overholder virkeligheden i de tilsvarende nulhypoteser og adlyder den normale normalfordeling. I tilfælde af, at rækkerne i kildetabellen har de samme værdier, er det nødvendigt at bruge gennemsnitlige rækker. Konklusionernes nøjagtighed vil desuden være værre, jo mere vil der være antallet af sådanne tilfældigheder.

Q er Cochren-kriteriet foreslået af V. Cohren i 1937. Det bruges i tilfælde, hvor grupper af homogene individer udsættes for mere end to, og som to svar er mulige - betinget negativ (0) og betinget positive (1) . Nullhypotesen består af lige effekter af indflydelse. To-vejs variansanalyse gør det muligt at bestemme eksistensen af ​​behandlingseffekter, men gør det ikke muligt at bestemme, for hvilke kolonner denne effekt findes. For at løse dette problem bruges metoden med flere Sheffe-ligninger for koblede prøver.

Multivariat analyse

Opgaven med multivariat variansanalyse opstår, når det er nødvendigt at bestemme påvirkningen af ​​to eller flere betingelser på en bestemt tilfældig variabel. Undersøgelsen sørger for tilstedeværelsen af ​​en afhængig tilfældig variabel, målt på skalaen mellem forskel eller relation, og flere uafhængige variabler, som hver udtrykkes i skalaen med navne eller i rang. Analyse af variansdata er et forholdsvis udviklet afsnit af matematiske statistikker, der har mange muligheder. Forskningskonceptet er almindeligt for både enkeltfaktor og multifaktor. Essensen er, at den totale varians er opdelt i komponenter, der svarer til en bestemt datagruppering. Hver datagruppering har sin egen model.Her vil vi kun overveje de grundlæggende bestemmelser, der er nødvendige for forståelse og praktisk anvendelse af dens mest anvendte muligheder.

envejsanalyse af varians

Analyse af varians af faktorer kræver en temmelig omhyggelig holdning til indsamling og præsentation af inputdata, og især til fortolkningen af ​​resultaterne. I modsætning til en faktor, hvis resultater kan placeres vilkårligt i en bestemt sekvens, kræver tofaktorresultaterne en mere kompleks repræsentation. En endnu vanskeligere situation opstår, når der er tre, fire eller flere omstændigheder. På grund af dette er mere end tre (fire) forhold sjældent inkluderet i en model. Et eksempel er forekomsten af ​​resonans ved en bestemt værdi af den elektriske cirkels kapacitet og induktans; manifestationen af ​​en kemisk reaktion med et vist sæt elementer, hvorfra systemet er bygget; forekomsten af ​​anomale effekter i komplekse systemer med et vist sammenfald af omstændigheder. Tilstedeværelsen af ​​interaktion kan fundamentalt ændre systemets model og undertiden føre til en genovervejelse af arten af ​​de fænomener, som eksperimentatoren har at gøre med.

Multivariat variansanalyse med gentagne eksperimenter

Måledata kan ofte grupperes ikke efter to, men efter et større antal faktorer. Så hvis vi overvejer analysen af ​​variansen i levetiden på dækene til trolleybushjulene under hensyntagen til omstændighederne (fabrikanten og ruten, hvorpå dækkene kører), kan vi skelne mellem sæsonen, hvor dækkene køres (nemlig vinter- og sommerdrift) som en separat betingelse. Som et resultat vil vi have opgaven med en tre-faktor metode.

Hvis der er flere betingelser, er fremgangsmåden den samme som i to-faktoranalysen. I alle tilfælde forsøger de at forenkle modellen. Fænomenet interaktion mellem to faktorer manifesteres ikke så ofte, og tredobbelt interaktion optræder kun i ekstraordinære tilfælde. De inkluderer den interaktion, som der er tidligere informationer om, og gode grunde til at tage dem i betragtning i modellen. Processen med at isolere individuelle faktorer og tage dem i betragtning er relativt enkel. Derfor er der ofte et ønske om at fremhæve flere omstændigheder. Dette bør ikke føres væk. Jo flere forhold, jo mindre pålidelig bliver modellen, og jo større er sandsynligheden for fejl. Selve modellen, der inkluderer et stort antal uafhængige variabler, bliver vanskelig nok til at fortolke og upraktisk til praktisk brug.

Den generelle idé om variansanalyse

Variansanalyse i statistikker er en metode til at opnå resultaterne af observationer, der er afhængige af forskellige samtidige eksisterende omstændigheder, og vurdere deres indvirkning. En kontrolleret variabel, der svarer til metoden til at påvirke studieobjektet og i en bestemt tidsperiode erhverve en bestemt værdi kaldes en faktor. De kan være kvalitative og kvantitative. Niveauer af kvantitative betingelser får en bestemt værdi i en numerisk skala. Eksempler er temperatur, tryk, mængde stof. Kvalitative faktorer er forskellige stoffer, forskellige teknologiske metoder, enheder, fyldstoffer. Deres niveauer svarer til navnestørrelsen.

variansanalyse

Kvaliteten kan også omfatte typen af ​​emballagemateriale, opbevaringsbetingelser for doseringsformen. Det er også rationelt at tilskrive graden af ​​slibning af råmaterialer, den fraktionerede sammensætning af granuler, der er af kvantitativ betydning, men som er vanskelige at kontrollere, hvis der anvendes en kvantitativ skala. Antallet af kvalitetsfaktorer afhænger af dosisformen, såvel som de fysiske og teknologiske egenskaber af medicinske stoffer. For eksempel kan tabletter opnås fra krystallinske stoffer ved direkte kompression. I dette tilfælde er det nok at vælge et valg af glide- og smørestoffer.

Eksempler på kvalitative faktorer for forskellige typer doseringsformer

  • Tinkturer. Ekstraktionsmiddelets sammensætning, typen af ​​ekstraktionsmiddel, fremgangsmåden til fremstilling af råmaterialer, produktionsmetoden, filtreringsmetoden.
  • Ekstrakter (flydende, tyk, tør). Ekstraktionsmiddelets sammensætning, ekstraktionsmetoden, installationstypen, fremgangsmåden til fjernelse af ekstraktionsmidlet og ballaststoffer.
  • Tabletter. Sammensætningen af ​​hjælpestoffer, fyldstoffer, desintegreringsmidler, bindemidler, smøremidler og glidemidler. En metode til fremstilling af tabletter, type behandlingsudstyr. Type shell og dets bestanddele, filmdannere, pigmenter, farvestoffer, blødgørere, opløsningsmidler.
  • Injektionsløsninger. Type opløsningsmiddel, filtreringsmetode, art af stabilisatorer og konserveringsmidler, steriliseringsbetingelser, metode til påfyldning af ampuller.
  • Suppositorier. Sammensætningen af ​​suppositoriumbasen, en metode til fremstilling af suppositorier, fyldstoffer, emballering.
  • Salve. Sammensætningen af ​​basen, strukturelle komponenter, metoden til forberedelse af salven, typen af ​​udstyr, emballering.
  • Kapsler. Type shell-materiale, metode til fremstilling af kapsler, type blødgører, konserveringsmiddel, farvestof.
  • Liniments. Fremgangsmåde til fremstilling, sammensætning, type udstyr, type emulgator.
  • Suspension. Type opløsningsmiddel, type stabilisator, dispersionsmetode.

Eksempler på kvalitative faktorer og deres niveauer undersøgt i fremstillingsprocessen for tabletter

  • Bagepulver. Kartoffelstivelse, hvid ler, en blanding af natriumbicarbonat med citronsyre, basisk magnesiumcarbonat.
  • Bindende opløsning. Vand, stivelsespasta, sukker sirup, methylcelluloseopløsning, hydroxypropylmethylcelluloseopløsning, polyvinylpyrrolidonopløsning, polyvinylalkoholopløsning.
  • Glidende stof. Aerosil, stivelse, talkum.
  • Filler. Sukker, glukose, lactose, natriumchlorid, calciumphosphat.
  • Smøremiddel. Stearinsyre, polyethylenglycol, paraffin.

Analyse af variansmodeller i studiet af statens konkurrenceevne

Et af de vigtigste kriterier for vurdering af statens tilstand, som vurderer niveauet for dets velbefindende og socioøkonomiske udvikling, er konkurrenceevne, det vil sige et sæt egenskaber, der er iboende i den nationale økonomi, som bestemmer statens evne til at konkurrere med andre lande. Når vi har bestemt statens plads og rolle på det globale marked, kan vi etablere en klar strategi til at sikre økonomisk sikkerhed internationalt, fordi det er nøglen til positive forbindelser mellem Rusland og alle aktører på verdensmarkedet: investorer, kreditorer, statslige regeringer.

For at sammenligne landenes konkurrenceevne rangeres lande ved hjælp af komplekse indekser, der inkluderer forskellige vægtede indikatorer. Grundlaget for disse indekser er de vigtigste faktorer, der påvirker den økonomiske, politiske osv. Situation. Et sæt modeller til undersøgelse af statens konkurrenceevne giver mulighed for anvendelse af multivariate statistiske analysemetoder (især analyse af varians (statistik), økonometrisk modellering, beslutningstagning) og inkluderer følgende hovedtrin:

  1. Dannelse af et system af indikatorer-indikatorer.
  2. Evaluering og prognoser af indikatorer for statens konkurrenceevne.
  3. Sammenligning af indikatorer-indikatorer for staternes konkurrenceevne.

Overvej nu indholdet af modellerne i hvert af trinene i dette kompleks.

I den første fase Ved hjælp af ekspertstudiemetoder dannes et berettiget sæt økonomiske indikatorer-indikatorer til vurdering af statens konkurrenceevne under hensyntagen til dets specifikationer for dets udvikling baseret på internationale ratings og data fra statistiske afdelinger, der afspejler status for systemet som helhed og dets processer.Valget af disse indikatorer er berettiget af behovet for at vælge dem, der mest fuldt ud set fra praksis gør det muligt at bestemme niveauet for staten, dets investeringsattraktivitet og mulighederne for relativ lokalisering af eksisterende potentielle og virkelige livstrusler.

dataanalyse af varians

De vigtigste indikatorer-indikatorer for internationale ratingsystemer er indekserne:

  1. Global konkurrenceevne (IGC).
  2. Økonomisk frihed (IES).
  3. Human Development (HDI).
  4. Opfattelse af korruption (CPI).
  5. Interne og eksterne trusler.
  6. Potentialet for international indflydelse (IPMV).

Anden etape Det giver mulighed for vurdering og forudsigelse af indikatorer for statens konkurrenceevne i henhold til internationale ratings for de studerede 139 lande i verden.

Tredje fase giver en sammenligning af betingelserne for konkurrenceevne for stater ved hjælp af metoder korrelations- og regressionsanalyse.

Ved hjælp af resultaterne af undersøgelsen er det muligt at bestemme arten af ​​processerne som helhed og af individuelle komponenter i statens konkurrenceevne; test hypotesen om påvirkning af faktorer og deres forhold til passende signifikansniveau.

Implementeringen af ​​det foreslåede sæt modeller vil ikke kun give mulighed for at vurdere den aktuelle situation for staternes konkurrenceevne og investeringsattraktivitet, men også til at analysere ledelsens svagheder, forhindre fejl i forkerte beslutninger og forhindre udviklingen af ​​en krise i staten.


1 kommentar
show:
ny
ny
Populære
drøftet
×
×
Er du sikker på, at du vil slette kommentaren?
Slet
×
Årsag til klage
Avatar
SPSS
Vigtige problemer, der opstår, når resultaterne af variansanalysen fortolkes, inkluderer interaktioner, faktorers relative betydning og flere sammenligninger.
svar
0

forretning

Succeshistorier

udstyr