Spredningsmåling innen statistikk

september 12, 2019
Spredningsmåling er viktig i enhver statistisk studie når du prøver å trekke konklusjoner fra data. Dette er fordi det spiller en direkte rolle på feilmarginen du jobber med.

Spredningsmåling spiller en viktig rolle innen ethvert datasett. Disse målingene følger målingene av sentraltendens og viser variasjonen i dataene dine. 

Målinger av sentraltendens vil vise deg de forskjellige måtene du kan gruppere dataene dine på. De er bra for å finne ut hvordan de forskjellige variablene fungerer i en bestemt prøve eller en gruppe mennesker. De tre grunnleggende tingene de kan fortelle deg er medianen, gjennomsnittet og variasjonsbredden.

Spredningsmåling går hånd i hånd med målingene av sentraltendens. Det er også grunnleggende for å lese et hvilket som helst datasett, fordi det viser deg hvor variable dataene dine er. Dets viktige rolle i statistikk har blitt forsterket av Wild og Pfannkuch (1999).

Ifølge dem, er vår oppfatning av variasjon i data en av de grunnleggende komponentene i statistisk tenking. Måten vi oppfatter variabiliteten på, gir oss informasjon om spredning av dataene, i form av et gjennomsnitt eller en median.

Et gjennomsnitt er veldig vanlig i statistikk. Det er imidlertid fort gjort å tolke dem feil. Dette skjer spesifikt når det er en bred spredning av verdier i variabelen. Det er her spredningsmåling kommer i spill (2).

Det er tre viktige komponenter innen spredningsmålinger som er relatert til tilfeldig variasjon (2):

  • Oppfatningen av hvor vanlige de er i verden rundt deg.
  • Om det finnes konkurrerende forklaringer.
  • Evnen til å tallfeste dem (som betyr å forstå begrepet spredning og å vite hvordan det brukes).
Mann ser på statistikk

Hva brukes spredningsmåling til?

Spredningsmåling er viktig i enhver statistisk studie når du prøver å trekke konklusjoner fra data. Dette er fordi de spiller en direkte rolle på feilmarginen du jobber med. Jo større spredning i en prøve, jo mer plass trenger du for å jobbe innenfor denne marginen. 

Det kan også hjelpe deg med å finne ut om dataene dine er langt fra sentraltendensen. Det dette gjør, er å vise deg om sentraltendensen din faktisk er en god måte å representere menneskene du har testet studiet ditt på, eller om det ikke er det. Dette er veldig nyttig når det gjelder å sammenligne distribusjoner og forstå risikoen ved å ta bestemte beslutninger (1).

For å oppsummere, jo større spredning, jo mindre representativ er sentraltendensen din. Her er de vanligste spredningsmålingene:

Spredningsmåling: Slik fungerer de vanligste

Variasjonsbredde

Variasjonsbredden er vanligvis best å bruke for å gjøre de første sammenligningene dine, fordi den bare ser på de to ytterpunktene av dataene dine. Dette er også grunnen til at det generelt bare er verdt å bruke den ved små prøvestørrelser (1). Den grunnleggende definisjonen av variasjonsbredde er: Forskjellen mellom største og minste observerte verdi.

Epler

Gjennomsnittlig avvik

Deretter har vi gjennomsnittlig avvik. Dette er nyttig fordi det kan vise deg hvor dataene ville være hvis alt var nøyaktig lik avstand fra gjennomsnittet (1). Avviket til et tall fra variabelen er forskjellen mellom den absolutte verdien til denne variabelen og gjennomsnittet. Dermed er gjennomsnittlig avvik i utgangspunktet bare gjennomsnittet av alle avvikene (3).

Varians

Varians er den algebraiske funksjonen til alle verdiene, og den er perfekt for inferensiell statistikk (1). Varians er i utgangspunktet kvadratet av avvikene.

Standardavvik

Standardavvik er den vanligste spredningsmålingen i prøver tatt fra samme menneskegruppe (1). Det er kvadratroten til variansen (3).

Variasjonskoeffisient

Denne målingen brukes hovedsakelig for å sammenligne variasjonen mellom to datasett i separate grupper. Hvis du for eksempel får informasjon om høyden og vekten til elevene på en skole. Det kan hjelpe deg med å finne ut hvilken spesifikk distribusjon som viser den høyeste grupperingen av dataene, for en mer representativ måling.

Spredningsmåling innen statistikk

Variasjonskoeffisienten er den mest representative av alle de ulike spredningsmålingene vi har snakket om, fordi den gir deg et abstrakt antall. Den er med andre ord uavhengig av variablene i gruppene dine. Generelt vil du se variasjonskoeffisienten vist i prosent (3).

Spredningsmåling: Konklusjon

Disse spredningsmålene er måter å se hvor stor variasjon det er i prøven din på. De vil også vise deg hvor representativ sentraltendensen din er. Hvis variabiliteten er liten, betyr det at dataene dine er relativt nær den tendensen og er en god representasjon av det samlede datasettet.

På den annen side, hvis du har et høyt nivå av variabilitet, betyr det at dataene er spredt, ikke konsentrert. Høy variasjon betyr en sentraltendens som ikke er veldig representativ. Hvis dette er tilfelle, må du trekke fra en større datasamling. Å ha mer data vil redusere variasjonen, som var den grunnleggende årsaken til den store feilmarginen.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.