De grunnleggende statistiske begrepene
Statistikk er en gren av matematikk som studerer variabilitet, så vel som prosessen som beregner den, ved å følge sannsynlighetslovene og å bruke de tilhørende modellene. Vi vet at statistikk er nødvendig for å utføre undersøkelser og studier, så vel som å forstå resultatene de gir. Men hva er de grunnleggende statistiske begrepene?
For å forklare de grunnleggende statistiske begrepene, må vi vende oss til deskriptiv statistikk. Denne grenen av statistikk fokuserer på å beskrive eksperimentelle data. Mer konkret omfatter det innsamling, organisering og analyse av data. Dataene beskriver et sett med elementer som tilhører en populasjon.
De grunnleggende statistiske begrepene
I følge professor Ignacio Cascos, fra Universidad Carlos III de Madrid, er dette noen av de grunnleggende statistiske begrepene alle burde kjenne til:
1. Populasjon
En populasjon er et godt definert sett med lignende objekter eller individer, med visse egenskaper som er av interesse for observatørene.
Populasjonen kan være endelig eller uendelig. Derfor er størrelsen på populasjonen det antallet objekter eller individer den inneholder. Størrelsen på en populasjon blir vanligvis betegnet av N.
Dersom populasjonen er veldig stor, kan det være dyrt å gjennomføre et studie. I tillegg, dersom du har tilgang til en hel populasjon, er det også i utgangspunktet ikke nødvendig å uføre hypotesetesting. Dersom populasjonen er stor, er det derfor mer vanlig at forskerne samler inn data fra et utvalg fra populasjonen. Et utvalg er en undergruppe av populasjonen.
2. Objekt/Individ
Et objekt, er et individuelt objekt eller individ i populasjonen. Disse objektene behøver ikke nødvendigvis å være mennesker. Imidlertid er dette vanligvis tilfellet i psykologisk forskning.
3. Utvalg
Et utvalg er en undergruppe av populasjonen. Denne undergruppen vil være satt sammen av individer fra populasjonen som reflekterer dens egenskaper best mulig. Hvis utvalget gjenspeiler egenskapene til populasjonen, er utvalget representativt. Videre, er utvalgsstørrelsen antall individer det har. Vi betegner størrelsen på utvalgsstørrelsen med n.
4. Variabler
En variabel (X) er et symbol som representerer ethvert kjennetegn, tall, eller mengde av populasjonen som forskere kan måle eller telle. Korrelasjon (r) er et mål på styrken og rettingen mellom to kvantitative variabler. Med andre ord, om hvordan to variabler påvirker hverandre.
De statistiske begrepene og ulike typer variabler
Avhengig av hvordan vi måler en variabel, kan den deles inn i tre hovedgrupper:
1. Kontinuerlige variabler
Dersom variablene er kontinuerlige, vil det si at avstanden mellom verdiene er veldig liten. I tillegg vil det også være mange verdier på variabelen. Et eksempel på en slik variabel kan være inntekt i kroner og øre, eller tid.
2. Diskrete variabler
I kontrast til kontinuerlige variabler, er det større avstand mellom diskrete variabler. Det vil også være mye færre verdier på variabelen. Som et eksempel kan vi bruke utdanning, ungdomsskole, videregående og universitet. Eller eksamenskarakterer, der det kun går fra A til F.
3. Dikotome variabler
Dikotome variabler er kanskje den letteste formen for variabler å forstå. Dersom en variabel er dikotom, betyr det at det kun er to ulike verdier på variabelen, et eksempel på en slik variabel er kjønn, da man enten er mann eller kvinne.
De statistiske begrepene: Avhengig og uavhengig
I tillegg til de tre hovedgruppene, vil variabler også deles inn i avhengige og uavhengige:
Avhengige variabler
Også kalt virkningsvariabler, er de variabler som påvirkes av andre verdier. Det vil si at verdien på variabel Y, vil påvirkes av hvilken verdi det er på variabel X.
Uavhengige variabler
Eller årsaksvariabler, er variabler som påvirker andre variabler. På motsatt måte av avhengige variabler vil verdien på variabel X påvirke hvilken verdi du får på variabel Y.
La oss se på et eksempel: Årsinntekten din (Y) vil påvirkes av hvilket yrke du har (X). Yrkesvalg har da en klar påvirkning på årsinntekt. Dermed vil Årsinntekt være den avhengige variabelen, mens yrke er den uavhengige variabelen.
De statistiske begrepene: statistisk plassering
I deskriptiv statistikk kan du fastslå posisjonen av dataene dine ved å bruke målinger for plassering.
Mål for sentraltendens
Gjennomsnitt, eller målinger for sentraltendens, er typiske eller representative verdier for et datasett. Derfor er deres formål å oppsummere alle dataene med en enkelt verdi.
De vanligste målene for sentraltendens er typetall, median og gjennomsnitt. Det er viktig å ikke blande disse sammen, fordi selv om det kan virke som om de måler samme ting, er det ikke så enkelt.
- Typetall (modus). Typetallet er et mål som beskriver det objektet/individet som har det største antallet observasjoner, med andre ord, den det er mest av. Dersom det er mer enn en av disse verdiene, er variabelen multimodal. Videre kan du beregne typetall for alle typer variabler.
- Median. Medianen i et utvalg er den verdien som deler utvalget i to deler, slik at begge deler har et likt antall objekter eller individer. Følgelig, vil en halvpart av dataene være mindre eller lik medianen. På samme måte vil den andre halvparten av dataene også være større eller lik medianen. Derfor, dersom det er mer enn en median, må du ta midtpunktet mellom den største og minste medianen. Dette vil være verdien som vises i utvalget, og som vil fungere som medianen.
- Gjennomsnitt. Dette er det vanligste målet for sentraltendens, og kalles også ofte middelverdi. Gjennomsnittet er det geometriske senteret eller forventet verdi for dataene. Det er imidlertid et par særegne kvaliteter ved gjennomsnittet. Det kan skje at gjennomsnittet ikke er representativt for utvalget, men samtidig vil det muligens heller ikke representere noen faktisk verdi fra utvalget. Med andre ord, kan det hende at verdien som utpekes som gjennomsnittet, ikke eksisterer i utvalget.
Avsluttende tanker om de statistiske begrepene
Selv om det er mange flere begreper som brukes i statistikk, er dette de mest grunnleggende. Ved å bruke disse statistiske begrepene kan du organisere og beregne statistikk samt representasjoner av data. Dermed er dette uunnværlige verktøy for forskere og det vitenskapelige samfunnet. Statistikk vil gi deg et fullstendig kart over resultatene fra en studie eller et eksperiment.
Alle siterte kilder ble grundig gjennomgått av teamet vårt for å sikre deres kvalitet, pålitelighet, aktualitet og validitet. Bibliografien i denne artikkelen ble betraktet som pålitelig og av akademisk eller vitenskapelig nøyaktighet.
- de Datos, A. E. (1983). Estadística Descriptiva.
- Fernández, S. F., Sánchez, J. M. C., Córdoba, A., Cordero, J. M., & Largo, A. C. (2002). Estadística descriptiva. Esic Editorial.
-
García Pérez, A. (2008). Estadística aplicada: Conceptos básicos.