Hvordan analysere statistisk betydning: 15 trinn

👤 Forfatter Jason Gerald 📧 gerald@how-what-advice.com.
⏱ Public 2024-01-19 22:13.
🖍 Sist endret 2025-06-01 06:07.

Hypotesetesting utføres ved statistisk analyse. Statistisk signifikans ble beregnet ved bruk av p-verdien, som indikerer størrelsen på sannsynligheten for forskningsresultatene, forutsatt at visse utsagn (nullhypotese) er sanne. Hvis p -verdien er mindre enn det forhåndsbestemte signifikansnivået (generelt 0,05), kan forskeren konkludere med at nullhypotesen ikke er sann og godta den alternative hypotesen. Ved hjelp av en enkel t-test kan du beregne en p-verdi og bestemme betydningen mellom to forskjellige datasett.

Steg

Del 1 av 3: Oppsett av eksperimenter

Trinn 1. Sett opp en hypotese

Det første trinnet i å analysere statistisk signifikans er å bestemme forskningsspørsmålet du ønsker å svare på og formulere hypotesen din. En hypotese er en uttalelse om dine eksperimentelle data og forklarer mulige forskjeller i studiepopulasjonen. For hvert eksperiment må en nullhypotese og en alternativ hypotese etableres. Vanligvis vil du sammenligne to grupper for å se om de er like eller forskjellige.

Nullhypotesen (H₀) sier generelt at det ikke er noen forskjell mellom de to datasettene. Eksempel: gruppen elever som leste stoffet før timen startet, fikk ikke bedre karakterer enn gruppen som ikke leste stoffet.
Alternativ hypotese (H_en) er en uttalelse som motsier nullhypotesen og en du prøver å støtte med eksperimentelle data. Eksempel: gruppen elever som leste stoffet før timen fikk bedre karakterer enn gruppen som ikke leste stoffet.

Trinn 2. Begrens nivået av betydning for å avgjøre hvor unik dataene dine må være for at de skal anses som betydningsfulle

Signifikansnivået (alfa) er terskelen som brukes for å bestemme signifikansen. Hvis p -verdien er mindre enn eller lik signifikansnivået, anses dataene som statistisk signifikante.

Som hovedregel er signifikansnivået (alfa) satt til 0,05, noe som betyr at sannsynligheten for at begge datagrupper er like er bare 5%.
Ved å bruke et høyere konfidensnivå (lavere p -verdi) betyr det at de eksperimentelle resultatene vil bli ansett som mer signifikante.
Hvis du vil øke konfidensnivået til dataene dine, senker du p-verdien mer til 0,01. Lavere p-verdier brukes ofte i produksjonen når det oppdages produktfeil. Et høyt tillit er avgjørende for å sikre at hver produsert del utfører sin funksjon.
For eksperimenter med hypotesetesting er et signifikansnivå på 0,05 akseptabelt.

Trinn 3. Bestem deg for å bruke en ensidig test eller en tohalet test

En av forutsetningene som brukes når du utfører en t-test er at dataene dine er normalt distribuert. Data som er normalt distribuert vil danne en bjellekurve med de fleste dataene i midten av kurven. T-testen er en matematisk test som brukes for å se om dataene dine er utenfor normalfordelingen, under eller over kurvens "hale".

Hvis du ikke er sikker på at dataene dine er under eller over kontrollgruppen, kan du bruke en tosidig test. Denne testen vil kontrollere betydningen av begge retninger.
Hvis du kjenner retningen på trenden med dataene dine, kan du bruke en ensidig test. Ved å bruke det forrige eksemplet forventet du at elevens karakter ville øke. Derfor bør du bruke en ensidig test.

Trinn 4. Bestem prøvestørrelsen ved test-statistisk effektanalyse

Teststatistikkens kraft er sannsynligheten for at en bestemt statistisk test kan gi det riktige resultatet, med en bestemt prøvestørrelse. Testeffektgrensen (eller) er 80%. Analyse av styrken til en statistisk test kan være komplisert uten foreløpige data fordi du trenger informasjon om det estimerte gjennomsnittet for hvert datasett og standardavviket. Bruk den elektroniske kalkulatoren for statistisk testkraftanalyse for å bestemme den optimale prøvestørrelsen for dataene dine.

Forskere gjennomfører generelt pilotstudier som et materiale for statistisk teststyrkesanalyse og som grunnlag for å bestemme prøvestørrelsen som trengs for større og mer omfattende studier.
Hvis du ikke har ressurser til å gjennomføre en pilotstudie, kan du estimere gjennomsnittet basert på litteratur og annen forskning som er gjort. Denne metoden gir informasjon for å bestemme prøvestørrelsen.

Del 2 av 3: Beregning av standardavviket

Trinn 1. Bruk standardavviksformelen

Standardavviket (også kjent som standardavviket) er et mål på fordelingen av dataene dine. Standardavviket gir informasjon om likheten til hvert datapunkt i utvalget. Til å begynne med kan standardavviksligningen virke komplisert, men trinnene nedenfor vil hjelpe deg med beregningsprosessen. Standardavviksformelen er s = ((x_Jeg -)²/(N - 1)).

s er standardavviket.
betyr at du må legge sammen alle prøveverdiene du har samlet.
x_Jeg representerer alle de individuelle verdiene til datapunktene dine.
er gjennomsnittet av dataene for hver gruppe.
N er antallet prøver.

Trinn 2. Beregn gjennomsnittet av prøven i hver gruppe

For å beregne standardavviket, må du først beregne prøvegjennomsnittet i hvert datasett. Gjennomsnittet er angitt med den greske bokstaven mu eller. For å gjøre dette, legg til alle verdiene for eksempeldatapunkter og divider med antallet prøver.

For eksempel, for å få gjennomsnittlig poengsum for gruppen studenter som leser stoffet før timen, la oss se på eksempeldataene. For enkelhets skyld bruker vi 5 datapunkter: 90, 91, 85, 83 og 94.
Legg sammen alle prøveverdier: 90 + 91 + 85 + 83 + 94 = 443.
Del med antall prøver, N = 5: 443/5 = 88, 6.
Gjennomsnittlig poengsum for denne gruppen var 88. 6.

Trinn 3. Trekk fra hver datapunktverdi med gjennomsnittsverdien

Det andre trinnet er å fullføre delen (x_Jeg -) ligning. Trekk hver prøvedatapunktverdi fra det forhåndsberegnede gjennomsnittet. For å fortsette det forrige eksemplet må du gjøre fem subtraksjoner.

(90- 88, 6), (91- 88, 6), (85- 88, 6), (83- 88, 6) og (94- 88, 6).
Verdiene som oppnås er 1, 4, 2, 4, -3, 6, -5, 6 og 5, 4.

Trinn 4. Kvadrater hver verdi som er oppnådd og legg sammen dem alle

Kvadrater hver verdi du nettopp har beregnet. Dette trinnet vil fjerne eventuelle negative tall. Hvis det er en negativ verdi etter at dette trinnet er utført eller tiden etter at alle beregninger er utført, kan du ha glemt dette trinnet.

Ved å bruke det forrige eksemplet får vi verdiene 1, 96, 5, 76, 12, 96, 31, 36 og 29,16.
Legg sammen alle verdiene: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.

Trinn 5. Del med antall prøver minus 1

Formelen uttrykker N - 1 som en justering fordi du ikke teller hele populasjonen; Du tar bare et utvalg av befolkningen for å gjøre et estimat.

Trekk fra: N - 1 = 5 - 1 = 4
Del: 81, 2/4 = 20, 3

Trinn 6. Beregn kvadratroten

Etter at du har delt på antall prøver minus en, beregner du kvadratroten til den endelige verdien. Dette er det siste trinnet for å beregne standardavviket. Det er flere statistiske programmer som kan beregne standardavviket etter at du har lagt inn rådata.

For eksempel er standardavviket til score for gruppen elever som leser stoffet før timestart: s = √20, 3 = 4, 51

Del 3 av 3: Bestemmelse av betydning

Trinn 1. Beregn variansen mellom de to prøvegruppene

I forrige eksempel beregnet vi bare standardavviket til en gruppe. Hvis du vil sammenligne to grupper, bør du ha data fra de to gruppene. Beregn standardavviket til den andre gruppen og bruk resultatene til å beregne variansen mellom de to gruppene i eksperimentet. Formelen for varians er s_d = ((s₁/N₁) + (s₂/N₂)).

s_d er variasjonen mellom grupper.
s₁ er standardavviket for gruppe 1 og N₁ er antall prøver i gruppe 1.
s₂ er standardavviket for gruppe 2 og N₂ er antall prøver i gruppe 2.
For eksempel har data fra gruppe 2 (elever som ikke leser stoffet før timen starter) en utvalgsstørrelse på 5 med et standardavvik på 5,81. Deretter varianten:
- s_d = ((s₁)²/N₁) + ((s₂)²/N₂))
- s_d = √(((4.51)²/5) + ((5.81)²/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.

Trinn 2. Beregn t-testverdien til dataene dine

T-testverdien lar deg sammenligne en datagruppe med en annen datagruppe. T-verdien lar deg utføre en t-test for å avgjøre hvor stor sannsynlighet det er for at de to datagruppene som blir sammenlignet er vesentlig forskjellige. Formelen for verdien av t er: t = (µ₁ -₂)/s_d.

️₁ er gjennomsnittet for den første gruppen.
️₂ er gjennomsnittsverdien for den andre gruppen.
s_d er variansen mellom de to prøvene.
Bruk det større gjennomsnittet som₁ så du ikke får negative verdier.
For eksempel er gjennomsnittsscore for gruppe 2 (studenter som ikke leser) 80. T-verdien er: t = (µ₁ -₂)/s_d = (88, 6 - 80)/3, 29 = 2, 61.

Trinn 3. Bestem prøvens frihetsgrader

Ved bruk av t-verdien bestemmes frihetsgrader av størrelsen på prøven. Legg til antall prøver fra hver gruppe og trekk deretter fra to. For eksempel er frihetsgradene (d.f.) 8 fordi det er fem prøver i den første gruppen og fem prøver i den andre gruppen ((5 + 5) - 2 = 8).

Trinn 4. Bruk tabell t for å bestemme betydningen

Tabeller med t-verdier og frihetsgrader finnes i standard statistikkbøker eller online. Se på raden som viser frihetsgrader du valgte for dataene dine, og finn den riktige p-verdien for t-verdien avledet fra beregningene dine.

Med frihetsgrader på 8 d.f. og t-verdien på 2,61, p-verdien for den ensidige testen er mellom 0,01 og 0,025. Siden vi brukte et signifikansnivå på mindre enn eller lik 0,05, viser dataene vi bruker at de to datagruppene er betydelig forskjellig. signifikant. Med disse dataene kan vi avvise nullhypotesen og godta den alternative hypotesen: gruppen studenter som leste stoffet før timen startet scoret bedre enn gruppen elever som ikke leste stoffet

Trinn 5. Vurder å gjøre en oppfølgingsstudie

Mange forskere gjennomfører små pilotstudier for å hjelpe dem å forstå hvordan man designer større studier. Å gjøre mer forskning med flere målinger vil øke tilliten til konklusjonene dine.

Tips

Statistikk er et bredt og komplekst felt. Ta en videregående eller universitetsklasse i slutningsstatistikk for å hjelpe deg å forstå statistisk signifikans