Statistisk betydning er en objektiv indikator for, hvorvidt resultaterne af en undersøgelse er matematisk "ægte" og statistisk forsvarlig, snarere end blot en chance for forekomst. Almindeligt anvendte signifikanstest ser efter forskelle i datasætets midler eller forskelle i afvigelser af datasæt. Den type test, der anvendes, afhænger af typen af data, der analyseres. Det er op til forskerne at bestemme, hvor vigtigt det er, at resultaterne skal være - med andre ord, hvor meget risiko de er villige til at tage for at være forkerte. Typisk er forskere villige til at acceptere et risikoniveau på 5 procent.
Type I-fejl: Forkert afvisning af null-hypotesen
Eksperimenter udføres for at afprøve specifikke hypoteser eller eksperimentelle spørgsmål med en forventet resultat. En null-hypotese er en, som ikke opdager nogen forskel mellem de to datasæt, der sammenlignes. I en lægeundersøgelse kan for eksempel nulhypotesen være, at der ikke er nogen forskel i forbedring mellem patienter, der modtager studiemedicin og patienter, der får placebo. Hvis forskeren fejlagtigt afviser denne null hypotese, når det faktisk er sandt, med andre ord, hvis de "opdager" en forskel mellem de to sæt patienter, når der virkelig ikke var nogen forskel, så har de begået en Type I-fejl. Forskere bestemmer i forvejen, hvor meget risiko for at begå en type I-fejl, de er villige til at acceptere. Denne risiko er baseret på en maksimal p-værdi, som de vil acceptere, før de afviser nulhypotesen, og kaldes alpha.
Type II Fejl: Forkert Afvisning af Alternativ Hypotesen
En alternativ hypotese er en der opdager en forskel mellem de to sæt data, der sammenlignes. I tilfælde af lægebehandlingen vil du forvente at se forskellige niveauer af forbedringer hos patienter, der modtager undersøgelsesmedicin og patienter, der får placebo. Hvis forskere undlader at afvise nulhypotesen, når de skal, med andre ord, hvis de ikke "opdager" nogen forskel mellem de to sæt patienter, da der virkelig var en forskel, har de begået en type II-fejl.
Bestemmelse af niveauet af betydning
Når forskere udfører en test af statistisk betydning, og den resulterende p-værdi er mindre end risikoniveauet, som anses for acceptabelt, anses testresultatet for statistisk signifikant. I dette tilfælde er nulhypotesen - hypotesen om, at der ikke er nogen forskel mellem de to grupper - afvist. Med andre ord viser resultaterne, at der er en forskel i forbedring mellem patienter, der modtager studiemedicin og patienter, der får placebo.
Valg af en signifikant test
Der er flere forskellige statistiske tests at vælge fra. En standard t-test sammenligner midlerne fra to datasæt, såsom vores undersøgelsesmedicin data og vores placebo data. En parret t-test bruges til at detektere forskelle i det samme datasæt, såsom en før-og-efter-undersøgelse. Envejsanalyse af varians (ANOVA) kan sammenligne midlerne fra tre eller flere datasæt, og en tovejs ANOVA sammenligner midlerne til to eller flere datasæt som svar på to forskellige uafhængige variabler, såsom forskellige styrker af de studere stof. En lineær regression sammenligner datasætets midler langs en gradient af behandlinger eller tid. Hver statistisk test vil resultere i vigtige målinger, eller alfa, der kan bruges til at fortolke testresultaterne.
Sidste artikelHvordan Faktor Binomials Med Exponents
Næste artikelSådan konverteres ml til usunger