Statistik har Guinness at takke for Elevens t-test. Kredit:Flickr/Scott Thompson, CC BY
Denne St Patrick's Day, festglade rundt om i verden vil overfylde gaderne og søge en af Irlands nationale drinks:en pint Guinness. Men udover denne velsmagende stout, et af videnskabens mest grundlæggende og almindeligt anvendte redskaber har også sin oprindelse på Guinness-bryggeriet.
Mod slutningen af det 19. århundrede, Guinness opskalerede sine operationer, og var interesseret i at anvende en videnskabelig tilgang til alle aspekter af Guinness produktion:fra bygvækst til Guinness smag.
Inden man anlægger en videnskabelig tilgang, bryggere hos Guinness stolede på subjektive metoder, såsom udseende og duft af humle, at vurdere produktkvaliteten.
Videnskab i brygget
Da videnskabelige bryggere blev rekrutteret, en mere objektiv tilgang blev taget. Den første videnskabelige brygger, Thomas Bennett sag, blev ansat i 1893, og han mente, at mængden af blød harpiks i humle var relateret til kvaliteten af Guinness. Han var derfor ivrig efter at vurdere mængden af blød harpiks i særlige humleafgrøder.
Udfordringen for Case var, at han, som enhver videnskabsmand, kunne ikke måle alt på én gang. Det var ikke muligt for ham at vurdere mængden af blød harpiks i hver eneste af de utallige humleblomster (tilsat i tusindvis til enorme kar af snart-til-være Guinness) i hans ansvar.
I stedet, han tog en prøve af humle (11 mål på 50 gram hver) og beregnede det gennemsnitlige indhold af blød harpiks. Hans håb var, at det gennemsnitlige indhold af blød harpiks i hans lille prøve kunne bruges til at estimere indholdet af blød harpiks i hele afgrøden (det statistikere ville kalde "populationen") af humle.
Til sammenligning, en kollega tog yderligere 14 mål på hver 50 gram fra samme parti humle. Case fandt en lille forskel i den gennemsnitlige mængde bløde harpikser mellem disse prøver.
Han var lamslået. Skyldes disse forskelle i humleindhold reelle forskelle på tværs af hele humleafgrøden, eller skyldtes de tilfældige fejl introduceret ved brug af små stikprøvestørrelser?
Størrelse betyder noget
På det tidspunkt, statistik påberåbt sig det, der kaldes "storprøveteori", hvilket ikke overraskende kræver store prøver (150 eller mere) for at virke. Det var svært at anvende det på problemer, der involverede små prøver (som dem, som Case hos Guinness står over for).
Dette var problemet, som William Sealy Gosset, en nyuddannet kandidat i kemi og matematik ved Oxford University, var ivrig efter at tage fat. Gosset begyndte at arbejde som bryggerlærling på Guinness fabrikken i Dublin i 1899.
I 1906, Gosset, nu autodidakt statistiker, gik for at studere hos Karl Pearson, en førende figur inden for statistik, på University College London.
Gosset var ivrig efter at tilpasse Pearsons store prøvemetoder til at håndtere de små prøver, de brugte hos Guinness. der, han udviklede sine ideer og gjorde dem klar til udgivelse.
Imidlertid, indtil slutningen af 1930'erne, Guinness ville ikke tillade ansatte at offentliggøre under deres eget navn af frygt for, at andre bryggere ville lære om deres videnskabelige tilgange til øl. Som resultat, Gosset udgav sit vigtigste papir, Den sandsynlige fejl i et middel, under pseudonymet "Student" i tidsskriftet Biometrika i 1908.
Dette var oprindelsen til Students t-test, en grundlæggende statistisk metode, der er meget brugt den dag i dag.
Elevens t-test
Problemet som Case stod over for var, at brug af små prøver af humle introducerer en ny kilde til usikkerhed i analysen, efterlader ham mindre i stand til at skelne mellem ægte, sande forskelle mellem to partier humle og forskelle på grund af denne usikkerhed.
Gossets geni var at udtænke en måde at redegøre for dette på:t-fordelingen. Dette definerer matematisk forholdet mellem størrelsen af stikprøven og mængden af usikkerhed, dette pålægger.
I bund og grund, når man udfører forsøg, t-fordelingen (og den berømte t-test, der afhænger af den) gør det muligt for både ølbryggere og forskere at redegøre for størrelsen af den prøve, de har brugt i deres arbejde, og derefter definere, hvor sikre de er i deres resultater.
Holder sig til bryggernes sag, du ville have information fra de to prøver, såsom humlens gennemsnitlige bløde harpiksindhold og spredningen af hver måling omkring gennemsnittet af hver prøve.
Uden at gå for meget i detaljer, t-testen hjælper med at bestemme, om der er tegn på en forskel mellem de to gennemsnit baseret på stikprøvestørrelsen (dvs. antallet af målinger taget fra en bestemt humleafgrøde). I bryggernes tilfælde ledte de efter nul forskel mellem deres to prøver.
En varig arv
Gossets metode tiltrak ikke det statistiske samfunds opmærksomhed, før en anden førende statistisk figur, Ronald Aylmer Fisher, entusiastisk taget metoden til sig og leverede et matematisk bevis.
Siden den gang, t-testen er blevet brugt til at tackle en lang række videnskabelige problemer, fra vurdering af hjernefunktion hos patienter med slagtilfælde, til måling af kulstof- og nitrogenindhold i kystnære havbakterier, til, hvordan kulminearbejdernes adfærd kan eller ikke kan føre til ulykker (disse minearbejderes forbrug af Guinness var, måske ikke overraskende, ikke et fokus for undersøgelsen).
Faktisk, Studerendes t-test er blevet anvendt i stort set alle områder af videnskabelig bestræbelse:biologi, fysik, psykologi, biometri, økonomi og medicin.
Det er en fast bestanddel af bachelor-statistikker, der undervises på tværs af disse discipliner, men få er måske klar over Gossets rolle i at skabe t-testen og hans ølagtige grunde til at gøre det.
Gosset forblev i Guinness hele sit liv som chef for eksperimentel brygger, daværende leder af den statistiske afdeling, han dannede i Guinness, før hans forfremmelse til Head Brewer for det nye Guinness-bryggeri i London i 1935. Han udgav flere artikler som "Student", men hans sande identitet blev først offentligt afsløret efter hans død i 1937.
Så, hvis du drikker en Guinness denne St Patricks dag, hæv et glas til den lidet kendte karakter, der spillede en central rolle i øl, statistik og faktisk moderne videnskab:William Sealy Gosset.
Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.