Kredit:Pixabay/CC0 Public Domain
Forestil dig, at der er en bus, der ankommer hvert 30. minut i gennemsnit, og du ankommer til busstoppestedet uden nogen anelse om, hvornår den sidste bus gik. Hvor længe kan du forvente at vente på den næste bus? Intuitivt, halvdelen af 30 minutter lyder rigtigt, men du ville være meget heldig at vente kun 15 minutter.
Sige, for eksempel, at halvdelen af tiden ankommer busserne med 20 minutters interval og halvdelen af tiden med 40 minutters interval. Det samlede gennemsnit er nu 30 minutter. Fra dit synspunkt, imidlertid, det er dobbelt så sandsynligt, at du dukker op i intervallet på 40 minutter end i intervallet på 20 minutter.
Dette gælder i alle tilfælde undtagen når busserne ankommer med nøjagtige 30 minutters intervaller. Når spredningen omkring gennemsnittet stiger, det samme gør det beløb, hvormed den forventede ventetid overstiger den gennemsnitlige ventetid. Dette er inspektionsparadokset, som siger, at når du "inspicerer" en proces, du vil sandsynligvis opdage, at tingene tager (eller varer) længere end deres "ikke-inspicerede" gennemsnit. Det, der virker som uheldets vedholdenhed, er simpelthen sandsynlighedslovene og statistikker, der udspiller deres naturlige forløb.
Når først blev gjort opmærksom på paradokset, det ser ud til at dukke op overalt.
For eksempel, Lad os sige, at du vil tage en undersøgelse af den gennemsnitlige klassestørrelse på et kollegium. Sig, at kollegiet har klassestørrelser på enten 10 eller 50, og der er lige mange af hver. Så den samlede gennemsnitlige klassestørrelse er 30. Men når man vælger en tilfældig elev, det er fem gange mere sandsynligt, at han eller hun kommer fra en klasse på 50 elever end på 10 elever. Så for hver enkelt elev, der svarer "10" på din forespørgsel om deres klassestørrelse, der vil være fem, der svarer "50". Den gennemsnitlige klassestørrelse, som din undersøgelse viser, er tættere på 50, derfor, end 30. Så handlingen med at inspicere klassestørrelserne øger det opnåede gennemsnit betydeligt sammenlignet med det sande, ukontrolleret gennemsnit. Den eneste omstændighed, hvor det inspicerede og ikke-inspicerede gennemsnit falder sammen, er, når hver klassestørrelse er lige stor.
Vi kan undersøge det samme paradoks i sammenhæng med det, der er kendt som længdebaseret prøveudtagning. For eksempel, når man graver kartofler op, hvorfor går gaflen gennem den meget store? Hvorfor går netværksforbindelsen i stykker under download af den største fil? Det er ikke fordi du er født uheldig, men fordi disse udfald sker for en større forlængelse af rum eller tid end den gennemsnitlige forlængelse af rum eller tid.
Når du først kender til inspektionsparadokset, verden og vores opfattelse af vores plads i den er aldrig helt den samme igen.
En anden dag stiller du op på lægepraksis for at blive testet for en virus. Testen er 99% nøjagtig, og du tester positiv. Nu, hvad er chancen for at du har virussen? Det intuitive svar er 99%. Men er det rigtigt? De oplysninger, vi får, vedrører sandsynligheden for at teste positiv, da du har virusset. Hvad vi gerne vil vide, imidlertid, er sandsynligheden for at have virussen givet, at du tester positiv. Almindelig intuition blander disse to sandsynligheder, men de er meget forskellige. Dette er et eksempel på den omvendte eller anklagerens fejlslutning.
Betydningen af testresultatet afhænger af sandsynligheden for, at du har virus, før du tager testen. Dette er kendt som den forudgående sandsynlighed. I det væsentlige, vi har en konkurrence mellem, hvor sjælden virussen er (basisrate), og hvor sjældent testen er forkert. Lad os sige, at der er en 1 ud af 100 chance, baseret på lokale prævalensrater, at du har virus, før du tager testen. Nu, huske på, at testen er forkert én gang ud af 100. Disse to sandsynligheder er lige store, så chancen for, at du har virussen, når du tester positiv, er 1 ud af 2, på trods af at testen er 99 % nøjagtig. Men hvad hvis du viser symptomer på virussen, før du bliver testet? I dette tilfælde, vi bør opdatere den forudgående sandsynlighed til noget højere end prævalensraten i den testede population. Chancen for, at du har virussen, når du tester positiv, stiger tilsvarende. Vi kan bruge Bayes' sætning til at udføre beregningerne.
Sammenfattende, intuition svigter os ofte. Stadig, ved at anvende metoderne for sandsynlighed og statistik, vi kan trodse intuitionen. Vi kan endda løse det, der for mange synes det største mysterium af dem alle – hvorfor vi så ofte ser ud til at sidde fast i den langsommere bane eller kø. Intuitivt, vi er født uheldige. Det logiske svar på Slower Lane-puslespillet er, at det er præcis, hvor vi skal forvente at være!
Når intuitionen svigter, vi kan altid bruge sandsynlighed og statistik til at lede efter de rigtige svar.