Big data gør det lidt nemmere at gætte dit næste træk. Kredit:blackboard1965/shutterstock.com
Gode videnskabsmænd er ikke kun i stand til at afdække mønstre i de ting, de studerer, men at bruge disse oplysninger til at forudsige fremtiden.
Meteorologer studerer atmosfærisk tryk og vindhastighed for at forudsige banerne for fremtidige storme. En biolog kan forudsige væksten af en tumor baseret på dens nuværende størrelse og udvikling. En finansanalytiker kan forsøge at forudsige op- og nedture i en aktie baseret på ting som markedsværdi eller pengestrøm.
Måske endnu mere interessant end ovenstående fænomener er det at forudsige menneskers adfærd. Forsøg på at forudsige, hvordan mennesker vil opføre sig, har eksisteret siden menneskehedens oprindelse. Tidlige mennesker måtte stole på deres instinkter. I dag, marketingfolk, politikere, retssagsadvokater og flere lever af at forudsige menneskelig adfærd. Forudsigelse af menneskelig adfærd, i alle dens former, er big business.
Så, hvordan gør matematik i at forudsige vores egen adfærd generelt? På trods af fremskridt inden for aktiemarkedsanalyse, økonomi, politisk meningsmåling og kognitiv neurovidenskab – som alle i sidste ende bestræber sig på at forudsige menneskelig adfærd – vil videnskaben måske aldrig være i stand til at gøre det med fuldkommen sikkerhed.
Større og bedre data
Når man laver forudsigelser, videnskabsmænd har historisk været begrænset af mangel på fuldstændige data, stole i stedet på små stikprøver for at udlede karakteristika for en bredere population.
Men i de senere år, Beregningskraft og metoder til indsamling af data er udviklet til det punkt, hvor der er skabt et nyt felt:big data. Takket være den enorme tilgængelighed af indsamlede data, forskere kan undersøge empiriske sammenhænge mellem en lang række variabler for at dechifrere signalet fra støjen.
For eksempel, Amazon bruger prædiktiv analyse til at gætte, hvilke bøger vi kan lide baseret på vores tidligere browsing eller købshistorik. Tilsvarende automatiserede online annoncekampagner fortæller os, hvilke køretøjer vi kan være interesserede i baseret på køretøjer, der blev søgt dagen før.
Marketingfolk bruger fødselsoversigter til at beslutte, hvornår de skal oversvømme dig med annoncer for babyprodukter. De gætter endda, hvornår du får brug for disse ting baseret på dit barns udviklingsstadium.
Det er ikke raketvidenskab, virkelig. Det er simpelthen at have information (data), der viser mønstre, og udnytte disse mønstre i forudsigelighedens navn (og ofte, overskud). Skønt igen, at måle nøjagtigheden af disse algoritmer er svært for udenforstående, der er noget arbejde, der afslører, hvad der får disse algoritmer til at tikke.
Maskinlæring kan bruges til at sortere efter mønstre i enorme bunker af data. Kredit:Zapp2Photo/shutterstock.com
Matematiske modeller
Mange forudsigelsesværktøjer er afhængige af maskinlæring, herunder matematiske algoritmer, der er baseret på de biologiske principper for hjernefunktion og bruger enorme mængder data til at lære mønstre.
Maskinlæringsalgoritmer kan præcist forudsige resultatet af højesteretssager, ved at bruge sådanne forudsigelser som identiteten af hver enkelt dommer, måned for argumentet, andrageren og andre faktorer. Selvom nøjagtigheden af algoritmens output kun er cirka 70 procent, det har faktisk vist sig at overgå menneskelige juridiske eksperter.
Andre maskinlæringsalgoritmer har vist sig at forudsige selvmordsforsøg med en nøjagtighed på 80 til 92 procent, nok mere præcise end selv de bedste menneskelige vurderinger.
Matematik kan endda være i stand til at fortælle os om terroradfærd, der førte til et angreb. I en undersøgelse, forskere så på optegnelser om terroraktivitet i Irland, specifikt eksplosioner af forbedrede eksplosive anordninger. Efter en hændelse, sandsynligheden for en anden hændelse var større end ikke. Med andre ord, begivenhederne var ikke uafhængige. Sådan viden kan være nyttig for et samfund, måske at vælge straks at mobilisere indsatsen efter et enkelt angreb i forventning om et andet.
Er perfekt forudsigelse mulig?
Big data har gjort forudsigelsesmetoder stadig mere nøjagtige. Men kan menneskelig adfærd nogensinde forudsiges perfekt?
Den mest grundlæggende ligning er Y =f(X), som lyder, "Y er en funktion af X." Indtast en værdi for X, og videnskabsmanden vil fortælle dig den sandsynlige værdi for Y. Jo mere kompleks modellen er, jo mere behov for flere input, og så bliver den simple ligning meget mere kompliceret.
Selvfølgelig, det lykkes ikke altid. Orkaner tager baner, som ikke er forudsagt af vejrmodeller. Tumorer vokser langsommere eller hurtigere end forudsagt. Videnskabsmænd, ligesom alle andre, sjældent eller aldrig forudsige perfekt. Uanset hvilken data og matematisk model du har, fremtiden er stadig usikker.
Så, videnskabsmænd er nødt til at tillade fejl i vores grundlæggende ligning. Det er, Y =f(X) + E, hvor "E" omfatter vores manglende evne til at forudsige perfekt. Det er den del af ligningen, der holder os ydmyge.
Efterhånden som teknologien udvikler sig, videnskabsmænd kan finde ud af, at vi kan forudsige menneskelig adfærd ret godt på ét område, mens der stadig mangler en anden. Det er meget svært at give en samlet fornemmelse af begrænsningerne. For eksempel, Ansigtsgenkendelse kan være lettere at efterligne, fordi syn er et af mange menneskelige sansebehandlingssystemer, eller fordi der kun er så mange måder ansigter kan adskille sig på. På den anden side, forudsige stemmeadfærd, især baseret på præsidentvalget i 2016, er en helt anden historie. Der er mange komplekse og endnu ikke forståede grunde til, at mennesker gør, som de gør.
Atter andre hævder, at teoretisk set i hvert fald den perfekte forudsigelse en dag vil være mulig. Indtil da, med lidt held, matematik og statistik kan hjælpe os i stigende grad at redegøre for, hvad mennesker, gennemsnitlig, vil gøre næste.
Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.