Kredit:CC0 Public Domain
Årsagerne til problemer i den virkelige verden inden for økonomi og folkesundhed kan være notorisk svære at afgøre. Tit, der er mistanke om flere årsager, men store datasæt med tidssekventerede data er ikke tilgængelige. Tidligere modeller kunne ikke pålideligt analysere disse udfordringer. Nu, forskere har testet den første kunstige intelligensmodel til at identificere og rangordne mange årsager til problemer i den virkelige verden uden tidssekventerede data, ved hjælp af en multi-nodal kausal struktur og Directed Acyclic Graphs.
Når der sker noget slemt, det er naturligt at prøve at finde ud af, hvorfor det skete. Hvad forårsagede det? Hvis årsagen er fastlagt, det kan være muligt at undgå det samme resultat næste gang. Imidlertid, nogle af de måder, hvorpå mennesker forsøger at forstå begivenheder, såsom at ty til overtro, kan ikke forklare, hvad der egentlig foregår. Heller ikke korrelation, hvilket kun kan sige, at begivenhed B skete omkring samme tid som begivenhed A.
For virkelig at vide, hvad der forårsagede en begivenhed, vi er nødt til at se på kausalitet – hvordan information flyder fra én begivenhed til en anden. Det er informationsstrømmen, der viser, at der er en årsagssammenhæng – at hændelse A forårsagede hændelse B. Men hvad sker der, når den tidssekvenserede informationsstrøm fra hændelse A til hændelse B mangler? Generel kausalitet er påkrævet for at identificere årsagerne.
Matematiske modeller for generel kausalitet har været meget begrænsede, arbejder for op til to årsager. Nu, i et gennembrud af kunstig intelligens, forskere har udviklet den første robuste model for generel kausalitet, der identificerer flere årsagssammenhænge uden tidssekvensdata, Multivariate Additive Noise Model (MANM).
Forskere fra University of Johannesburg, Sydafrika, og National Institute of Technology Rourkela, Indien, udviklet modellen og testet den på simuleret, datasæt fra den virkelige verden. Forskningen er publiceret i tidsskriftet Neurale netværk .
"Unikt, modellen kan identificere flere, hierarkiske årsagsfaktorer. Det virker, selvom data med tidssekvensering ikke er tilgængelige. Modellen skaber betydelige muligheder for at analysere komplekse fænomener inden for områder som økonomi, sygdomsudbrud, klimaændringer og bevarelse, " siger prof Tshilidzi Marwala, en professor i kunstig intelligens, og global kunstig intelligens og økonomiekspert ved University of Johannesburg, Sydafrika.
"Modellen er især nyttig på de regionale, nationalt eller globalt niveau, hvor ingen kontrollerede eller naturlige eksperimenter er mulige, " tilføjer Marwala.
Overtro og sammenhæng mod kausalitet
"Hvis en sort kat løber over vejen, eller en ugle tuder på et tag, nogle mennesker er overbeviste om, at der vil ske noget virkelig slemt. En person kan tro, at der er en sammenhæng mellem at se katten eller uglen og det, der skete bagefter. Imidlertid, fra et kunstig intelligens synspunkt, vi siger, at der ikke er nogen årsagssammenhænge mellem katten, uglen, og hvad der sker med de mennesker, der ser dem. Katten eller uglen blev set lige før begivenheden, men de er kun korreleret i tid med det, der skete senere, " siger prof Marwala.
I mellemtiden inde i huset, hvor uglen blev set, noget mere uhyggeligt kan være på vej. Familien indeni glider måske dybere og dybere ind i gæld. En sådan økonomisk situation kan pålægge husstanden store begrænsninger, til sidst at blive en fælde, hvorfra der er meget lidt undslippe. Men forstår de mennesker, der bor der, de faktiske årsagssammenhænge mellem, hvad der sker med dem? hvad de gør, og deres gældsniveauer?
Kausalitet på husstandsniveau
Årsagerne til husholdningernes vedvarende gæld er et godt eksempel på, hvad den nye model er i stand til, siger post-doc forsker Dr. Pramod Kumar Parida, hovedforfatter til forskningsartiklen.
"På husstandsniveau kan man spørge:Har husstanden mistet en del af eller hele sin indkomst? Er der nogle eller alle medlemmer, der bruger ud over deres indkomst? Er der sket noget med husstandsmedlemmer, som tvinger store udgifter, såsom læge- eller handicapregninger? Bruger de deres opsparing eller investeringer, som nu er løbet tør? Sker en kombination af disse ting, hvis så, hvilke er de mest dominerende årsager til gælden?"
Hvis der er tilstrækkeligt med data om husstandens finansielle transaktioner, komplet med oplysninger om dato og klokkeslæt, det er muligt for nogen at finde ud af de faktiske årsagssammenhænge mellem indkomst, bruge, opsparing, investeringer og gæld.
I dette tilfælde, simpel kausalitetsteori er tilstrækkelig til at finde ud af, hvorfor denne husstand har det svært.
Generel kausalitet på samfundsniveau
Men, siger Parida, "Hvad er de egentlige årsager til, at de fleste mennesker i en by eller en region har det økonomisk svært? Hvorfor slipper de ikke for gælden?" Nu, det er ikke længere muligt for et team af mennesker at finde ud af dette ud fra tilgængelige data, og en helt ny matematisk udfordring åbner sig.
"Især hvis man ønsker de faktiske årsagssammenhænge mellem husstandsindkomst, bruge, opsparing og gæld til byen eller regionen, snarere end ekspertgæt eller 'hvad de fleste mennesker tror,' "" tilføjer han.
"Her, kausalitetsteori fejler, fordi de økonomiske transaktionsdata for husstande i byen eller regionen vil være ufuldstændige. Også, oplysninger om dato og klokkeslæt vil mangle for nogle data. Økonomisk kamp i lav, mellem- og højindkomsthusholdninger kan være meget forskellige, så du vil gerne se de forskellige årsager fra analysen, " siger Parida.
"Med denne model, du kan identificere kan identificere flere vigtige drivende faktorer, der forårsager husholdningens gæld. I modellen, vi kalder disse faktorer de uafhængige forældreårsagssammenhænge. Du kan også se, hvilke årsagssammenhænge der er mere dominerende end de andre. Med en anden passage gennem dataene, du kan også se de mindre drivende faktorer, det vi kalder de selvstændige barns årsagssammenhænge. På denne måde det er muligt at identificere et muligt hierarki af årsagssammenhænge."
Betydeligt forbedret kausal analyse
Multivariate Additive Noise Model (MANM) giver betydeligt bedre årsagsanalyse på datasæt fra den virkelige verden end industristandardmodeller, der i øjeblikket er i brug, siger medforfatter Prof Snehashish Chakraverty, ved Anvendt Matematik Gruppen, Institut for Matematik, National Institute of Technology Rourkela, Indien.
"For at forbedre et komplekst regionalt problem såsom husholdningernes gæld eller sundhedsudfordringer, det er måske ikke tilstrækkeligt at have kendskab til gældsmønstre, eller af sygdom og eksponeringen. Tværtimod, vi bør forstå, hvorfor sådanne mønstre eksisterer, at have den bedste måde at ændre dem på. Tidligere modeller udviklet af forskere arbejdede med maksimalt to årsagsfaktorer, det vil sige, at de var bivariate modeller, som simpelthen ikke kunne finde flere funktionsafhængighedskriterier, " han siger.
Instrueret acykliske grafer
"MANM er baseret på Directed Acyclic Graphs (DAG'er), som kan identificere en multi-nodal kausal struktur. MANM kan estimere enhver mulig kausal retning i komplekse funktionssæt, uden manglende eller forkerte anvisninger."
Brugen af DAG'er er en vigtig årsag til, at MANM klarer sig markant bedre end modeller, der tidligere er udviklet af andre, som var baseret på uafhængig komponentanalyse (ICA), såsom lineær ikke-gaussisk acyklisk model (ICA-LiNGAM), Greedy DAG Search (GDS) og regression med efterfølgende uafhængig test (RESIT), han siger.
"En anden nøglefunktion ved MANM er den foreslåede Causal Influence Factor (CIF), for den vellykkede opdagelse af kausale retninger i det multivariate system. CIF-scoren giver en pålidelig indikator for kvaliteten af den tilfældige slutning, som gør det muligt at undgå de fleste af de manglende eller forkerte retninger i den resulterende kausale struktur, " afslutter Chakraverty.
Hvor et eksisterende datasæt er tilgængeligt, MANM gør det nu muligt at identificere flere multi-nodale kausale strukturer i sættet. Som et eksempel, MANM kan identificere de mange årsager til vedvarende husholdningsgæld for lav, mellem- og højindkomsthusstande i en region.
Sidste artikelTre trin mod sikrere og sundere software
Næste artikelDyserig brandmand er en robot, ligner en drage