Videnskab
 science >> Videnskab >  >> Elektronik

Hvordan en AI trænet til at læse videnskabelige artikler kunne forudsige fremtidige opdagelser

Kredit:CC0 Public Domain

"Kan maskiner tænke?", spurgte den berømte matematiker, kodeknuser og datalog Alan Turing for næsten 70 år siden. I dag, nogle eksperter er ikke i tvivl om, at kunstig intelligens (AI) snart vil være i stand til at udvikle den form for generel intelligens, som mennesker har. Men andre hævder, at maskiner aldrig vil måle sig. Selvom AI allerede kan udkonkurrere mennesker på visse opgaver – ligesom lommeregnere – kan de ikke læres menneskelig kreativitet.

Trods alt, vores opfindsomhed, som nogle gange er drevet af lidenskab og intuition snarere end logik og beviser, har gjort det muligt for os at gøre spektakulære opdagelser – lige fra vacciner til fundamentale partikler. En AI vil vel aldrig nogensinde være i stand til at konkurrere? Godt, det viser sig, at de kan. Et papir for nylig offentliggjort i Nature rapporterer, at en AI nu har formået at forudsige fremtidige videnskabelige opdagelser ved blot at udtrække meningsfulde data fra forskningspublikationer.

Sproget har en dyb forbindelse med tænkning, og det har formet menneskelige samfund, relationer og, ultimativt, intelligens. Derfor, det er ikke overraskende, at AI-forskningens hellige gral er den fulde forståelse af det menneskelige sprog i alle dets nuancer. Natural Language Processing (NLP), som er en del af en meget større paraply kaldet machine learning, har til formål at vurdere, udtrække og evaluere information fra tekstdata.

Børn lærer ved at interagere med den omgivende verden via forsøg og fejl. At lære at cykle involverer ofte et par stød og fald. Med andre ord, vi laver fejl, og vi lærer af dem. Det er præcis den måde, maskinlæring fungerer på, nogle gange med nogle ekstra "pædagogiske" input (supervised machine learning).

For eksempel, en AI kan lære at genkende objekter i billeder ved at opbygge et billede af et objekt ud fra mange individuelle eksempler. Her, et menneske skal vise det billeder, der indeholder objektet eller ej. Computeren laver så et gæt på, om den gør, og justerer sin statistiske model i henhold til gætningens nøjagtighed, som vurderet af mennesket. Men vi kan også lade computerprogrammet lave al den relevante læring selv (uovervåget maskinlæring). Her, AI begynder automatisk at kunne detektere mønstre i data. I begge tilfælde, et computerprogram skal finde en løsning ved at vurdere, hvor forkert det er, og prøv derefter at justere den for at minimere en sådan fejl.

Antag, at vi ønsker at forstå nogle egenskaber relateret til et bestemt materiale. Det oplagte skridt er at søge efter information fra bøger, websider og andre relevante ressourcer. Imidlertid, det er tidskrævende, da det kan involvere timevis af websøgning, læsning af artikler og speciallitteratur. NLP kan, imidlertid, Hjælp os. Via sofistikerede metoder og teknikker, computerprogrammer kan identificere begreber, gensidige forhold, generelle emner og specifikke egenskaber fra store tekstdatasæt.

I den nye undersøgelse, en AI lærte at hente information fra videnskabelig litteratur via uovervåget læring. Dette har bemærkelsesværdige konsekvenser. Indtil nu, de fleste af de eksisterende automatiserede NLP-baserede metoder overvåges, kræver input fra mennesker. På trods af at det er en forbedring i forhold til en rent manuel tilgang, dette er stadig et arbejdskrævende job.

Imidlertid, i den nye undersøgelse, forskerne skabte et system, der nøjagtigt kunne identificere og udtrække information uafhængigt. Det brugte sofistikerede teknikker baseret på statistiske og geometriske egenskaber af data til at identificere kemiske navne, begreber og strukturer. Dette var baseret på omkring 1,5 millioner abstracts af videnskabelige artikler om materialevidenskab.

Et maskinlæringsprogram klassificerede derefter ord i dataene baseret på specifikke funktioner såsom "elementer", "energi" og "bindere". For eksempel, "varme" blev klassificeret som en del af "energi", og "gas" som "elementer". Dette hjalp blandt andet med at forbinde visse forbindelser med typer af magnetisme og lighed med andre materialer, giver et indblik i, hvordan ordene var forbundet uden menneskelig indgriben.

Videnskabelige opdagelser

Denne metode kunne fange komplekse relationer og identificere forskellige lag af information, hvilket ville være praktisk talt umuligt at udføre af mennesker. Det gav indsigt i god tid i forhold til, hvad videnskabsmænd kan forudsige i øjeblikket. Faktisk, AI kunne anbefale materialer til funktionelle applikationer flere år før deres faktiske opdagelse. Der var fem sådanne forudsigelser, alt sammen baseret på papirer udgivet før år 2009. F.eks. AI formåede at identificere et stof kendt som CsAgGa2Se4as som et termoelektrisk materiale, som videnskabsmænd først opdagede i 2012. Så hvis AI havde eksisteret i 2009, det kunne have fremskyndet opdagelsen.

Det lavede forudsigelsen ved at forbinde forbindelsen med ord som "chalcogenid" (materiale indeholdende "chalcogenelementer" såsom svovl eller selen), "optoelektronisk" (elektroniske enheder, der kilde, detektere og kontrollere lys) og "fotovoltaiske applikationer". Mange termoelektriske materialer deler sådanne egenskaber, og AI var hurtig til at vise det.

Dette tyder på, at latent viden om fremtidige opdagelser i høj grad er indlejret i tidligere publikationer. AI-systemer bliver mere og mere uafhængige. Og der er intet at frygte. De kan hjælpe os enormt med at navigere gennem den enorme mængde data og information, som konstant skabes af menneskelige aktiviteter. På trods af bekymringer relateret til privatliv og sikkerhed, AI ændrer vores samfund. Jeg tror, ​​det vil føre os til at træffe bedre beslutninger, forbedre vores dagligdag og i sidste ende gøre os klogere.

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.




Varme artikler