Kredit:CC0 Public Domain
Forskere bruger en slags maskinlæring kendt som sentimentanalyse til at vurdere succeser og fiaskoer med bevarelse af vilde dyr over tid. I deres undersøgelse, vises 19. marts i Mønstre -et nyt open access data science-tidsskrift fra Cell Press - forskerne vurderede abstracts af mere end 4, 000 undersøgelser af genindførelse af arter gennem fire årtier og fandt, at Generelt sagt, vi bliver bedre og bedre til at genindføre arter i naturen. De siger, at maskinlæring kunne bruges inden for dette felt og andre til at identificere de bedste teknikker og løsninger blandt den stadigt voksende mængde af videnskabelig forskning.
"Vi ønskede at lære nogle lektioner fra den enorme mængde af konserveringsbiologiske litteratur om genintroduktionsprogrammer, som vi kunne bruge her i Californien, når vi forsøger at sætte havoddere tilbage på steder, de ikke har strejfet rundt i årtier, " siger seniorforfatter Kyle Van Houtan, chefforsker ved Monterey Bay Aquarium. "Men det, der sad foran os, var millioner af ord og tusindvis af manuskripter. Vi spekulerede på, hvordan vi kunne udtrække data fra dem, som vi rent faktisk kunne analysere, og så vendte vi os til naturlig sprogbehandling."
Naturlig sprogbehandling er en slags maskinlæring, der analyserer strenge af menneskeligt sprog for at udtrække brugbar information, i det væsentlige tillader en computer at læse dokumenter som et menneske. Følelsesanalyse, som forskerne brugte i denne artikel, ser mere specifikt på et trænet sæt ord, der er blevet tildelt en positiv eller negativ følelsesmæssig værdi for at vurdere positiviteten eller negativiteten af teksten overordnet.
Forskerne brugte databasen Web of Science til at identificere 4, 313 arters genintroduktionsundersøgelser offentliggjort fra 1987 til 2016 med søgbare abstracts. Derefter brugte de adskillige "lavede" leksikon for sentimentanalyse - hvilket betyder, at ordene i dem allerede var blevet tildelt en følelsesscore baseret på ting som film- og restaurantanmeldelser - til at bygge en model, der kunne give hvert abstrakt en samlet score. "Vi behøvede ikke at træne modellerne, så efter at have kørt dem i et par timer havde vi pludselig alle disse resultater til vores rådighed, " siger Van Houtan. "Scoringerne gav os en tendens over tid, og vi kunne forespørge på resultaterne for at se, hvad følelsen var forbundet med undersøgelser af pandaer eller på californiske kondorer eller koralrev."
De tendenser, de så, tydede på større bevaringssucces. "Over tid, der er meget mindre usikkerhed i vurderingen af sentiment i undersøgelserne, og vi ser genintroduktionsprojekter blive mere succesfulde – og det er en stor takeaway, " siger han. "Når man ser på tusindvis af undersøgelser, det ser ud til, at vi bliver bedre til det, og det er opmuntrende."
"Hvis vi vil maksimere vores bevaringsdollar, så skal vi hurtigt kunne vurdere, hvad der virker, og hvad der ikke gør, " siger studiemedforfatter Lucas Joppa, Chief Environmental Officer hos Microsoft. "Maskinelæring, og naturlig sprogbehandling i særdeleshed, har evnen til at gennemsøge resultater og kaste lys over succeshistorier, som andre kan lære af."
For at sikre, at deres resultater var nøjagtige, forskerne kiggede på de mest almindelige indikatorer for positiv stemning (og derfor bevaringssucces) i deres resultater og fandt ord som "succes, " "beskytte, " "vækst, " "support, " "Hjælp, " og "fordele"; ord, der indikerede negativ følelse, var ord som "true, " "tab, " "risiko, " "trussel, " "problem, " og "dræb." Disse ord stemte overens med, hvad de, som mangeårige bevaringsbiologer, vil typisk bruge til at indikere succes og fiasko i deres egne studier. De fandt også, at tendenser beskrevet af sentimentanalysen for specifikke genindførelsesprogrammer, der vides at være succeser eller fiaskoer (som genindførelsen af den californiske kondor) matchede de kendte resultater.
Forskerne siger, at stemningsanalyse fra hylden fungerede overraskende godt for dem, sandsynligvis fordi mange ord brugt i bevaringsbiologi er en del af vores daglige leksikon og derfor var nøjagtigt kodet med den passende følelse. På andre områder, de mener, at der skal gøres mere arbejde for at udvikle og træne en model, der nøjagtigt kunne kode følelsen af mere tekniske, feltspecifikt sprog og syntaks. En anden begrænsning, de siger, er, at kun et begrænset antal af de papirer, de forsøgte at analysere, var åben adgang, hvilket betød, at de skulle vurdere abstracts frem for hele papirer. "Vi ridser egentlig bare i overfladen her, men dette er bestemt et skridt i den rigtige retning, " siger Van Houtan.
Stadig, de mener, at dette er en teknik, der kan og bør anvendes bredere inden for både bevaringsbiologi og andre områder for at give mening i de enorme mængder forskning, der nu udføres og publiceres. "Så meget lokalt bevaringsarbejde går ubemærket hen af det globale bevaringssamfund, og dette papir viser, hvordan maskinlæring kan hjælpe med at lukke informationskløften, " siger Joppa.
"Mange af disse teknikker har været i brug i over et årti i kommercielle omgivelser, men vi håber at omsætte dem til omgivelser som vores for at bekæmpe klimaændringer eller plastikforurening eller for at fremme bevarelse af truede arter, " siger Van Houtan. "Der er et væld af data, der er lige ved hånden, men det er denne sovende kæmpe, fordi den ikke er ordentligt sammensat eller organiseret, hvilket gør det udfordrende at analysere. Vi ønsker at forbinde mennesker med ideer, kapacitet, og tekniske løsninger, de ellers ikke ville støde på, så vi kan bringe nogle fremskridt til disse tilsyneladende uløselige problemer."