Bevægelsessensor 'kamerafælder' tager diskret billeder af dyr i deres naturlige miljø, giver ofte billeder, som ikke ellers kan observeres. Det kunstige intelligens-system behandler automatisk sådanne billeder, her korrekt rapporteret dette som et billede af to impalaer stående. Kredit:Snapshot Serengeti
Et nyt papir i Proceedings of the National Academy of Sciences (PNAS) rapporterer, hvordan en banebrydende kunstig intelligens-teknik kaldet deep learning automatisk kan identificere, tælle og beskrive dyr i deres naturlige levesteder.
Fotografier, der automatisk opsamles af bevægelsessensorkameraer, kan derefter automatisk beskrives af dybe neurale netværk. Resultatet er et system, der kan automatisere dyrs identifikation for op til 99,3 procent af billederne, mens de stadig udfører med den samme nøjagtighedsgrad på 96,6 procent som crowdsourcede teams af frivillige frivillige.
"Denne teknologi lader os præcist, diskret og billigt indsamle dyrelivsdata, som kunne hjælpe med at katalysere transformationen af mange områder inden for økologi, dyrelivsbiologi, zoologi, bevaringsbiologi og dyreadfærd til 'big data'-videnskab. Dette vil dramatisk forbedre vores evne til både at studere og bevare dyreliv og dyrebare økosystemer, " siger Jeff Clune, avisens seniorforfatter. Han er Harris Associate Professor ved University of Wyoming og senior forskningsleder ved Ubers Artificial Intelligence Labs.
Avisen er skrevet af Clune; hans ph.d. studerende Mohammad Sadegh Norouzzadeh; hans tidligere ph.d. studerende Anh Nguyen (nu ved Auburn University); Margaret Kosmala (Harvard University); Ali Swanson (University of Oxford); og Meredith Palmer og Craig Packer (begge fra University of Minnesota).
Dybe neurale netværk er en form for beregningsmæssig intelligens, der er løst inspireret af, hvordan dyrehjerner ser og forstår verden. De kræver store mængder træningsdata for at fungere godt, og dataene skal være nøjagtigt mærket (f.eks. hvert billede er korrekt mærket med hvilken dyreart der er til stede, hvor mange er der, etc.).
Denne undersøgelse indhentede de nødvendige data fra Snapshot Serengeti, et borgervidenskabsprojekt på http://www.zooniverse.org platformen. Snapshot Serengeti har indsat et stort antal "kamerafælder" (bevægelsessensorkameraer) i Tanzania, der samler millioner af billeder af dyr i deres naturlige habitat, såsom løver, leoparder, geparder og elefanter. Oplysningerne på disse billeder er kun nyttige, når de er blevet konverteret til tekst og tal. Årevis, den bedste metode til at udtrække sådan information var at bede crowdsourcede hold af frivillige om at mærke hvert billede manuelt. Studiet offentliggjort i dag udnyttede 3,2 millioner mærkede billeder produceret på denne måde af mere end 50, 000 menneskelige frivillige gennem flere år.
"Da jeg fortalte Jeff Clune, havde vi 3,2 millioner mærkede billeder, han stoppede i sit spor, " siger Packer, der leder Snapshot Serengeti-projektet. "Vi ville teste, om vi kunne bruge maskinlæring til at automatisere menneskelige frivilliges arbejde. Vores borgerforskere har udført et fænomenalt arbejde, men vi var nødt til at fremskynde processen for at håndtere stadig større mængder data. Den dybe læringsalgoritme er fantastisk og overgik langt mine forventninger. Dette er en game changer for dyrelivs økologi."
Swanson, der grundlagde Snapshot Serengeti, tilføjer:"Der er hundredvis af kamerafældeprojekter i verden, og meget få af dem er i stand til at rekruttere store hære af menneskelige frivillige til at udtrække deres data. Det betyder, at meget af viden i disse vigtige datasæt forbliver uudnyttet. Selvom projekter i stigende grad henvender sig til borgervidenskab til billedklassificering, vi begynder at se, at det tager længere og længere tid at mærke hver batch af billeder, efterhånden som efterspørgslen efter frivillige vokser. Vi tror på, at dyb læring vil være nøglen til at afhjælpe flaskehalsen for kamerafældeprojekter:indsatsen med at konvertere billeder til brugbare data."
"Ikke kun fortæller det kunstige intelligens-system dig, hvilke af 48 forskellige dyrearter der er til stede, men det fortæller dig også, hvor mange der er, og hvad de laver. Det vil fortælle dig, om de spiser, sover, hvis der er babyer til stede, etc., " tilføjer Kosmala, endnu en Snapshot Serengeti-leder. "Vi vurderer, at den deep learning-teknologipipeline, vi beskriver, vil spare mere end otte års menneskelig mærkningsindsats for hver yderligere 3 millioner billeder. Det er en masse værdifuld frivillig tid, som kan omplaceres til at hjælpe andre projekter."
Førsteforfatter Sadegh Norouzzadeh påpeger, at "Dyb læring forbedres stadig hurtigt, og vi forventer, at dens ydeevne kun vil blive bedre i de kommende år. Her, vi ønskede at demonstrere værdien af teknologien for det vilde økologisamfund, men vi forventer, at efterhånden som flere mennesker forsker i, hvordan man kan forbedre deep learning for denne applikation og udgive deres datasæt, himlen er grænsen. Det er spændende at tænke på alle de forskellige måder, hvorpå denne teknologi kan hjælpe med vores vigtige videnskabelige og bevarelsesopgaver."
Bladet, der udkommer i dag i PNAS er titlen, "Automatisk identifikation, tæller, og beskriver vilde dyr i kamerafældebilleder med dyb læring."