Dette billede fra august 2017 leveret af Shamima Khatoon viser Khatoon i New Delhi. Khatoons opgave med at kommentere biler, vognbanemarkører og trafiklys ved en kvindelig forpost for datamærkningsvirksomheden iMerit i Metiabruz, Indien, repræsenterer den eneste chance, hun har for at arbejde uden for hjemmet i en konservativ muslimsk region i Indien. (Mushtari Fatma Zarin / Courtesy of Shamima Khatoon via AP)
Der er en beskidt lille hemmelighed om kunstig intelligens:Den er drevet af hundredtusindvis af rigtige mennesker.
Fra makeupartister i Venezuela til kvinder i konservative dele af Indien, mennesker rundt om i verden laver det digitale svar til håndarbejde — tegner kasser rundt om biler på gadebilleder, tagging af billeder, og transskribere stumper af tale, som computere ikke helt kan se.
Sådanne data føres direkte ind i "machine learning"-algoritmer, der hjælper selvkørende biler med at vinde gennem trafikken og lader Alexa finde ud af, at du vil have lysene tændt. Mange sådanne teknologier ville ikke fungere uden enorme mængder af disse menneskemærkede data.
Disse gentagne opgaver betaler øre stykket. Men i bulk, dette arbejde kan tilbyde en anstændig løn i mange dele af verden - selv i USA. Denne spirende, men stort set usete hytteindustri repræsenterer grundlaget for en teknologi, der kan ændre menneskeheden for altid:AI, der vil drive os rundt, udføre verbale kommandoer uden fejl, og, eventuelt, en dag tænke på egen hånd.
___
Denne menneskelige inputindustri er længe blevet plejet af søgemaskinerne Google og Bing, som i mere end et årti har brugt folk til at vurdere nøjagtigheden af deres resultater. Siden 2005 har Amazons Mechanical Turk-tjeneste, som matcher freelancearbejdere med midlertidige onlinejob, har også gjort crowd-sourced dataindtastning tilgængelig for forskere verden over.
For nylig, investorer har hældt titusindvis af millioner dollars ind i startups som Mighty AI og CrowdFlower, som udvikler software, der gør det nemmere at mærke billeder og andre data, selv på smartphones.
Denne udaterede kombination af billeder leveret af CrowdFlower viser før og efter gengivelser fra CrowdFlowers Human-in-the-Loop-teknologi, som giver sofistikerede værktøjer, der gør det muligt for en person at mærke og strukturere hver del af et normalt foto og konvertere det til strukturerede "træningsdata", som et AI-system kan forstå og fortolke. (CrowdFlower via AP)
Venturekapitalisten S. "Soma" Somasegar siger, at han ser "muligheder for milliarder af dollars" i at servicere behovene for maskinlæringsalgoritmer. Hans firma, Madrona Venture Group, investeret i Mighty AI. Mennesker vil være i løkken "i lang tid, lang, lang tid endnu, " han siger.
Nøjagtig mærkning kan gøre forskellen mellem en selvkørende bil, der skelner mellem himlen og siden af en lastbil - en skelnen Teslas Model S fejlede i det første kendte dødsfald, der involverede selvkørende systemer i 2016.
"Vi bygger ikke et system til at spille et spil, vi bygger et system til at redde liv, " siger Mighty AI CEO Daryn Nakhuda.
___
Marjorie Aguilar, en 31-årig freelance makeupartist i Maracaibo, Venezuela, bruger fire til seks timer om dagen på at tegne kasser rundt om trafikgenstande for at hjælpe med at træne selvkørende systemer til Mighty AI.
Hun tjener omkring 50 øre i timen, men i et kriseramt land med løbsk inflation, blot et par timers arbejde kan betale en måneds husleje i bolivar.
"Det lyder ikke som mange penge, men for mig er det ret anstændigt, " siger hun. "Du kan forestille dig, hvor vigtigt det er for mig at blive betalt i amerikanske dollars."
Dette udaterede billede leveret af Marjorie Aguilar viser Aguilar i Maracaibo, Venezuela. Aguilar, en freelance makeupartist i Maracaibo, bruger fire til seks timer om dagen på at tegne kasser rundt om trafikgenstande for at hjælpe med at træne selvkørende systemer til Mighty AI. (Med tilladelse fra Marjorie Aguilar via AP)
Aria Khrisna, en 36-årig far til tre i Tegal, Indonesien, siger, at det at gøre ting som at tilføje ordmærker til tøjbilleder på websteder som eBay og Amazon betaler ham omkring $100 om måneden, omkring halvdelen af sin indkomst.
Og for den 25-årige Shamima Khatoon, hendes job med at kommentere biler, vognbanemarkører og trafiklys ved en kvindelig forpost for datamærkningsvirksomheden iMerit i Metiabruz, Indien, repræsenterer den eneste chance, hun har for at arbejde uden for hjemmet i sit konservative muslimske samfund.
"Det er en god platform til at øge dine færdigheder og støtte din familie, " hun siger.
___
Store bilproducenter som Toyota, Nissan og Ford, Kørsel-firmaer som Uber og andre teknologigiganter som Alphabet Inc.'s Waymo betaler masser af etiketter, ofte gennem tredjepartsleverandører.
Fordelene ved større nøjagtighed kan være umiddelbare.
Hos InterContinental Hotels Group, hvert opkald, som dens digitale assistent Amelia kan tage fra et menneske, sparer $5 til $10, siger informationsteknologidirektør Scot Whigham.
I denne 8. nov. 2017, foto Jessica McShane, en medarbejder hos Interactions Corp., overvåger person-til-computer kommunikation, hjælpe computere med at forstå, hvad et menneske siger, i "hensigtsanalyse"-rummet i virksomhedens hovedkvarter i Franklin, Mass. Når en computer ikke kan foretage et kundeopkald til Hyatt Hotels-kæden, et lydstykke sendes til AI-drevet callcenter Interactions. der, mens kunden venter i telefonen, en analytiker transskriberer alt fra fejlhørte tal til bandeord og instruerer hurtigt computeren, hvordan den skal reagere. (AP Photo/Steven Senne)
Når Amelia fejler, programmet lytter, mens et opkald omdirigeres til en af omkring 60 servicedesk-medarbejdere. Den lærer af deres svar og afprøver teknikken ved næste opkald, frigøre menneskelige medarbejdere til at gøre andre ting.
"Vi har forvandlet de job, " siger Whigham.
Når en computer ikke kan foretage et kundeopkald til Hyatt Hotels-kæden, et lydstykke sendes til AI-drevet callcenter Interaktioner i en gammel murstensbygning i Franklin, Massachusetts.
der, mens kunden venter i telefonen, en af et værelse fuld af "hensigtsanalytikere", der bærer hovedtelefoner, transskriberer alt fra mishørte numre til bandeord og instruerer hurtigt computeren, hvordan den skal reagere.
Disse oplysninger føres tilbage til systemet. "Næste gang, vi har en bedre chance for at få succes, " siger Robert Nagle, Interactions' teknologichef.
___
Forskere har forsøgt at finde løsninger på menneskemærkede data, men resultaterne er ofte utilstrækkelige.
I denne 8. nov. 2017, Foto, Jessica McShane, en medarbejder hos Interactions Corp., forgrunden, overvåger person-til-computer kommunikation, hjælpe computere med at forstå, hvad et menneske siger, i "hensigtsanalyse"-rummet i virksomhedens hovedkvarter i Franklin, Mass. "Denne information bruges til at feedback ind i systemet ved hjælp af maskinlæring til at forbedre vores model, " sagde Robert Nagle, Interactions' teknologichef. "Næste gang, vi har en bedre chance for at få succes." (AP Photo/Steven Senne)
I et projekt, der brugte Google Street View-billeder af parkerede biler til at estimere den demografiske sammensætning af kvarterer, daværende Stanford-forsker Timnit Gebru forsøgte at træne sin AI ved at skrabe Craigslist-billeder af biler til salg, som var mærket af deres ejere.
Men produktbillederne lignede ikke bilbillederne i Street View, og programmet kunne ikke genkende dem. Til sidst, hun siger, hun brugte $35, 000 for at hyre autoforhandlereksperter til at mærke hendes data.
Behovet for menneskelige etiketter er "enormt" og "dynamisk, " siger Robin Bordoli, direktør for mærkningsteknologivirksomheden CrowdFlower. "Du kan ikke stole 100 procent på algoritmen."
___
I øjeblikket, at finde ud af, hvordan man får computere til at lære uden såkaldte "grundsandhed"-data leveret af mennesker, forbliver et åbent forskningsspørgsmål.
Trevor Darrell, en maskinlæringsekspert ved University of California Berkeley, siger, at han forventer, at der vil gå fem til 10 år, før computeralgoritmer kan lære at fungere uden behov for menneskelig mærkning.
Alene hans gruppe bruger hundredtusindvis af dollars om året på at betale folk for at kommentere billeder. "Lige nu, hvis du sælger et produkt, og du vil have perfektion, det ville være uagtsomt ikke at investere pengene i den slags anmærkninger, " han siger.
Denne onsdag, 29. nov., 2017, billede leveret af Aria Khrisna viser Krishna og hans 3-årige søn Raka. Khrisna, en 36-årig far til tre i Tegal, Indonesien, siger, at det at gøre ting som at tilføje ordmærker til tøjbilleder på websteder som eBay og Amazon betaler ham omkring $100 om måneden, omkring halvdelen af sin indkomst. (Indah Nurul Hidayah/Aria Khrisna via AP)
Adskillige virksomheder som Alphabets Waymo og spilproducenten Unity Technologies udvikler simulerede verdener for at træne deres algoritmer i kontrollerede scenarier, hvor hvert objekt er foruddefineret.
For det meste, selv virksomheder, der forsøger at skubbe mennesker ud af løkken, stoler stadig på dem.
CloudSight, for eksempel, tilbyder websteds- og app-udviklere et praktisk værktøj til at uploade et billede og få et par ord tilbage, der beskriver det. Forhandleren Kohl's bruger tjenesten til en "Snap and Shop" visuel søgefunktion på sin app.
Men det er ikke kun et fancy computerprogram, der spytter svar tilbage. Hvis algoritmen ikke har et godt svar, en af sine 800 ansatte i steder som Indien, Sydøstasien eller Afrika skriv svaret i realtid.
"Vi ønsker at være dem, der kan mærke ethvert billede uden nogen menneskelig involvering, " siger Ian Parnes, CloudSights chef for forretningsudvikling. "Hvor lang tid det vil tage er nogens gæt."
© 2018 The Associated Press. Alle rettigheder forbeholdes.