Skematisk visning af positive data (æbler) og mangel på negative data (bananer), med en illustration af tilliden til æbledataene. Kredit:RIKEN
Et forskerhold fra RIKEN Center for Advanced Intelligence Project (AIP) har med succes udviklet en ny metode til maskinlæring, der gør det muligt for en AI at lave klassifikationer uden det, der er kendt som "negative data, "et fund, der kan føre til bredere anvendelse på en række klassificeringsopgaver.
Klassificering af ting er afgørende for vores daglige liv. For eksempel, vi skal opdage spam-mail, falske politiske nyheder, samt mere hverdagsagtige ting såsom genstande eller ansigter. Når du bruger AI, sådanne opgaver er baseret på "klassificeringsteknologi" i maskinlæring - idet computeren lærer ved hjælp af grænsen, der adskiller positive og negative data. For eksempel, "positive" data ville være billeder inklusive et glad ansigt, og "negative" datafotos, der indeholder et trist ansigt. Når en klassifikationsgrænse er lært, computeren kan afgøre, om en bestemt data er positiv eller negativ. Problemet med denne teknologi er, at det kræver både positive og negative data til læringsprocessen, og negative data er ikke tilgængelige i mange tilfælde (f.eks. det er svært at finde billeder med etiketten, "dette foto indeholder et trist ansigt, " da de fleste mennesker smiler foran et kamera.)
Med hensyn til virkelige programmer, når en forhandler forsøger at forudsige, hvem der vil foretage et køb, det kan let finde data om kunder, der har købt hos dem (positive data), men det er dybest set umuligt at indhente data om kunder, der ikke købte hos dem (negative data), da de ikke har adgang til deres konkurrenters data. Et andet eksempel er en fælles opgave for appudviklere:de skal forudsige, hvilke brugere der vil fortsætte med at bruge appen (positiv) eller stoppe (negativ). Imidlertid, når en bruger afmelder sig, udviklerne mister brugerens data, fordi de er nødt til fuldstændigt at slette data vedrørende denne bruger i overensstemmelse med privatlivspolitikken for at beskytte personlige oplysninger.
Ifølge hovedforfatter Takashi Ishida fra RIKEN AIP, "Tidligere klassificeringsmetoder kunne ikke klare situationen, hvor negative data ikke var tilgængelige, men vi har gjort det muligt for computere at lære med kun positive data, så længe vi har en konfidensscore for vores positive data, konstrueret af oplysninger som f.eks. købsintention eller app -brugers aktive sats. Ved hjælp af vores nye metode, vi kan kun lade computere lære en klassifikator ud fra positive data udstyret med tillid. "
Ishida foreslog, sammen med forskeren Gang Niu fra hans gruppe og teamleder Masashi Sugiyama, at de lader computere lære godt ved at tilføje tillidsscoren, hvilket matematisk svarer til sandsynligheden for, om dataene tilhører en positiv klasse eller ej. Det lykkedes dem at udvikle en metode, der kun kan lade computere lære en klassifikationsgrænse ud fra positive data og information om dens tillid (positiv pålidelighed) over for klassifikationsproblemer ved maskinlæring, der deler data positivt og negativt.
For at se, hvor godt systemet fungerede, de brugte det på et sæt fotos, der indeholder forskellige etiketter af modeartikler. For eksempel, de valgte "T-shirt, "som den positive klasse og et andet element, f.eks., "sandal", som den negative klasse. Derefter vedhæftede de en tillidsscore til "T-shirt"-billederne. De fandt ud af, at uden at få adgang til de negative data (f.eks. "sandaler" billeder), i nogle tilfælde, deres metode var lige så god som en metode, der involverer brug af positive og negative data.
Ifølge Ishida, "Denne opdagelse kan udvide anvendelsesområdet, hvor klassificeringsteknologi kan bruges. Selv på områder, hvor maskinlæring er blevet brugt aktivt, vores klassificeringsteknologi kunne bruges i nye situationer, hvor der kun kan indsamles positive data på grund af dataregulering eller forretningsbegrænsninger. I den nærmeste fremtid, vi håber at kunne bruge vores teknologi inden for forskellige forskningsområder, såsom naturlig sprogbehandling, computersyn, robotteknologi, og bioinformatik. "