Falske nyheder via OpenAI:Veltalende usammenhængende?

Kredit:CC0 Public Domain

OpenAI's tekstgenerator, maskinlæringsdrevet - så kraftfuldt, at det blev anset for farligt at udgive til offentligheden, har, Gæt hvad, blevet frigivet.

OpenAI offentliggjorde et blogindlæg, der bekendtgjorde sin beslutning om at frigive algoritmen i sin helhed, da den "ikke har set nogen stærke beviser for misbrug indtil videre."

Godt, det var en vending.

Det var først tilbage i februar, da OpenAI talte om en sprogmodel kaldet GPT-2, der genererer tekstafsnit.

Engadget :"AI'en, GPT-2, blev oprindeligt designet til at besvare spørgsmål, opsummere historier og oversætte tekster. Men forskere kom til at frygte, at det kunne bruges til at pumpe store mængder misinformation ud."

Tom McKay ind Gizmodo bemærkede, hvordan tekstgeneratoren var "trænet på omkring 40 gigabyte data hentet fra otte millioner websteder" og god til at generere tekst fra en given prompt.

Randen James Vincent talte også om det. "Systemet blev trænet på otte millioner tekstdokumenter skrabet fra nettet og reagerer på tekstuddrag leveret af brugere. Giv det en falsk overskrift, for eksempel, og det vil skrive en nyhed; giv det den første linje i et digt, og det vil levere et helt vers."

Så hvorfor er deres algoritme blevet frigivet fuldt ud? Har offentligheden ikke nok til at bekymre sig om falske nyheder, falsk kritik, politisk propaganda?

Udover, blogindlægget fra februar tog, hvad der så ud til at være en så imponerende hovedvej for at vise, at verden, etiske overvejelser, var i top.

"Vores model, kaldet GPT-2 (en efterfølger til GPT), blev trænet i at forudsige det næste ord i 40 GB internettekst. På grund af vores bekymringer om ondsindede anvendelser af teknologien, vi frigiver ikke den trænede model. Som et eksperiment i ansvarlig afsløring, vi udgiver i stedet en meget mindre model, som forskere kan eksperimentere med, samt et teknisk papir."

Katyanna Quach ind Registeret leverede en tidslinje over OpenAI tech-optrædenerne i etaper. "Det San Francisco-baserede forskningslaboratorium testede foreløbigt vandet ved at frigive større og større modeller, startende fra blot et par hundrede millioner parametre.

"Den mindste version indeholdt 117 millioner parametre, den anden havde 345 millioner parametre, den tredje bestod af 774 millioner parametre, og den største, udgivet tirsdag d. har hele 1,5 milliarder parametre. Jo flere parametre, jo mere kraftfuld og dygtig er modellen, Generelt sagt."

Så, hvad overbeviste dem om at tage frakørslen fra hovedvejen? Hvilken grund havde de til at tro, at nu var en mere sikker tid end nogensinde før? Hvad skete der med den holdning, at den var for farlig at dele?

"Vi har ikke set nogen stærke beviser for misbrug indtil videre, " sagde de i deres indlæg den 5. november. "Selvom vi har set nogle diskussioner omkring GPT-2's potentiale til at argumentere for højvolumen/lavt udbytte operationer som spam og phishing, vi har ikke set beviser for at skrive kode, dokumentation, eller tilfælde af misbrug."

I mellemtiden James Vincent ind Randen vovede at lufte muligheden for, at denne "farlige" forestilling netop var det, en forestilling om, at hvad angår deres fake-news model, kan ikke have været påkrævet i første omgang.

Der var bekymring for, at nem adgang til et sådant AI-værktøj kunne tilfredsstille planerne for ondsindede aktører, og den ansvarlige måde at håndtere dette på var at frigive modellen på en begrænset måde. En god tilgang? Eller forhindrede det yderligere forskning? "

Du kan nu prøve det på et websted, som kører GPT-2-modellen i fuld størrelse, kaldet 1558M. Webgrænsefladen blev bygget af Adam King ved hjælp af den fulde GPT-2-udgivelse fra OpenAI, sagde Registeret .

Denne skribent forsøgte at udforske, hvad den kan gøre med en startsætning "Babyer kan vaske op." Det, der fulgte, var et vanvittigt miks af logik og emnespring. Ikke desto mindre bar sætningerne respektabel grammatik, stemme og stil. Nogle uddrag:

"Også, denne idé om, at børn ikke er i stand til at bruge en vaskemaskine, er latterlig.

"For så vidt angår ideen om, at dit barn er en vask vandhane, det er en idé, som jeg personligt ikke tror, jeg kan holde ud. Jeg har været kendt for at bruge en vask vandhane, når jeg laver mad. Jeg kan vaske op i en vask.

"Når dit barn sidder på dit skød, og du holder i vaskekluden og bruger vandet til at vaske op med, du gør nok ikke noget."

James Vincent ramte målet med en vurdering på tre ord:"uhyggelig overbevisende skrivning."

Quach gjorde også en pointe, der var værd at gentage. "Lejlighedsvis, den spytter sætninger ud, der er overraskende gode, men mens den bliver ved med at vælte tekst, det bliver usammenhængende."

Quach havde en forfriskende grund til, at OpenAI har bidraget til menneskeheden. "Vi har en sidste tanke om denne fascinerende AI-forskning:den har i det mindste sat en bar for menneskelige forfattere. Hvis du vil skrive nyheder eller kronikker, blogindlæg, marketing e-mails, og lignende, ved, at du nu skal være bedre end GPT-2's semi-kohærente output. Ellers, folk kan lige så godt bare læse en bots output end dit eget."

Sidste artikelTop antitrust håndhæver advarer Big Tech om dataindsamling

Næste artikelTeknologiske virksomheder skynder sig at bekæmpe misinformation forud for afstemningen i Storbritannien