Videnskab
 science >> Videnskab >  >> Elektronik

Datakompatibilitet kan håndhæves ved AI -scanning af internettet for krænkelser af fortrolige oplysninger

Et eksempel på en simpel videngraf. Kredit:Karuna Pande Joshi, CC BY-ND

Du efterlader stumper af personlige data - f.eks. Kreditkortnumre, indkøbspræferencer og hvilke nyhedsartikler du læser - mens du rejser rundt på internettet. Store internetvirksomheder tjener penge på denne form for personlige oplysninger ved at dele dem med deres datterselskaber og tredjeparter. Offentlig bekymring over online privatliv har ført til love designet til at kontrollere, hvem der får disse data, og hvordan de kan bruge dem.

Slaget er i gang. Demokrater i det amerikanske senat indførte for nylig et lovforslag, der indeholder sanktioner for teknologivirksomheder, der forkert håndterer brugernes personlige data. Denne lov ville slutte sig til en lang række regler og forskrifter verden over, herunder betalingskortindustriens datasikkerhedsstandard, der regulerer online kreditkorttransaktioner, Den Europæiske Unions generelle databeskyttelsesforordning, California Consumer Privacy Act, der trådte i kraft i januar, og U.S. Children's Online Privacy Protection Act.

Internetvirksomheder skal overholde disse regler eller risikere dyre retssager eller offentlige sanktioner, såsom Federal Trade Commission's nylige bøde på 5 milliarder dollars pålagt Facebook.

Men det er teknisk udfordrende at afgøre i realtid, om der er sket en krænkelse af privatlivets fred, et problem, der bliver endnu mere problematisk, da internetdata bevæger sig i ekstrem skala. For at sikre, at deres systemer overholder virksomheder er afhængige af menneskelige eksperter til at fortolke lovene-en kompleks og tidskrævende opgave for organisationer, der konstant lancerer og opdaterer tjenester.

Min forskergruppe ved University of Maryland, Baltimore County, har udviklet nye teknologier til maskiner til at forstå love om databeskyttelse og håndhæve overholdelse af dem ved hjælp af kunstig intelligens. Disse teknologier vil gøre det muligt for virksomheder at sikre, at deres tjenester overholder love om privatlivets fred og også hjælpe regeringer med i realtid at identificere de virksomheder, der krænker forbrugernes fortrolighedsrettigheder.

Hjælpemaskiner med at forstå regler

Regeringer genererer onlinefortrolighedsregler som almindelige tekstdokumenter, der er lette for mennesker at læse, men vanskelige for maskiner at fortolke. Som resultat, reglerne skal undersøges manuelt for at sikre, at der ikke brydes regler, når en borgeres private data analyseres eller deles. Dette påvirker virksomheder, der nu skal overholde en skov af regler.

Regler og regler er ofte tvetydige af design, fordi samfund ønsker fleksibilitet i implementeringen af ​​dem. Subjektive begreber som godt og ondt varierer mellem kulturer og over tid, så love er udarbejdet i generelle eller vage vilkår for at give mulighed for fremtidige ændringer. Maskiner kan ikke behandle denne uklarhed - de fungerer i 1'er og 0'er - så de kan ikke "forstå" privatliv på den måde, mennesker gør. Maskiner har brug for specifikke instruktioner for at forstå den viden, som en regulering er baseret på.

Forskernes ansøgning udtrak automatisk deontiske regler, f.eks. tilladelser og forpligtelser, fra to fortrolighedsregler. Enheder, der er involveret i reglerne, er markeret med gult. Modale ord, der hjælper med at identificere, om en regel er en tilladelse, forbud eller forpligtelse er markeret med blåt. Grå angiver det tidsmæssige eller tidsbaserede aspekt af reglen. Kredit:Karuna Pande Joshi, CC BY-ND

En måde at hjælpe maskiner med at forstå et abstrakt koncept er ved at opbygge en ontologi, eller en graf, der repræsenterer kendskabet til dette koncept. Lån begreberne ontologi fra filosofi, nye computersprog, såsom OWL, er udviklet i AI. Disse sprog kan definere begreber og kategorier i et fagområde eller domæne, vise deres egenskaber og vise relationerne imellem dem. Ontologier kaldes undertiden "vidensgrafer, "fordi de er gemt i grafiske strukturer.

Da mine kolleger og jeg begyndte at se på udfordringen med at gøre fortrolighedsregler forståelige for maskiner, vi fastslog, at det første trin ville være at fange al nøgleviden i disse love og oprette vidensgrafer for at gemme den.

Udtræk af vilkår og regler

Den centrale viden i reglerne består af tre dele.

Først, der er "kunstbegreber":ord eller sætninger, der har præcise definitioner inden for en lov. De hjælper med at identificere den enhed, som forordningen beskriver, og giver os mulighed for at beskrive dens roller og ansvar på et sprog, som computere kan forstå. For eksempel, fra EU's generelle databeskyttelsesforordning, vi udtrak kunstbegreber som "Forbrugere og udbydere" og "Bøder og håndhævelse".

Næste, vi identificerede deontiske regler:sætninger eller sætninger, der giver os filosofisk modal logik, som omhandler deduktiv adfærd. Deontiske (eller moralske) regler inkluderer sætninger, der beskriver pligter eller forpligtelser og falder hovedsageligt i fire kategorier. "Tilladelser" definerer rettighederne for en enhed/aktør. "Forpligtelser" definerer ansvaret for en enhed/aktør. "Forbud" er betingelser eller handlinger, der ikke er tilladt. "Dispensationer" er valgfrie eller ikke -obligatoriske erklæringer.

For at forklare dette med et enkelt eksempel, overvej følgende:

  • Du har tilladelse til at køre.
  • Men at køre, du er forpligtet til at få kørekort.
  • Det er forbudt at køre for hurtigt (og vil blive straffet, hvis du gør det).
  • Du kan parkere i områder, hvor du har dispensation til at gøre det (f.eks. Betalt parkering, afmålt parkering eller åbne områder ikke i nærheden af ​​en brandhane).

vidensgraf for GDPR -regler. Kredit:Karuna Pande Joshi, CC BY-ND

Nogle af disse regler gælder for alle ensartet under alle forhold; mens andre kan anvende delvist, til kun én enhed eller baseret på betingelser, som alle har accepteret.

Lignende regler, der beskriver do's and don'ts, gælder for online personoplysninger. Der er tilladelser og forbud mod at forhindre databrud. Der er forpligtelser for de virksomheder, der gemmer dataene, for at sikre deres sikkerhed. Og der er dispensationer til sårbare demografier som for eksempel mindreårige.

Min gruppe udviklede teknikker til automatisk at udtrække disse regler fra reglerne og gemme dem i en vidensgraf.

For det tredje, vi var også nødt til at finde ud af at inkludere krydshenvisninger, der ofte bruges i lovbestemmelser til at henvise til tekst i et andet afsnit i forordningen eller i et separat dokument. Det er vigtige videnselementer, der også bør gemmes i vidensgrafen.

Regler på plads, scanning for overholdelse

Efter at have defineret alle nøgleenhederne, ejendomme, relationer, regler og politikker for en databeskyttelseslov i en videngraf, mine kolleger og jeg kan oprette applikationer, der kan begrunde reglerne om databeskyttelse ved hjælp af disse vidensgrafer.

Disse applikationer kan reducere den tid, det vil tage virksomheder at afgøre, om de overholder databeskyttelsesreglerne, betydeligt. De kan også hjælpe tilsynsmyndighederne med at overvåge datarevisionsspor for at afgøre, om virksomheder, de overvåger, overholder reglerne.

Denne teknologi kan også hjælpe enkeltpersoner med at få et hurtigt øjebliksbillede af deres rettigheder og ansvar med hensyn til de private data, de deler med virksomheder. Når maskiner hurtigt kan fortolke længe, komplekse privatlivspolitikker, folk vil være i stand til at automatisere mange dagligdagse compliance -aktiviteter, der udføres manuelt i dag. De kan også være i stand til at gøre disse politikker mere forståelige for forbrugerne.

Denne artikel er genudgivet fra The Conversation under en Creative Commons -licens. Læs den originale artikel.




Varme artikler