Videnskab
 science >> Videnskab >  >> Elektronik

Data peger mod mere effektiv, sikre netværk

Professor i elektro- og computerteknik Abdallah Shami, sammen med sit team på Optimized Computing and Communications (OC2) laboratoriet i Western Engineering, bruger en database med 450 millioner datapunkter til at søge efter mønstre og anomalier, der kan blokere telekommunikationstjenester og kompromittere de mellemliggende servere. Kredit:Debora Van Brenk

Lad os sige, at en flok mennesker i en lille by i British Columbia forsøger at streame den seneste Star Wars-film.

Da algoritmer i Toronto genkender det store antal anmodninger, teleudbydere cacher automatisk en kopi af filmen på et mellemliggende netværks server på Vestkysten. Alle er glade - BC byfolk kan se en film uden at streame 'lag' og udbyderen, mens det er gået til en vis udgift, ved, at den har reageret smidigt på kundernes efterspørgsel.

Passér popcornene og sæt lyssværd af.

Men hvad nu hvis det krav ikke var, hvad det så ud til? Hvad hvis teleudbyderen kunne fastslå, at 400 af byens 500 hjem søgte den samme film, alt klokken 3 om morgenen på en tirsdag? Udbyderen ville sandsynligvis tro, at noget var galt i galaksen langt, langt væk.

De ville sandsynligvis spørge sig selv, om nogen forsøgte at hacke systemet. Og de ville helt sikkert genoverveje at investere netværksbåndbredde og hårde og bløde tjenester i den ene film i den lille by i de små timer på en tirsdag.

Det er den slags detaljer, western Electrical and Computer Engineering professor Abdallah Shami søger at opdage og kvantificere, mens hans team søger efter mønstre og anomalier, der kan blokere telekommunikationstjenester og kompromittere de mellemliggende servere - kendt som indholdsleveringsnetværk eller CDN'er, for kort.

Hans slutspil er at sikre disse netværk, levere bedre service til kunderne og hjælpe udbydere med at afsætte ressourcer, hvor de faktiske behov er størst.

For at opnå dette, Shami bruger en database med 450 millioner datapunkter fra juli 2019 leveret til ham af Ericsson, et af verdens førende teleselskaber.

"At have adgang til disse data er som en guldmine, " sagde Shami.

For hver anonymiseret indtastning - hvilket betyder, at ingen enkelt kunde kan identificeres - er der angivet forskellige funktioner, såsom antallet af modtagne bytes, tiden til at levere bytes, klientens IP, og en cache-hit-indikator.

På egen hånd, tallene er for store til at forstå. Men med forskernes analyser og oversættelser, dataene kan identificere, hvad der er normal kundeadfærd i forhold til, hvordan et ondsindet hack ser ud. De kan også vurdere den potentielle trussel i alle de grå områder af usikkerhed mellem disse to yderpunkter.

Shamis team på Optimized Computing and Communications (OC2) laboratoriet i Western Engineering bruger flere parallelle behandlingsbiblioteker til at gennemsøge millioner af datapunkter og finde mønstre for en lang række funktioner, der inkluderer frekvens, Beliggenhed, type og tidspunkt for anmodninger.

"Målet er bedre at forstå disse angribere og angrebsbegivenheder, så vi kan identificere mønstre, " han sagde.

Det næste skridt, derefter, er at udforske og designe sikkerhedsrammer for at forhindre netværksangreb og unormal adfærd. Det er en vanskelig opgave, der kræver maskinbaseret og softwarebaseret læring - kunstig intelligens, der ved, hvornår og hvordan man "læser" skiftende omstændigheder - plus menneskelig vurdering af risiko.

I tilfældet med vores fiktive by i British Columbia, for eksempel, det er muligt, at der overhovedet ikke finder noget slemt sted. Måske har disse særligt omgængelige beboere formået at organisere snesevis af visningsfester i hele samfundet, tidsindstillet til at starte med filmens officielle udgivelse ved middagstid i Berlin, Tyskland.

Alternativt måske er det et forsøg fra hackere på at opdage en svaghed i systemet og udnytte det.

Så hvorfor gør det en forskel? Med fire ord:kapacitet, koste, sikkerhed og service.

Datatrafik og internetbrug er vokset eksponentielt – med større efterspørgsel efter hurtigt og high-definition indhold end nogensinde før. "Dette illustreres af fremskrivningen af, at internetvideotrafik vil udgøre 82 procent af internettrafikken i 2020, med CDN-trafik, der leverer næsten to tredjedele af den samlede internetvideotrafik."

Efterspørgslen nødvendiggør også større og mere komplekse CDN'er, med større rækkevidde og kapacitet og mere interaktion med forskellige enheder og protokoller.

Sammen med en vækst i mængden af ​​indhold har der været en stigning i antallet af angribere, der ønsker at udnytte og overbelaste systemet, eller værre. Cyberkriminalitet koster virksomheder hundredvis af millioner af dollars om året, så have effektiv, pålidelig, skalerbar, meget distribueret, og sikre CDN-netværk er blevet et must for at imødekomme den øgede efterspørgsel efter indholdslevering.

For kunder, disse CDN'er er en vigtig (selvom usynlig) mellemmand, der sikrer kvalitetsservice tættere på hjemmet.

Hvis et CDN er kompromitteret, at streame video eller downloade data kan være som at prøve at jamme kugler gennem et timeglas.

Datasættet Shami og hans team af to kandidatstuderende arbejder på er statisk, men deres job er også at generere dynamiske computermodeller, der lærer over tid.

"Målet er at forbedre den regelbaserede model, " sagde han. "Det skal være fleksibelt nok til at give anbefalinger og resultater."

De arbejder på en algoritme, der vil tildele procentscore til unormale hændelser - for at forudsige, om udliggere repræsenterer forsøg på hacks eller, i stedet, er mere tilbøjelige til at være massebegivenheder på nettet. Tænk på Marshmellos virtuelle koncert på Fortnite, der tiltrak 10 millioner spillere i februar sidste år.

Shamis bredere forskning omfatter andre industripartnere, herunder at udføre dataanalyser i digital produktion og tilpasse cybersikkerhed i store netværk, for blot at nævne to eksempler.

Alt i alt, Shami har 14 medlemmer på sit OC2-laboratorium, der arbejder med relaterede problemer. Mange af dem arbejder med virksomheder og institutionelle virksomheder, der leder efter svar på lignende problemer.

Arbejdet har fordele langt ud over deres betydelige gavn for industrien, han sagde. Det betyder, at kandidat- og postdoc-studerende "bliver uddannet i meningsfulde problemer og finder løsninger", der vil hjælpe dem i deres post-universitetsliv.


Varme artikler