Videnskab
 science >> Videnskab >  >> Andet

Big data bliver omformet takket være 100 år gamle ideer om geometri

Kredit:Elesey/Shutterstock

Din hjerne består af milliarder af neuroner forbundet med billioner af synapser. Og hvordan de er arrangeret, giver anledning til hjernens funktionalitet og til din personlighed. Det er grunden til, at videnskabsmænd i Schweiz for nylig producerede det første digitale 3-D hjernecelleatlas nogensinde. en komplet kortlægning af hjernen på en mus. Selvom dette er en kolossal præstation, den store udfordring ligger nu i at lære at tyde atlasset. Og det er en kæmpe en.

Videnskaben er fuld af denne slags problemer:hvordan man kan omdanne store mængder information til nyttig indsigt. I mange år, forskere stolede på matematik og statistik for at udforske data. Eksplosionen af ​​store datasæt skabt af digital lagring, internettet, og billige sensorer har ført til udviklingen af ​​nye teknikker designet specifikt til at håndtere disse "big data".

Og nu er der en ny tilgang baseret på århundredgamle ideer, der producerer overlegne værktøjer til at forstå visse typer big data. Ved at bruge musens hjerne som eksempel, dens fysiske form bestemmer dens funktionalitet. Men en præcis beskrivelse af denne form, som vi har nu, afslører ikke automatisk alt om, hvordan hjernen fungerer.

Bag den fysiske form ligger en mere abstrakt form dannet af forbindelserne i hjernen. At fange aspekter af denne form ved at anvende teknikker fra studiet af det, der er kendt som "topologi", kan hjælpe med at afsløre en dybere forståelse af hjernens funktion. Det samme vejledende princip for at bruge topologiske teknikker på big data har også anvendelser i lægemiddeludvikling og andre banebrydende bestræbelser.

Topologi

Topologi er en gren af ​​moderne geometri med rødder, der går tilbage til en grundlæggende observation af den schweiziske matematiker Leonhard Euler (1707-1783) om polyedre, 3D-former med flade ansigter, lige kanter og skarpe hjørner eller "spidser". I 1750, Euler opdagede, at for enhver konveks (med alle dens ansigter pegende udad) polyeder, antallet af hjørner minus antallet af kanter plus antallet af flader er altid lig med to.

Du kan anvende den samme formel på andre former for at få det, der er kendt som deres Euler-karakteristik. Dette tal ændres ikke, uanset hvordan formen er bøjet eller deformeret. Og topologi er studiet af den slags konstante egenskaber ved former.

Topologi gennemgik en rivende udvikling i løbet af det 20. århundrede som et fremtrædende emne i ren matematik. Forskerne, der skabte emnet, havde ikke applikationer i den virkelige verden i tankerne, de var bare interesserede i, hvad der var matematisk sandt om former under visse forhold.

Alligevel finder nogle af disse ideer fra topologi, der har eksisteret i over 100 år, nu betydelige anvendelser inden for datavidenskab. Fordi topologi fokuserer på konstante egenskaber, dens teknikker gør den ufølsom over for forskellige dataunøjagtigheder eller "støj". Dette gør den ideel til at tyde den sande betydning bag de indsamlede data.

Et knudret problem. Kredit:VIKTORIIA NOVOKHATSKA/Shutterstock

Du er sikkert bekendt med et almindeligt topologisk fænomen. Ledninger placeret pænt i din taske om morgenen (dine høretelefoner eller en adapter) har en tendens til at skabe et forfærdeligt rod ved middagstid. En ledning er en meget enkel form. Hvorvidt det er knyttet eller ej, er et topologisk spørgsmål, og tendensen til at nå frem til et topologisk mareridt i din taske er nu ret godt forstået.

For millioner af år siden, evolutionen blev konfronteret med et lignende problem. DNA i celler er et molekyle sammensat af to oprullede kæder. Hver kæde er en meget lang tråd, bygget op af en sekvens af små molekyler kaldet nukleobaser. Når en celle deler sig, disse ledninger afvikles, replikere og derefter spole op igen. Men ligesom ledninger i en pose, DNA-strengene kan blive sammenfiltrede, som forhindrer cellen i at dele sig og får den til at dø.

Særlige enzymer i cellen kaldet topoisomeraser har til opgave at forhindre en sådan katastrofe. Og bevidst forstyrrelse af bakteriers topoisomeraser forhindrer dem i at sprede sig og stopper dermed en infektion. Det betyder, at en bedre forståelse af, hvordan topoisomeraser forhindrer sammenfiltring af DNA, kan hjælpe os med at designe nye antibiotika. Og da sammenfiltring er et rent topologisk træk, topologiske teknikker kan hjælpe os med det.

Lægemiddeludvikling

Topologi kan også bruges til at forbedre skabelsen af ​​nye lægemidler. Farmaceutiske lægemidler er kemikalier designet til at interagere med bestemte celler i kroppen på en bestemt måde. Specifikt, celler har receptorer på sig, der tillader molekyler af en bestemt form at låse sig fast på dem, ændrer cellernes adfærd. Så at producere lægemidler med disse formede molekyler gør dem i stand til at målrette og påvirke de rigtige celler.

Det viser sig, at fremstille et molekyle til at have en bestemt form er en ret simpel proces. Men den nemmeste måde at få stoffet til målcellerne på er at sende dem via blodbanen, og for det, lægemidlet skal være vandopløseligt. Efter at et lægemiddel med en korrekt form er fremstillet, spørgsmålet om million pund er:opløses det i vand? Desværre, dette er et meget svært spørgsmål at besvare blot ud fra at kende molekylets kemiske struktur. Mange lægemiddelopdagelsesprojekter mislykkes på grund af opløselighedsproblemer.

Det er her topologi kommer ind i billedet. "Molekylerum" refererer til en måde at tænke på en hel samling af molekyler som en slags matematisk entitet, der kan studeres geometrisk. At have et kort over dette rum ville være et enormt værktøj til at producere nye lægemidler, især hvis kortet indeholdt vartegn, der indikerer større chancer for opløselighed.

I det seneste arbejde, forskere brugte topologiske dataanalyseværktøjer som et første skridt til at producere et sådant kort. Analyse af enorme mængder data, der forbinder molekyleegenskaber med vandopløselighed, den nye tilgang førte til opdagelsen af ​​nye, tidligere uanede, indikatorer for opløselighed. Denne forbedrede evne til at producere vandopløselige lægemidler har potentialet til betydeligt at forkorte den tid, det tager at skabe en ny behandling, og for at gøre hele processen billigere.

I flere og flere videnskabsområder, forskere er ved at finde sig selv med flere data, end de effektivt kan forstå. Moderne matematikeres reaktion på at møde de matematiske udfordringer ved big data udfolder sig stadig – og topologi, en teori, der kun er bundet af dens praktikeres fantasi, er forpligtet til at være med til at forme fremtiden.

Denne artikel er genudgivet fra The Conversation under en Creative Commons -licens. Læs den originale artikel.