Videnskab
 science >> Videnskab >  >> Elektronik

Tapis computerplatform væver videnskabelige computerværktøjer sammen

Udviklingen er startet på Tapis-softwareplatformen, som har til formål at hjælpe forskere med lettere at udnytte kraftfulde supercomputere og integrere og administrere data fra forskellige og fjerne kilder. Kredit:TACC/UH

Forskere, der ønsker at reducere deres kompleksitet til forskning og tilføje et nyt beregningsværktøj til deres værktøjsbælte, kan udforske Tapis-projektet. Tapis-softwareplatformen har til formål at hjælpe forskere med lettere at udnytte kraftfulde supercomputere og integrere og administrere data fra forskellige og fjerne kilder.

National Science Foundation (NSF) tildelte et tilskud på $2,9 millioner til Texas Advanced Computing Center (TACC) og University of Texas i Austin (UT Austin), ud over en pris på 1 million dollar til University of Hawaii (UH). NSF-priserne startede i september 2019 og understøtter fortsat udvikling af Tapis, en forkortelse for TACC-API'er og spiller ud af ordet gobelin - væver tjenester og muligheder sammen. En applikationsprogrammeringsgrænseflade (API) er en grænseflade til et softwaresystem, der er bygget eller konstrueret til brug af et andet program.

"Tapis er en forskningscomputerplatform for beregningsvidenskab og beregningsforskning, " sagde hovedefterforsker (PI) Joe Stubbs, der leder Cloud and Interactive Computing Group hos TACC. "Tapis er et softwaresystem, der hjælper forskere med at bruge de supercomputere og andre former for computerressourcer, som vi har her hos TACC og andre steder."

"Den nemmeste måde at beskrive Tapis på er, at det er en webbaseret applikation, der giver alle de værktøjer, en moderne videnskabsmand har brug for til at gøre dataintensive, beregningsintensiv forskning, " sagde Co-PI Gwen A. Jacobs, direktør for cyberinfrastruktur, University of Hawaii System. "En af de ting, der er anderledes ved Tapis er, at den væver alle de vigtige værktøjer sammen, som forskeren har brug for. Det er Tapis' virkelige kraft."

Tapis vil betjene en forskelligartet gruppe af brugere med varierende ekspertise i at bruge beregningsværktøjer til deres forskning. I den ene ende af spektret vil være 'power users' med stor erfaring med avancerede computerressourcer og programmering. Tapis vil hjælpe dem med at automatisere og strømline deres store arbejdsgange eller pipelines af softwareapplikationer.

I den modsatte ende af spektret er videnskabsmænd lige begyndt at udnytte mulighederne for at anvende avanceret databehandling til deres forskning. "Hvad vi prøver at gøre for dem med Tapis, " sagde Stubbs, "det har den nemmeste vej til adgang til at køre computerprogrammer på supercomputere."

Og så er der gruppen i midten, typisk store softwareudviklingsprojekter med fokus på specifikke forskningsdomæner, såsom immunologi, astronomi, eller bioinformatik.

"Målet med Tapis er at gøre det muligt for forskere at få adgang til disse beregningsressourcer på en mere brugervenlig måde, " sagde Stubbs.

De NSF-finansierede beregningsressourcer beskrives bredt som cyberinfrastruktur, online-økosystemet deles af forskere, bakket op af avancerede computerressourcer, hostet i datacentre, og støttet af eksperter. "Webudviklerteams og andre udviklere på disse cyberinfrastrukturprojekter kan udnytte Tapis til at bygge deres cyberinfrastrukturprojekt hurtigere."

Til disse formål, et eksempel er TAPIS API-rammeunderstøttelse til streaming af sensordata, hvor i en kompleks arbejdsgang, en begivenhed, såsom en detektion på et sensorarray, kan udløse en anden hændelse, og så videre, eller endda flere analyserutiner.

"Hændelsesdrevet computing, " forklarede Jacobs, "betyder, at arbejdsgangen ikke kører hele tiden. Det er en fantastisk funktion for forskere, der sporadisk skal erhverve deres data, hvor de henter data fra kilder såsom sensorer og datauploads. Det betyder, at de ikke behøver at køre al koden manuelt. Når arbejdsgangen er sat op, det kan være håndfri computer, på en måde, håndfri analyse."

Tapis vil integrere Cloud-Hosted Real-time Data Services for Geosciences (CHORDS) projektet, del af den NSF-finansierede EarthCube, at opnå hændelsesdrevet databehandling.

API'erne anvendt til videnskaben tillader forskellige systemer at tale med hinanden, i en vis forstand. "Ideen med Tapis, " sagde Stubbs, "er at have en maskinlæsbar og forbrugsbar grænseflade til beregningsressourcer, som supercomputere, men også højtydende lagringssystemer, ligesom vores Corral-lagringssystem, eller vores globale filsystem, Stockyard, og andre filsystemer over hele landet. Vi ønsker at have en grænseflade, der er let tilgængelig og manipuleret i andre programmer."

En anden funktion Tapis vil tilbyde er en ny sikkerhedskerne, som fungerer som en port, der styrer adgangen til systemressourcer. Tapis sikkerhedskernen vil blive decentraliseret, giver videnskabsfolk mulighed for nemmere at opstille deres egne applikationer og bevare lokal kontrol over fortrolige data.

"Den nye sikkerhedskerne giver os mulighed for at tilbyde al den administrerede sikkerhed, Godkendelse, og tilladelser, der er blevet foretaget i fortiden, " sagde Co-PI Sean Cleveland, en cyberinfrastrukturforsker ved University of Hawaii. "Men det vil også give datacentre og institutioner mulighed for at implementere deres egen sikkerhedskerne, så de kan bruge deres egne brugeroplysninger og administrere deres egen sikkerhed på deres egen måde, samt implementere individuelle komponenter af rammeværket på deres institution, og kunne udnytte noget af det centraliserede arbejde. Det er en ny, hybrid system til at bruge science-as-a-service, platform-som-en-tjeneste, men hvis du ønsker mere kontrol og tilpasning, du kan installere mindre stykker på stedet og stadig være i stand til at udnytte nogle af de større, styrede komponenter til forskellige behov."

Tapis vil give brugerne mulighed for at forenkle processen med at oprette applikationer, et stærkt værktøj for videnskabsmænd. "Hvis du kan programmere en arbejdsgang og få den til at køre på en platform som Tapis, det gør processen nemmere, fordi alle komponenterne lettere kan tale sammen, " sagde Jacobs. "Det betyder, at efterforskeren skal konstruere den arbejdsgang én gang. Så gemmer de den arbejdsgang som en applikation i Tapis-infrastrukturen og genbruger den."

At gemme alle parametrene i softwaremiljøet vil også gøre det muligt for forskere at gå tilbage og køre dataanalysen igen på et senere tidspunkt, som fremmer videnskabelig reproducerbarhed.

"Dette er virkelig et komplet samarbejde mellem TACC og University of Hawaii, " forklarede Stubbs.

TACC bringer omfattende ekspertise inden for højtydende databehandling og i at bygge distribuerede softwaresystemer. Komponenterne i Tapis selv kan køre på råvarer, eller hyldeservere, selvom nogle komponenter hos TACC vil køre på den NSF-finansierede Jetstream-sky.

Teammedlemmer på UH bidrager til udviklingen, design, og Tapis-systemets arkitektur. Hvad mere er, de giver adgang til en overflod af vigtig domæneforskning, der er unik for Hawaii inden for områder som klima, ocean, koralrev, menneskelig mikrobiom, og befolkningsundersøgelser omkring sundhedsforskelle.

"At have Tapis-projektet for os her på Hawaii er et enormt bevidsthedsløft for at anvende avanceret cyberinfrastruktur til dataintensiv videnskab, " sagde Jacobs. "Uden et projekt som dette, mange af vores efterforskere er måske ikke klar over disse ressourcer."

En af de store milepæle, efterforskerne arbejder hen imod, er en afslutningsworkshop for early adopters i sommeren 2020. "Idéen er at have workshoppen, hvor vi inviterer forskerne til at komme, bringe deres datasæt, at holde præsentationer om deres videnskab og use case, men også for Tapis-teamet til at præsentere systemets muligheder inden udgangen af ​​år et, " sagde Stubbs.

"Vi er virkelig glade for at lancere det nye NSF-finansierede Tapis-projekt, " sagde Co-PI Maytal Dahan, Direktør for Advanced Computing Interfaces hos TACC. "Tapis vil transformere videnskabsmænds produktivitet ved at lette opdagelsen, adgang til og brug af kraftfulde cyberinfrastrukturkapaciteter og -tjenester. Vi ønsker at reducere kompleksiteten for at opnå videnskab og forbedre tiden til videnskab ved at tilbyde en række sikre og robuste API-tjenester, der kan understøtte vores brugere i et miljø af produktionskvalitet.

TACC-teamet vil arbejde med forskellige aspekter af projektet – udvikling af en sikkerhedskerne, streaming data API'er og integration, kvalitetssikring og løbende integrationstest, opsøgende, uddannelse og udvikling af arbejdsstyrken. Jeg er virkelig stolt af holdet, både hos TACC og UH, og vi er alle begejstrede for at arbejde sammen med det videnskabelige samfund fra starten via vores early adopters-program for at skabe tjenester, der har en positiv indvirkning på det videnskabelige samfund."

Tapis-projektet er finansieret som en del af Cyberinfrastructure for Sustained Innovation (CSSI), et tværgående NSF-program ledet af Office of Advanced Cyberinfrastructure (OAC). "CSSI understøtter udviklingen af ​​innovativ cyberinfrastruktur, der gør det muligt for forskerfællesskaber at fortsætte og accelerere fremskridt inden for alle grundlæggende videnskabs- og ingeniørdomæner støttet af NSF, " sagde Dr. Stefan Robila, programdirektøren i OAC, der administrerer prisen. "Ved at bygge på tidligere arbejde og udnytte eksisterende ledelsesberegningsressourcer som dem, der er tilgængelige hos TACC, Tapis bidrager til løbende styrkelse af den nationale cyberinfrastruktur, og samtidig sænke barriererne for at få adgang til den."


Varme artikler