Videnskab
 science >> Videnskab >  >> Elektronik

Vil flytning til den kommercielle sky efterlade nogle databrugere?

Georgia Tech -assisterende professor Mariel Borowitz vises med satellitkommunikationsudstyr. Dramatisk vækst i generering og indsamling af data vil ændre den måde, føderale agenturer gør data tilgængelige på. Kredit:Allison Carter, Georgia Tech

Som en del af deres missioner, føderale agenturer genererer eller indsamler enorme mængder data fra sådanne kilder som jordobservationssatellitter, sensornetværk og genomforskning. Meget af den information er nyttig for kommercielle og akademiske institutioner, som nu normalt kan få adgang til disse offentligt genererede data fra bureauservere uden beregning.

Men som mængden af ​​data fortsætter med at udvide, mange bureauer overvejer at bruge kommercielle cloud-tjenester for at hjælpe med at opbevare og gøre det tilgængeligt for brugerne. Selvom agenturer kan have forskellige strategier, disse nye partnerskaber kan resultere i brugergebyrer på downloads og analyser udført på dataene, mens de forbliver i skyen.

Skrivning i en artikel om politikforum offentliggjort 8. februar i tidsskriftet Videnskab , en rumpolitisk forsker fra Georgia Institute of Technology, som studerer sådan databrug, opfordrer til, at man udviser forsigtighed med hensyn til designet af disse kommercielle cloud-partnerskaber og mulig pålæggelse af brugergebyrer.

"Under det nuværende system, gratis og åbne regeringsdata bruges af forskere til at udføre forskning, af iværksættere for at skabe nye virksomheder, og af borgere og andre organisationer for at fremme offentlig gennemsigtighed, " sagde Mariel Borowitz, en assisterende professor ved Georgia Techs Sam Nunn School of International Affairs. "Hvis brugere skal betale gebyrer for at downloade eller analysere dataene, dette vil mindske disse brugeres mulighed for at få adgang til og arbejde med data. Tidligere erfaringer tyder på, at virkningerne af dette fald i dataanvendelsen kan være store - både for de enkelte brugere og for samfundet som helhed. "

Flytning af data til kommercielle cloud-systemer vil sandsynligvis give bredere adgang og mere effektive analysemuligheder, men hun advarer om, at disse fordele kan opvejes af omkostningerne, især for organisationer med små budgetter.

"Agenturer risikerer at miste nogle af fordelene ved denne overgang ved ikke at budgettere med omkostninger forbundet med dataoverførsel og analyse, op til et rimeligt niveau, " sagde Borowitz. "Mange, der ville være interesseret i at bruge dataene, kan muligvis ikke betale de tilknyttede gebyrer. Forskere, nonprofitorganisationer og andre, der ikke direkte profiterer af brugen af ​​disse data, er højst sandsynligt berørt."

Borowitz tilbragte for nylig to år hos NASA og var vidne til både udviklingen af ​​systemer, der dramatisk vil øge dataindsamlingen og debatter om fremtidig datalagring. Hun har for nylig skrevet en bog, Open Space:Den globale indsats for åben adgang til miljøsatellitdata, udgivet af MIT Press.

Hun vil gerne se, at bureauerne, der leverer data, fortsat bærer omkostningerne, op til et "fornuftigt niveau, " for at sikre, at dataene fortsat er let tilgængelige for alle brugere. Som et alternativ til kommercielle tjenester, nogle bureauer overvejer at udvikle deres egen, specialbyggede cloud-løsninger, og bliver nødt til at afveje omkostningerne ved fordelene ved de forskellige muligheder. Der vil også være teknisk, organisatoriske og politiske spørgsmål at overveje.

"Agenture tager alvorligt spørgsmål om sikkerhed og langsigtet opbevaring af data, Borowitz tilføjede. "Når du arbejder med kommercielle udbydere, nogle er bekymrede over muligheden for at blive 'låst ind' til én udbyder, på grund af de store omkostninger ved at migrere data fra et system til et andet. Det er muligt, at omkostninger og muligheder kan ændre sig over tid. På den anden side, Kommercielle cloud-udbydere har stor arbejdsstyrke og omfattende infrastruktur, der giver dem mulighed for at levere tjenester og muligheder langt ud over, hvad ethvert bureau ville være i stand til at opretholde."

Borowitz bemærker, at de fleste bureauer ikke har truffet endelige beslutninger om deres cloud-baserede programmer, så der burde være tilstrækkelig tid til at arbejde igennem disse spørgsmål.

Georgia Tech assisterende professor Mariel Borowitz er vist med satellitkommunikationsudstyr. Dramatisk vækst i generering og indsamling af data vil ændre den måde, føderale agenturer gør data tilgængelige på. Kredit:Allison Carter, Georgia Tech

"De fleste bureauer, der gør data offentligt tilgængelige, især videnskabsbureauer, allerede diskuterer og/eller begynder at lave overgangen til skysystemer, sagde hun. "Men disse programmer – hos bureauer som NSF, NIH, NASA og NOAA - er stadig i deres tidlige faser, og der er stadig mulighed for feedback, og der skal foretages justeringer af programmerne. "

Eksistensen af ​​gebyrer for adgang til offentlige data er ikke uden præcedens, men Borowitz hævder, at tidligere erfaringer tyder på, at brugerbetalinger resulterer i væsentligt mindre brug. Inden Landsat -data - satellitbilleder af Jorden - blev gjort frit tilgængelige i 2008, højst 25, 000 billeder om året blev købt fra samlingen. "Inden for et par år efter implementering af frie og åbne datapolitik, regeringen uddelte 250, 000 billeder om måneden, " hun sagde.

Det tal giver et bud på, hvad de ofte kontante bureauer har med at gøre. Ifølge avisen, National Oceanic and Atmospheric Administration (NOAA) huser mere end 100 petabyte (PB) data og genererer mere end 30 PB om året fra satellitter, radarer, computermodeller og andre kilder. NASA projekterer, at dets arkiv vil vokse til 250 PB i 2025. Og mængden af ​​genomiske data på National Institutes of Health vokser eksponentielt.

En petabyte er 1, 024 terabyte, eller en million gigabyte. En gigabyte er 1, 024 megabtyes. For skala, et gennemsnitligt fotografi taget af et avanceret mobiltelefonkamera kan være i nærheden af ​​10 megabyte. Bærbare computere kan muligvis gemme så meget som et par terabyte data.

Borowitz ser overgangen til cloud computing som både en mulighed og en udfordring for den fremtidige tilgængelighed af offentlige data. "De beslutninger, der tages lige nu om strukturen af ​​disse programmer, har potentialet til at påvirke forskere og samfundet som helhed betydeligt, så det er vigtigt at øge bevidstheden og øge engagementet i disse spørgsmål."


Varme artikler