Videnskab
 science >> Videnskab >  >> Elektronik

Google AI -forsker annoncerer Dataset Search

Kredit:CC0 Public Domain

Google, fra dag ét, blev stor ved at komme i gang med at finde information. År senere, Google taler seriøs forretning om datasæt. Google lancerer en ny søgemaskine til at hjælpe forskere med at finde de datasæt, de har brug for.

På onsdag, Google AI -forsker Natasha Noy annoncerede Googles lancering af Dataset Search. Du får nu let adgang til datasæt, hvis du er videnskabsmand, eller bare data "nørd" i en anden form for forfølgelse, leder efter data til dit arbejde og til dine historier og efter din intellektuelle nysgerrighed.

Målet er at give dig mere af en enkelt grænseflade. Jon Fingas i Engadget kigget på, hvordan det kan gavne datasøgning.

"Værktøjet giver mere direkte adgang til data, der præsenteres i en åben standard, der gør det klart, hvem der har oprettet oplysningerne, hvordan den blev indsamlet, og hvordan du har lov til at bruge den. Du kunne ikke kun spore klimadata til en rapport, men sørg for, at det er relevant og lovligt at bruge. "

Dette er et globalt (som i internationalt) skub, der fungerer på flere sprog med understøttelse af yderligere sprog snart. James Vincent i Randen citerede Noy:"Jeg tror i løbet af de sidste flere år, at antallet af depoter er eksploderet."

"Indtast blot det, du leder efter, og vi hjælper dig med at guide dig til det offentliggjorte datasæt på depotudbyderens websted, sagde hun. I øjeblikket datasæt og relaterede data har en tendens til at være spredt over flere datalager, og man kan finde ud af, at oplysninger om disse datasæt hverken er knyttet eller indekseret af søgemaskiner. For den person, der foretager en søgning, dataopdagelse bliver i bedste fald kedeligt.

De er seriøst til støtte for et økosystem, hvor udbydere af datasæt selv opmuntres, via retningslinjer, som Google udviklede, at beskrive deres data "på en måde, så Google (og andre søgemaskiner) bedre kan forstå indholdet på deres sider, " hun sagde.

De brugte den åbne standard schema.org til deres tilgang til dette. På Noy's ønskeliste:at alle udbydere af datasæt står bag denne fælles standard. Det håbes, at flere datalagre vil bruge schema.org -standarden til at beskrive deres datasæt. Den vej, sagde Noyes, datasæt er en del af et "robust økosystem".

"Et søgeværktøj som dette er kun lige så godt som de metadata, som dataudgivere er villige til at levere. Vi håber at se mange af jer bruge de åbne standarder til at beskrive jeres data, gør det muligt for vores brugere at finde de data, de leder efter. "

Jon Fingas i Engadget :"Det er langt fra en endelig ressource i øjeblikket. Det er en start, imidlertid, og Google håber uden tvivl, at dette vil tilskynde andre til at gøre deres offentlige data mere søgbare. "

Og hvis alt dette ikke var nok, Google skærer nogle veje for at få mest muligt ud af data om data om data.

Ifølge Randen , Jeni Tennison, chef for Open Data Institute, sagde ideelt set, at Google vil offentliggøre sit eget datasæt, hvordan Dataset Search bliver brugt. Hun sagde, at Google skulle offentliggøre et datasæt om datasetssøgning, der ville blive indekseret af Dataset Search, tilføjede Vincent. Han citerede hende:

"Bare at forstå, hvordan folk søger, er vigtigt ... hvilken slags udtryk de bruger, hvordan de udtrykker dem, "siger Tennison." Hvis vi vil have styr på, hvordan folk søger efter data og gør det mere tilgængeligt, det ville være fantastisk, hvis Google åbnede sine egne data om dette. "Med andre ord, han tilføjede, Google bør offentliggøre et datasæt om datasetssøgning, der ville blive indekseret af Dataset Search.

© 2018 Tech Xplore




Varme artikler