Videnskab
 Science >> Videnskab >  >> Andet

Forsker bruger maskinlæring til at hjælpe med at digitalisere ældgamle tekster fra Indus-civilisationen

En række Indus-sæler fra Iravatham Mahadevan, en lærd og forfatter, der har studeret Indus-skrift i årtier. Kredit:Florida Institute of Technology

Civilisationen i Indus River Valley betragtes som en af ​​de tre tidligste civilisationer i verdenshistorien sammen med Mesopotamien og Egypten. Indus-civilisationen var større geografisk end de to, da den udfoldede sig i 3300 f.v.t. i det nuværende Pakistan og Indien. Indus-civilisationen pralede af ensartede vægte og mål, dygtige håndværkere, et mangefacetteret system af handel og handel og op mod 500 symboler og tegn til kommunikation.



Men ét spørgsmål har irriteret forskere i årtier og hindret forsøg på at lære mere om denne civilisation:Var disse tegn et sprog eller mere beslægtet med piktogrammer? Selvom nogle eksperter begynder at oversætte højre-til-venstre-skriftet, der findes i Indus-inskriptioner, er der ringe enighed.

"Det er en kontrovers, som endnu ikke er afgjort," sagde Debasis Mitra, en professor i datalogi, som nu er forbundet med denne søgen takket være en ny bevilling, han blev tildelt fra National Endowment for Humanities:"Ancient Script Digitalization and Archival (Ancient Script Digitalization and Archival) ASDA) af Indus Valley Artifacts ved hjælp af Deep Learning."

Kandidatstuderende Deva Atturu, som skal forsvare sin kandidatafhandling i april, hjælper Mitra med at udføre den tilskudsfinansierede forskning. I denne måned deltog han og Mitra praktisk talt i South Asian Archaeology Conference 2024 fra University of Chicago, hvor Atturu præsenterede deres arbejde.

De skrifter, de studerer, kan være en række symboler som svarende til dollartegn og forretningstransaktionsbilleder, eller disse symboler kan være grafemer, de individuelle bogstaver eller grupper af bogstaver, der repræsenterer talelyde.

"Begge sider har meget stærke argumenter," sagde Mitra.

Han søger ikke at løse argumentet, men at styrke dem, der vil, ved at udvikle en maskinlæringsalgoritme til at identificere og digitalisere Indus-civilisationens gamle skrift. Der er en mangel på digitaliserede data, som Mitra håber at kunne løse.

Processen bruger et automatiseret scriptgenkendelsessystem (ASR) til at udtrække kodede sekvenser af grafemer fra et datasæt med mere end 1.000 fotografier af Indus sæler. Ved at bruge to-trins kunstige neurale netværk har ASR opnået 88 % succes med at opdage grafemer.

Alligevel har processen været udfordrende. Ofte styrkes maskinlæring ved at indtaste enorme mængder data for grundlæggende at træne systemet. I dette tilfælde er der dog ikke meget data at indtaste. Og hvilke data der er, kan nogle gange være "støjende" eller forvrænget.

"Jeg arbejder med medicinsk billeddannelse, og nogle af udfordringerne ligner hinanden," sagde Mitra.

Mitra anvender forskellige maskinlæringselementer til projektet for at forsøge at generere nye data eller se, om en anden tilgang kan fungere bedre. Og han befinder sig også på konferencer, der normalt ikke er på tidsplanen for dataloger, som sidste års årlige konference i Sydasien, som var vært for University of Wisconsin i Milwaukee, hvor han præsenterede dette maskinlæringsprojekt.

At deltage i disse holder ham i kontakt med arkæologer, som kan give ham flere data. "Jeg går til disse konferencer og prøver at tale med dem," sagde han.

Han får også hjælp fra studerende på Indian Statistical Institute i sit hjemland Indien. Sammen gør de fremskridt. De kan digitalisere nogle motiver og grafemer og, afhængigt af mængden af ​​data, endda lave et script. At gøre det og få det ind i en database er målet for den indledende bevilling.

Næste fase? Opret et system, der gør det muligt for arkæologer i marken at tage et smartphonebillede af en tekst eller symboler og få det dirigeret ind i databasen til digitalisering.

At disse bestræbelser er designet til at hjælpe med at belyse og bedre forstå en af ​​de store civilisationer i hans lands historie er en ekstra motivation for Mitra.

"Det er en del af min historie, så der er ekstra motivation for det. Og selvfølgelig ser jeg, at indiske studerende er meget interesserede af samme grund," sagde han. "Men et af de første gennembrud var af et par amerikanske studerende, som havde stor interesse for Indien, og nogle af dem sagde, at de besøgte Indien bagefter."

Leveret af Florida Institute of Technology




Varme artikler