Kredit:Unsplash/CC0 Public Domain
I en verden, hvor så meget information er så let tilgængelig for studerende, må undervisere og elevbedømmere konstant kæmpe mod plagiat. Den tid og indsats, der kræves af en eksaminator, der potentielt står over for hundredvis af essays for at kontrollere for sådanne problemer, hvor små de end er, er enorm. Der findes halvautomatiske værktøjer til at identificere plagiat i en tekstprøve, men disse optager også computerressourcer og er ofte uhåndterlige og mere velegnede til enkelte dokumenter.
Skrivning i International Journal of Innovative Computing and Applications , har et hold fra Australien og Sri Lanka udviklet en ny beregningsmæssig tilgang til plagiatdetektion, der bruger vektorrum og udnytter arkitekturen af grafikbehandlingsenheder og deres compute unified device-arkitektur (CUDA) frem for en konventionel computerchip, en central behandlingsenhed, CPU.
Jiffriya Mohamed Abdul Cader fra Sri Lanka Institute of Advanced Technological Education Sammanthurai, Akmal Jahan Mohamed Abdul Cader fra South Eastern University of Sri Lanka, Hasindu Gamaarachchi fra University of New South Wales, Australien og Roshan G. Ragel Fakultet for Ingeniørvidenskab, University fra Peradeniya, Sri Lanka forklarer, at konventionel seriel test af 1.000 dokumenter kan tage en halv time.
Prototypen af deres GPU-tilgang forbedrer det væsentligt, idet det tager kun 36 sekunder at behandle det samme datasæt og markere eventuelle plagierede tekstsektioner. Forskerne optimerede dog deres prototype yderligere og var i stand til at reducere behandlingstiden til kun 4 sekunder for tusind dokumenter. Det er næsten 400 gange hurtigere end konventionelle tilgange. En sådan hastighed ville være en velsignelse for eksaminatorer, der står over for hundredvis, hvis ikke tusindvis af studerende indsendte dokumenter, for at kontrollere for plagiat.
Det næste trin vil være at teste den samme tilgang til tekst, der findes i andre typer dokumenter, snarere end blot essays med lige tekst, herunder notesbøger, opgaver, rapporter, afhandlinger og sådan. + Udforsk yderligere