Kredit:CC0 Public Domain
En maskinlæringsmetode opdagede et skjult spor i folks sprog, der forudsagde den senere fremkomst af psykose - den hyppige brug af ord forbundet med lyd. Et papir udgivet af tidsskriftet npj Skizofreni offentliggjort resultaterne af forskere ved Emory University og Harvard University.
Forskerne udviklede også en ny maskinlæringsmetode til mere præcist at kvantificere den semantiske rigdom af folks samtalesprog, en kendt indikator for psykose.
Deres resultater viser, at automatiseret analyse af de to sprogvariable - hyppigere brug af ord forbundet med lyd og tale med lav semantisk tæthed, eller vaghed – kan forudsige, om en risikoperson senere vil udvikle psykose med 93 procents nøjagtighed.
Selv uddannede klinikere havde ikke bemærket, hvordan mennesker med risiko for psykose bruger flere ord forbundet med lyd end gennemsnittet, selvom unormal auditiv perception er et præklinisk symptom.
"At prøve at høre disse finesser i samtaler med mennesker er som at prøve at se mikroskopiske bakterier med dine øjne, " siger Neguine Rezaii, avisens første forfatter. "Den automatiserede teknik, vi har udviklet, er et virkelig følsomt værktøj til at opdage disse skjulte mønstre. Det er som et mikroskop til advarselstegn på psykose."
Rezaii begyndte at arbejde på papiret, mens hun var bosiddende på Emory School of Medicines afdeling for psykiatri og adfærdsvidenskab. Hun er nu på fellow i Harvard Medical Schools afdeling for neurologi.
"Det var tidligere kendt, at subtile træk ved fremtidig psykose er til stede i folks sprog, men vi har brugt maskinlæring til faktisk at afdække skjulte detaljer om disse funktioner, " siger seniorforfatter Phillip Wolff, professor i psykologi ved Emory. Wolffs laboratorium fokuserer på sprogsemantik og maskinlæring for at forudsige beslutningstagning og mental sundhed.
"Vores fund er nyt og tilføjer til beviserne, der viser potentialet for at bruge maskinlæring til at identificere sproglige abnormiteter forbundet med psykisk sygdom, " siger medforfatter Elaine Walker, en Emory-professor i psykologi og neurovidenskab, der forsker i, hvordan skizofreni og andre psykotiske lidelser udvikler sig.
Begyndelsen af skizofreni og andre psykotiske lidelser opstår typisk i begyndelsen af 20'erne, med advarselstegn - kendt som prodromalt syndrom - der begynder omkring 17-årsalderen. Omkring 25 til 30 procent af de unge, der opfylder kriterierne for et prodromalt syndrom, vil udvikle skizofreni eller en anden psykotisk lidelse.
Ved hjælp af strukturerede interviews og kognitive tests, uddannede klinikere kan forudsige psykose med omkring 80 procent nøjagtighed hos dem med et prodromalt syndrom. Maskinlæringsforskning er blandt de mange igangværende bestræbelser på at strømline diagnostiske metoder, identificere nye variabler, og forbedre nøjagtigheden af forudsigelser.
I øjeblikket, der er ingen kur mod psykose.
"Hvis vi kan identificere personer, der er i fare tidligere, og bruge forebyggende indgreb, vi kan måske vende underskuddene, " siger Walker. "Der er gode data, der viser, at behandlinger som kognitiv adfærdsterapi kan forsinke starten, og måske endda reducere forekomsten af psykose."
For det aktuelle papir, forskerne brugte først maskinlæring til at etablere "normer" for samtalesprog. De fodrede et computersoftwareprogram med online-samtaler af 30, 000 brugere af Reddit, en social medieplatform, hvor folk har uformelle diskussioner om en række emner. Softwareprogrammet, kendt som Word2Vec, bruger en algoritme til at ændre individuelle ord til vektorer, at tildele hver enkelt en placering i et semantisk rum baseret på dets betydning. Dem med lignende betydninger er placeret tættere sammen end dem med meget forskellige betydninger.
Wolff-laboratoriet udviklede også et computerprogram til at udføre det, forskerne kaldte "vektorudpakning, " eller analyse af den semantiske tæthed af ordbrug. Tidligere arbejde har målt semantisk sammenhæng mellem sætninger. Vektorudpakning gjorde det muligt for forskerne at kvantificere, hvor meget information der var pakket ind i hver sætning.
Efter at have genereret en baseline af "normale" data, forskerne anvendte de samme teknikker til diagnostiske interviews af 40 deltagere, som var blevet udført af uddannede klinikere, som en del af multi-site North American Prodrome Longitudinal Study (NAPLS), finansieret af National Institutes of Health. NAPLS er fokuseret på unge mennesker med klinisk høj risiko for psykose. Walker er hovedefterforsker for NAPLS hos Emory, et af ni universiteter, der er involveret i det 14-årige projekt.
De automatiserede analyser af deltagerprøverne blev derefter sammenlignet med den normale baselineprøve og de longitudinelle data om, hvorvidt deltagerne konverterede til psykose.
Resultaterne viste, at højere end normalt brug af ord relateret til lyd, kombineret med en højere frekvens af brug af ord med lignende betydning, betød, at psykose sandsynligvis var i horisonten.
Undersøgelsens styrker inkluderer enkelheden ved at bruge kun to variable - som begge har et stærkt teoretisk fundament - replikeringen af resultaterne i et holdout-datasæt, og den høje nøjagtighed af dens forudsigelser, på over 90 pct.
"På det kliniske område, vi mangler ofte præcision, " siger Rezaii. "Vi har brug for mere kvantificeret, objektive måder at måle subtile variabler på, såsom dem, der er skjult i sprogbrug."
Rezaii og Wolff samler nu større datasæt og tester anvendelsen af deres metoder på en række neuropsykiatriske sygdomme, herunder demens.
"Denne forskning er interessant ikke kun for dens potentiale til at afsløre mere om psykisk sygdom, men for at forstå, hvordan sindet fungerer – hvordan det sætter ideer sammen, " siger Wolff. "Machine learning-teknologien udvikler sig så hurtigt, at den giver os værktøjer til at udvinde det menneskelige sind."