Videnskab
 science >> Videnskab >  >> Elektronik

Analyse af talesprog og 3-D ansigtsudtryk for at måle sværhedsgraden af ​​depression

Multimodale data. For hver klinisk samtale, forskerne bruger:(a) video af 3D-ansigtsscanninger, (b) lydoptagelse, visualiseret som et log-mel spektrogram, og (c) teksttransskription af patientens tale. Modellen forudsiger sværhedsgraden af ​​depressive symptomer ved hjælp af alle tre modaliteter. Kredit:Haque et al.

Forskere ved Stanford har for nylig udforsket brugen af ​​maskinlæring til at måle sværhedsgraden af ​​depressive symptomer ved at analysere folks talesprog og 3-D ansigtsudtryk. Deres multi-model metode, skitseret i et papir, der er forududgivet på arXiv, opnået meget lovende resultater, med en 83,3 procent sensitivitet og 82,6 procent specificitet.

I øjeblikket, over 300 millioner mennesker verden over lider af depressionslidelser i varierende grad. I ekstreme tilfælde, depression kan føre til selvmord, med et gennemsnit på cirka 800, 000 mennesker begår selvmord hvert år.

Psykiske lidelser diagnosticeres i øjeblikket efter omhyggelig undersøgelse af en bred vifte af sundhedsudbydere, herunder primære læger, kliniske psykologer og psykiatere. Ikke desto mindre, at opdage psykiske sygdomme er ofte langt mere udfordrende end at diagnosticere fysiske sygdomme.

Flere faktorer, herunder social stigma, behandlingsomkostninger og tilgængelighed, kan forhindre berørte personer i at søge hjælp. I øjeblikket, forskere vurderer, at 60 procent af dem, der er ramt af psykiske sygdomme, ikke får behandling.

Udvikling af metoder, der automatisk kan opdage depressive symptomer, kunne forbedre nøjagtigheden og tilgængeligheden af ​​diagnostiske værktøjer, fører til hurtigere og mere effektive indgreb. Et team af forskere ved Stanford har for nylig undersøgt brugen af ​​maskinlæring til at måle sværhedsgraden af ​​depressive symptomer.

"I dette arbejde, vi præsenterer en maskinlæringsmetode til måling af sværhedsgraden af ​​depressive symptomer, " skrev forskerne i deres papir. "Vores multimodale metode bruger 3-D ansigtsudtryk og talesprog, almindeligvis tilgængelig fra moderne mobiltelefoner."

At lære en multimodal sætningsindlejring. Samlet set, modellen er en kausal CNN. Indgangen til modellen er:lyd, 3D ansigtsscanninger, og tekst. Den multimodale sætningsindlejring føres til en depressionsklassifikator og PHQ-regressionsmodel (ikke vist ovenfor). Kredit:Haque et al.

Deprimerede individer viser ofte en række verbale og ikke-verbale symptomer, inklusive monoton tonehøjde, nedsat artikulationshastighed, lavere talevolumen, færre fagter, og flere nedadgående blikke. En af de mest almindelige tests til at vurdere sværhedsgraden af ​​depressionssymptomer er patientsundhedsspørgeskemaet (PHQ).

Metoden udviklet af forskerne analyserer lydspor af patienters stemme, 3-D video af deres ansigtsudtryk, og teksttransskriptioner af deres kliniske interviews. Baseret på disse data, modellen producerer enten en PHQ-score eller klassifikationsmærke, der indikerer svær depressiv lidelse.

I en indledende evaluering, modellen opnåede en gennemsnitlig fejl på 3,67 point (15,3 procent relativ), på PHQ-skalaen, påvisning af svær depressiv lidelse med 83,3 procent sensitivitet og 82,6 procent specificitet. Forskerne valgte at indsamle de data, der blev brugt i deres undersøgelse via menneske-til-computer-interviews, snarere end menneske-til-menneske.

"Sammenlignet med en menneskelig interviewer, forskning har vist, at patienter rapporterer mindre frygt for afsløring og viser mere følelsesmæssig intensitet, når de taler med en avatar, " skrev forskerne. "Derudover, folk oplever psykologiske fordele ved at afsløre følelsesmæssige oplevelser til chatbots."

I fremtiden, denne nye maskinlæringsmetode kunne implementeres i smartphones over hele verden, støtte missionen om at gøre mental sundhedspleje billigere og mere tilgængelig. Ifølge forskerne, deres model er designet til at supplere og supplere eksisterende kliniske metoder, frem for at stille formelle diagnoser.

"Vi præsenterede en multimodal maskinlæringsmetode, som kombinerer teknikker fra talegenkendelse, computersyn, og naturlig sprogbehandling, " skrev forskerne. "Vi håber, at dette arbejde vil inspirere andre til at bygge AI-baserede værktøjer til at forstå psykiske lidelser ud over depression."

© 2018 Science X Network




Varme artikler