
В Новосибирском государственном университете (НГУ) впервые в России разработан цифровой метод оценки депрессивных состояний на основе анализа голоса. Прототип приложения NeuroVoice обеспечивает полный цикл работы с данными — в дальнейшем этот подход можно будет использовать для диагностики других психических расстройств.
В исследовательскую группу НГУ входят ученые и студенты направления «Психология» Института медицины и медицинских технологий (ИММТ): заведующий кафедрой клинической психологии ИММТ, кандидат психологических наук, доцент Александр Федоров; руководитель проекта, старший преподаватель кафедры психологии личности ИММТ, кандидат психологических наук Марина Злобина; выпускник направления «Психология» ИММТ Кирилл Кириленков; студенты направления «Психология» Дарья Фаркова (4-й курс) и Анастасия Глазунова (3-й курс).
Команда работала с сентября по декабрь 2025 года и создала автоматизированный подход к оценке депрессии, основываясь на акустических характеристиках человеческой речи.
На сегодняшний день депрессия является одним из наиболее распространенных психических расстройств. По оценкам ВОЗ, на 2025 год во всем мире от депрессии страдало примерно 332 млн человек. При этом депрессия может выступать как самостоятельное расстройство или сопутствовать другим заболеваниям.
Ситуация осложняется тем, что иногда депрессию маскируют соматические жалобы: пациенты испытывают неопределенные боли (например, частую головную боль), проблемы с сердцем, пищеварением, общее ухудшение самочувствия. При этом симптомы бывают неоднозначными и определить «телесную» причину оказывается невозможно. Зачастую врачи общей практики в этой ситуации не обладают необходимым временем и квалификацией, чтобы провести углубленную диагностику и поставить точный диагноз.
Как рассказала Марина Злобина, помочь снизить нагрузку на врачей и обеспечить точную, качественную и своевременную диагностику способен анализ объективных показателей депрессии.
«В качестве одного из таких показателей может служить анализ голоса, — отметила она. — Диагностика депрессии по акустическим характеристикам голоса обладает рядом преимуществ по сравнению с традиционными методами, основанными на методах самоотчета и интервью, в первую очередь потому, что полностью исключает фактор социальной желательности: это объективный показатель, который отражает состояние человека, при этом произвольно контролировать голос с целью сокрытия симптомов депрессии (или наоборот, аггравации симптомов) человек не может».
По словам ученых, на сегодня за рубежом вышло достаточно много работ, посвященных диагностике депрессии на основании акустических характеристик голоса, в том числе с применением нейросетей, однако данных о применении подобной технологии на практике пока нет. В России же такие решения только начинают появляться. Например, существуют технологии оценки состояния человека по параметрам голоса в условиях космических полетов, однако они не включают диагностику тревожно-депрессивных состояний.
Авторы проекта отмечают, что речь — это естественный биомаркер психического состояния. Даже короткий ее отрывок содержит ценную информацию об энергетике голоса, которая подвержена изменениям при депрессивных и тревожных состояниях. На основе более 90 интервью исследователи обучили нейросетевую модель, которая классифицирует речь по четырем уровням выраженности депрессии — от отсутствия симптомов до тяжелой формы. Для оценки степени выраженности симптомов использовали опросник PHQ-9.
«В основу разработки легла современная архитектура wav2veс, которая позволяет извлекать векторные акустические характеристики голоса. Обученная модель демонстрирует высокую точность, сопоставимую с результатами ведущих зарубежных исследований: показатель F1 — гармоническое среднее между точностью (precision) и полнотой (recall) — достиг значения >0,94. Для практического использования технологии создан прототип GUI-приложения NeuroVoiсe, который реализован на базе фреймворка PyQt5», — пояснил Александр Федоров.
Ученый подчеркнул, что интерфейс обеспечивает полный цикл работы с данными — от загрузки аудио до визуализации результатов и экспорта записей. Прототип позволяет как загружать уже сделанные записи, так и проводить оценку на лету.
«Важно отметить, что эта технология не является заменой специалиста — психолога или психиатра, но может быть эффективно использована врачами общего профиля для выявления коморбидной депрессии при соматических заболеваниях, а также маскированной депрессии, часто проявляющейся в форме физических жалоб, болей и недомогания, которые невозможно объяснить соматическим заболеванием», — добавила Марина Злобина.
В перспективе авторы проекта планируют расширить датасет и сформировать на его основе базу данных из интервью русскоязычных испытуемых, аналогичную англоязычной DAIC-WOZ (мультимодальный корпус, состоящий из аудио-, видеозаписей и расшифрованного текста интервью). Далее в планах — обучение моделей уже на расширенном датасете, интеграция в итоговое приложение и дальнейшее тестирование.
«В будущем разработанная технология может также использоваться для диагностики других психических расстройств — при наличии дополнительных данных, на основе которых можно будет дообучить модель. Кроме того, возможно подключение дополнительных модальностей (например, анализ мимики по видеозаписи)», — подытожила Марина Злобина.
Проект реализуется в рамках программы Минобрнауки России «Приоритет-2030» (национальный проект «Молодежь и дети»).