25.09.2019

Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа.

«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа. В 2019 году мероприятие, посвященное вопросам компьютерной обработки речи, состоялось в Босфорском университете (Стамбул).

ТУСУР на конференции представляли доцент кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС), заместитель заведующего лабораторией медико-биологических исследований Евгений Костюченко и младший научный сотрудник этой лаборатории, преподаватель кафедры КИБЭВС Дарья Новохрестова.

Коллектив лаборатории медико-биологических исследований ТУСУРа совместно с НИИ онкологии ведет в рамках полученного гранта Российского Научного Фонда работы по восстановлению речевой функции у больных после хирургического лечения рака полости рта и ротоглотки.

– Задача, которую перед нами поставили – это создание методики оценки качества речи пациентов, – рассказывает Дарья Новохрестова. – Точнее, мы занимаемся автоматизацией этого процесса. Раньше те изменения, которые происходили в речи пациента после операции, оценивал эксперт, в нашей лаборатории мы разрабатываем программный комплекс, который позволит проводить оценку в автоматическом режиме. Изначально грант был рассчитан на три года, теперь его продлили еще на два.

Основная сложность, с которой столкнулись ученые из ТУСУРа, заключается в том, что алгоритмов такого анализа просто нет. ГОСТ по оценке разборчивости речи – еще 70-х годов прошлого века. За рубежом исследователи в этом направлении тоже делают первые шаги. Но в большинстве работ за основу берут именно экспертную оценку. Задача же наших ученых – полностью автоматизировать процесс.

– Год назад на базе НИИ онкологии заработала программа по оценке качества произношения слогов, – продолжает Дарья Новохрестова. – Пациент произносит слоги, программа их оценивает, сравнивая с эталоном – записями до операции. Дальше идут занятия с логопедом, через какое-то время мы оцениваем динамику восстановления речи. Если улучшений нет, доктора дают рекомендации и изменяют методику реабилитации.

Она добавила, что следующим шагом станет добавление в программу возможности оценки фразовой и словесной разборчивости. Для анализа экспертом эта работа гораздо сложнее, поскольку в слоге ошибку заметить легче, а фразу мозг часто достраивает автоматически.

– Мы рассмотрели три самых популярных системы распознавания речи – Google Cloud Speech-to-Text API, Яндекс SpeechKit и Voco от Центра речевых технологий (Санкт-Петербург). Google показал себя лучше остальных, но те результаты распознавания, которые системы нам предоставляют, существенно отличаются от того, что слышит эксперт, – отметила сотрудник лаборатории ТУСУРа.

На конференции в Стамбуле ученые представили свои доклады в формате постер-сессии, когда после краткого рассказа об исследовании, идет обсуждение данных, графиков и таблиц, размещенных на специальном постере. Для Дарьи Новохрестовой это был первый опыт участия в международной конференции.

– Мы вместе с коллегами выясняли, что может влиять на такой большой разброс оценок экспертов и систем распознавания. Подходили люди и подавали очень интересные идеи, какие параметры нужно отсмотреть, на что обратить внимание, как можно иначе интерпретировать оценки по распознаванию, – поделилась Дарья Новохрестова.  

Она также подчеркнула, что в настоящее время перед учеными ТУСУРа стоит задача внедрения версии программного обеспечения, где будет добавлена возможность оценки фразовой разборчивости. В НИИ онкологии, по ее словам, система заработает уже в сентябре-октябре. По результатам внедрения будет принято решение, оставлять в основе модуля оценки систему от Google или разрабатывать собственную.

Источник: пресс-служба ТУСУРа

Последние новости

Школы и детсад в Шегарском районе вернулись к работе после вспышки кишечной инфекции

Дмитрий Кандинский / vtomske.ru Три школы и детсад со 2 мая вновь стали принимать воспитанников, ранее учреждения временно приостановили работу из-за вспышки кишечной инфекции.

Потепление до плюс 20 градусов ожидается в Томске к 10 мая

Мазуров Александр © РИА Томск. Элеонора Черная Кратковременные дожди ожидают томичей в большинство дней первой декады мая; во второй половины декады температура воздуха в регионе поднимется до 23 градусов тепла,

30 лет: хроники томского парламента. Шестой созыв (2016—2021)

Главное в повестке Думы шестого созыва — реализация крупномасштабных национальных проектов для людей и во имя людей.

Card image

Как они помогают управлять бюджетом и сэкономить

Комментарии (0)

Добавить комментарий

Ваш email не публикуется. Обязательные поля отмечены *