• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

Технодень МИЭМ на Покровке: совместно исследуем инженерный код Вышки

26 мая в центральном атриуме корпуса на Покровском бульваре, 11, пройдет традиционный масштабный фестиваль инженерных разработок проектных команд Московского института электроники и математики (МИЭМ) ВШЭ. В программе — презентации лучших студенческих технологических проектов, стенды дружественных компаний и совместных мастерских, лекторий с участием практикующих инженеров, круглый стол о развитии инженерного образования и представление магистерских программ МИЭМ.

ФКН ВШЭ расширяет линейку образовательных программ по ИИ для руководителей

Центр непрерывного образования факультета компьютерных наук НИУ ВШЭ (ЦНО ФКН ВШЭ) развивает уникальную линейку образовательных продуктов для топ-менеджмента, где передовая компьютерная наука соединяется с реальными задачами бизнеса. Цель этого направления — помогать развивать бизнес в России через внедрение технологий искусственного интеллекта.

В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского

Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.

Студенты Вышки — среди победителей акселератора высокотехнологичных стартапов от «Яндекса»

«Яндекс» подвел итоги акселератора Yandex AI Startup Lab, в финальный раунд которого вышли 12 ИТ-проектов. Их создатели, студенты и молодые предприниматели, вместе с экспертами компании три месяца работали над развитием своих продуктов. Четыре стартапа в сферах цифрового маркетинга, медицины и робототехники признаны лучшими: их команды получили денежные призы и гранты на облачные ресурсы. В их числе и стартап Gradius от студентов НИУ ВШЭ .

AI AWARDS 2026: аналитическую основу премии формирует iFORA НИУ ВШЭ

Высшая школа экономики вошла в число партнеров премии AI AWARDS 2026, которая пройдет 29 апреля в Москве. Проект, реализуемый командой «Билайн Big Data & AI», посвящен практическому применению искусственного интеллекта и объединяет компании, технологии и команды, которые уже сегодня влияют на развитие новой цифровой экономики. Вклад номинантов AI AWARDS в развитие ИИ анализируется на основе данных, поэтому качество аналитической базы и прозрачность методологии становятся для рынка принципиально важными.

НИУ ВШЭ и Альфа-Банк запускают исследовательские проекты в сфере искусственного интеллекта

НИУ ВШЭ и Альфа-Банк объявили о старте трех совместных проектов в области искусственного интеллекта. Они направлены на развитие аналитических инструментов для банковских сервисов — от более точных прогнозов до новых подходов к управлению рисками и персонализации клиентского опыта.

Участники «Я — профессионал» разработают ИИ-агентов для бизнеса на Весенней экономической школе Вышки и Сбера

На площадке СберУниверситета стартовала Весенняя экономическая школа, организованная Высшей школой экономики и Сбером для участников Всероссийской олимпиады студентов «Я — профессионал» Президентской платформы «Россия — страна возможностей». С 22 по 24 апреля студенты будут работать над созданием ИИ-агента для бизнеса — от идеи и научной гипотезы до прототипа, готового к защите перед экспертами.

Уже не выбор, а реальность: трансформация мира под влиянием ИИ

Искусственный интеллект уже не воспринимается как технология будущего: он стремительно меняет процессы принятия решений, рынок труда и социальные практики. Вместе с тем он несет с собой не только новые грандиозные возможности, но и системные риски, связанные с ростом зависимости от данных, трансформацией профессий и изменением человеческого поведения. В НИУ ВШЭ создали семантическую карту разломов, которая показала ключевые тренды в развитии технологий.

НИУ ВШЭ и ДИТ Москвы подписали соглашение о развитии сети 5G и 6G

Департамент информационных технологий города Москвы и Высшая школа экономики подписали соглашение о сотрудничестве в области инновационного развития ИТ-инфраструктуры столицы. Стороны договорились о совместных исследованиях в области современных и перспективных технологий связи, включая 5G и 6G, а также ИИ, интернета вещей и других технологий умного города.

НИУ ВШЭ представил результаты исследований на конференции по ИИ в Омане

В апреле 2026 года в Университете Низвы (Султанат Оман) состоялась Международная конференция по интеллектуальным системам и приложениям искусственного интеллекта (ISAA 2026). Высшая школа экономики выступила соорганизатором мероприятия совместно с Университетом Низвы и Университетом технологий и прикладных наук Ибри. Ученые НИУ ВШЭ также вошли в число ключевых спикеров конференции.