Новости технологий

Sesame приближает ИИ-голос к человеческому: прорыв в выразительности речи

Компания Sesame представила исследование «Преодоление эффекта зловещей долины в разговорной речи» (Crossing the Uncanny Valley of Conversational Voice), в котором описывается их подход к созданию более естественных и эмоционально насыщенных голосовых помощников.

В современном мире голосовые ассистенты часто говорят нейтральным тоном, что со временем становится утомительным для пользователей. Sesame стремится достичь «присутствия голоса» — качества, при котором взаимодействие с голосовым помощником ощущается как настоящее и значимое. Для этого они работают над несколькими ключевыми аспектами:

  • Эмоциональный интеллект: умение распознавать и реагировать на эмоциональный контекст.
  • Динамика разговора: естественное использование пауз, интонаций и акцентов.
  • Контекстная осведомлённость: адаптация тона и стиля в зависимости от ситуации.
  • Последовательная личность: поддержание стабильного и уместного характера общения.

В рамках исследования были представлены примеры, которые демонстрируют достижения компании в области генерации разговорной речи. В демо-версии виртуальные собеседники оптимизированы для дружелюбия и выразительности, что подчёркивает потенциал подхода Sesame.

Компания признает, что создание цифрового компаньона с присутствием голоса — задача непростая, но они продолжают прогрессировать в таких направлениях, как личность, память, выразительность и уместность. Sesame надеется раскрыть неиспользованный потенциал голоса как интерфейса для инструкций и понимания, делая взаимодействие с технологиями более естественным и приятным для пользователей.

На официальном сайте Sesame каждый желающий может попробовать демоверсию, выбрав один из двух вариантов голосов: женский Maya или мужской Miles.

Источник

Показать больше

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»