Компания Sesame представила исследование «Преодоление эффекта зловещей долины в разговорной речи» (Crossing the Uncanny Valley of Conversational Voice), в котором описывается их подход к созданию более естественных и эмоционально насыщенных голосовых помощников.
В современном мире голосовые ассистенты часто говорят нейтральным тоном, что со временем становится утомительным для пользователей. Sesame стремится достичь «присутствия голоса» — качества, при котором взаимодействие с голосовым помощником ощущается как настоящее и значимое. Для этого они работают над несколькими ключевыми аспектами:
- Эмоциональный интеллект: умение распознавать и реагировать на эмоциональный контекст.
- Динамика разговора: естественное использование пауз, интонаций и акцентов.
- Контекстная осведомлённость: адаптация тона и стиля в зависимости от ситуации.
- Последовательная личность: поддержание стабильного и уместного характера общения.
В рамках исследования были представлены примеры, которые демонстрируют достижения компании в области генерации разговорной речи. В демо-версии виртуальные собеседники оптимизированы для дружелюбия и выразительности, что подчёркивает потенциал подхода Sesame.
Компания признает, что создание цифрового компаньона с присутствием голоса — задача непростая, но они продолжают прогрессировать в таких направлениях, как личность, память, выразительность и уместность. Sesame надеется раскрыть неиспользованный потенциал голоса как интерфейса для инструкций и понимания, делая взаимодействие с технологиями более естественным и приятным для пользователей.
На официальном сайте Sesame каждый желающий может попробовать демоверсию, выбрав один из двух вариантов голосов: женский Maya или мужской Miles.