Cryptonews

В ошеломляющем разочаровании технология распознавания речи китайского гиганта электронной коммерции превосходит конкурентов в международных рейтингах

Source
CryptoNewsTrend
Published
В ошеломляющем разочаровании технология распознавания речи китайского гиганта электронной коммерции превосходит конкурентов в международных рейтингах

Оглавление Alibaba продвинулась выше в глобальной гонке голосового ИИ после того, как ее новая речевая модель оказалась выше систем OpenAI и xAI. Fun-Realtime-TTS-Preview, разработанный лабораторией Tongyi Lab, принадлежащей Alibaba, занял пятое место в таблице лидеров арены искусственного анализа речи. В результате Alibaba стала единственной голосовой системой китайского производства, вошедшей в пятерку мировых лидеров. Согласно отчету SCMP, Fun-Realtime-TTS-Preview набрал 1190 баллов на речевой арене искусственного анализа. Таблица лидеров измеряет модели голоса посредством слепых оценок пользователей сгенерированных речевых клипов. Искусственный анализ управляет эталоном из Сан-Франциско. В число его сторонников входят бывший исполнительный директор GitHub Нэт Фридман и основатель Google Brain Эндрю Нг. В рейтинге сравниваются речевые модели для ключевых голосовых задач. Эти задачи включают преобразование речи в текст, понимание голоса, разговорное взаимодействие и преобразование текста в речь. По этому показателю модель Alibaba опередила западных конкурентов из OpenAI и xAI. В результате лаборатория Tongyi Lab попала в число ведущих мировых разработчиков речевого искусственного интеллекта. Достижение было сосредоточено на сложных моделях китайской речи. Модель обрабатывала диалекты и акценты, которые часто снижают точность в старых речевых системах. Китайские системы голосового искусственного интеллекта сталкиваются с проблемами точности на региональных диалектах. В майском отчете Центра разработчиков Baidu описан масштаб этой проблемы. В отчете обнаружено, что традиционные системы, обученные на стандартном китайском языке, теряют точность при использовании динамиков с акцентом. Также было обнаружено, что точность может упасть ниже 30% для региональных китайских диалектов. Облачное подразделение Alibaba сообщило о более широком языковом охвате новой модели. Система поддерживает более 30 языков, семь основных диалектов китайского языка и более 20 региональных акцентов. Компания также показала хорошие результаты в тестировании распознавания речи. Модель Fun-Realtime-ASR от Alibaba возглавила рейтинг ошибок в словах искусственного анализа. Эта модель зафиксировала уровень ошибок в словах 1,8%. Оценка означает, что система пропустила менее двух слов на 100 транскрибированных слов. Alibaba также позиционирует эту модель для корпоративных приложений голосового искусственного интеллекта. Fun-Realtime-TTS-Preview включает инструменты настройки для сценариев использования в сфере финансов и здравоохранения. В здравоохранении система может превращать устные записи врачей в структурированные клинические записи. Эта функция предназначена для документирования в реальном времени внутри медицинских рабочих процессов. Китайские компании, занимающиеся искусственным интеллектом, стали уделять больше внимания специализированным голосовым системам. Многие компании сейчас ищут практическое применение, выходящее за рамки чат-ботов общего назначения. Voice AI также подходит для потребительских устройств и программного обеспечения для бизнеса. Смартфоны, интеллектуальные колонки и автомобильные помощники могут поддерживать голосовое взаимодействие при ограниченном обучении пользователей. На более широком рынке речевого искусственного интеллекта по-прежнему присутствуют сильные конкуренты в США. Google и ElevenLabs продолжают лидировать во многих коммерческих голосовых приложениях и инструментах для разработчиков. Последний рейтинг Alibaba добавляет еще одну китайскую модель к глобальной конкуренции речевого искусственного интеллекта. Результаты компании соответствуют растущему спросу на голосовые инструменты на региональных языках и в корпоративных условиях.

В ошеломляющем разочаровании технология распознавания речи китайского гиганта электронной коммерции превосходит конкурентов в международных рейтингах