Cryptonews

惊爆中国电商巨头语音识别技术国际排名超越对手

Source
CryptoNewsTrend
Published
惊爆中国电商巨头语音识别技术国际排名超越对手

阿里巴巴的新语音模型排名高于 OpenAI 和 xAI 系统,从而在全球语音 AI 竞赛中取得了更高的成绩。由阿里巴巴统一实验室开发的Fun-Realtime-TTS-Preview在Artificial Analysis Speech Arena排行榜上排名第五。结果使阿里巴巴成为唯一进入全球前五名的中国设计的语音系统。据南华早报报道,Fun-Realtime-TTS-Preview 在人工分析语音竞技场上取得了 1,190 分的成绩。排行榜通过对生成的语音片段进行盲用户评分来衡量语音模型。人工分析在旧金山运行基准测试。其支持者包括 GitHub 前首席执行官 Nat Friedman 和 Google Brain 创始人 Andrew Ng。该排名比较了关键语音任务的语音模型。这些任务包括语音到文本、语音理解、对话交互和文本到语音生成。阿里巴巴的模型在基准测试中领先于西方竞争对手 OpenAI 和 xAI。这一结果使统一实验室跻身全球领先的语音人工智能开发商之列。该成就集中于复杂的中文语音模式。该模型处理的方言和口音通常会降低旧语音系统的准确性。中国的语音人工智能系统面临着跨地区方言的准确性问题。百度开发者中心五月份的一份报告描述了该问题的严重程度。该报告发现,接受标准普通话训练的传统系统在识别有口音的人时会失去准确性。它还发现,中国地方方言的准确率可能会下降到 30% 以下。阿里巴巴的云部门报告称,新模型的语言覆盖范围更广。系统支持30多种语言、7种主要汉语方言、20多种地方口音。该公司在语音识别测试中也排名靠前。阿里巴巴的 Fun-Realtime-ASR 模型在人工分析误词率指数中名列前茅。该模型的单词错误率为 1.8%。该分数意味着系统每 100 个转录单词中漏掉的单词少于两个。阿里巴巴也将该模型定位于企业语音AI应用。 Fun-Realtime-TTS-Preview 包括用于金融和医疗保健用例的定制工具。在医疗保健领域,该系统可以将医生的口头记录转化为结构化的临床记录。此功能针对医疗工作流程中的实时记录。中国人工智能公司已将更多注意力转向专业语音系统。许多公司现在寻求通用聊天机器人之外的实际用途。语音人工智能也适用于消费设备和商业软件。智能手机、智能扬声器和车载助手可以通过有限的用户培训来支持基于语音的交互。更广泛的语音人工智能市场仍然包括强大的美国竞争对手。 Google 和 ElevenLabs 继续引领许多商业语音应用程序和开发工具。阿里巴巴的最新排名为全球语音人工智能竞争增添了又一​​个中国模式。该公司的业绩源于对跨区域语言和企业环境的语音工具的需求不断增长。

惊爆中国电商巨头语音识别技术国际排名超越对手