← 返回信息流
AI 资讯36氪·AI·7 天前

阿里语音大模型登顶Speech Arena国产第一,全球第五

速览

5月28日,阿里巴巴语音大模型Fun-Realtime-TTS-Preview在全球权威AI评测平台Artificial Analysis的Speech Arena榜单中表现优异。该模型以1190分的Elo评分位列全球第五,并荣登国产第一。在ASR、Chat及TTS三大核心赛道中,阿里模型均斩获全国第一,彰显了其在语音技术领域的领先地位。

AI 深度解读

背景

在人工智能技术快速迭代的当下,语音大模型作为连接人类自然语言与机器交互的关键桥梁,其性能评测体系日益受到行业关注。Artificial Analysis 作为全球权威的 AI 评测平台,其推出的 Speech Arena(语音竞技场)排行榜已成为衡量语音大模型综合实力的重要标尺。该榜单通过 Elo 评分机制,对模型在语音识别、理解及合成等维度的表现进行量化排名,反映了当前全球语音 AI 技术的竞争格局。

与此同时,中国资本市场也在积极拥抱科技变革。5月28日,由深交所主办的 2026 全球投资者大会在深圳举行,证监会副主席刘浩凌在致辞中强调了中国资本市场投融资综合改革的稳健步伐,指出市场估值处于合理区间,且外资配置中国优质资产的意愿持续提升。这一宏观背景为国内科技企业的技术突破与市场认可提供了良好的政策与资本环境。

核心内容

阿里巴巴语音大模型 Fun-Realtime-TTS-Preview 在 5 月 28 日发布的 Artificial Analysis Speech Arena 排行榜中取得突破性成绩。该模型以 1190 分的 Elo 评分,位列全球第五,并稳居国产第一。

在具体的细分赛道表现上,Fun-Realtime-TTS-Preview 展现了全面的技术优势:

  1. ASR(自动语音识别):实现将语音高效、准确地转换为文字,该模型在此赛道斩获全国第一。
  2. Chat(端到端语音理解与对话):具备直接的语音理解与对话能力,无需经过中间文本转换环节,同样位列全国第一。
  3. TTS(文本转语音):实现高质量的文字到语音合成,亦夺得全国第一。

此外,同日举行的 2026 全球投资者大会上,证监会副主席刘浩凌表示,中国资本市场的投融资综合改革举措步伐稳健且持续见效,市场整体估值合理,外资对中国优质资产的配置意愿不断提升。这一表态为包括阿里在内的中国科技企业提供了积极的资本市场信号。

关键要点

  • 排名突破:阿里语音大模型 Fun-Realtime-TTS-Preview 在 Artificial Analysis Speech Arena 中全球排名第五,国产排名第一。
  • 评分数据:该模型获得 1190 分的 Elo 评分,体现了其在综合语音处理能力上的领先地位。
  • 全赛道领跑:在 ASR(语音转文字)、Chat(端到端语音对话)、TTS(文字转语音)三大核心语音技术赛道中,均获得全国第一的成绩。
  • 政策利好:证监会副主席刘浩凌在 2026 全球投资者大会上指出,中国资本市场改革见效,估值合理,外资配置意愿增强,为科技企业发展提供良好环境。
  • 时间节点:上述评测结果发布及投资者大会均发生在 5 月 28 日。

意义与影响

阿里语音大模型在 Speech Arena 的全球排名突破,标志着中国在基础语音 AI 模型领域已达到国际领先水平。Fun-Realtime-TTS-Preview 在 ASR、Chat、TTS 三大赛道的全面第一,不仅证明了阿里在语音技术底层架构上的深厚积累,也意味着其模型能够处理更复杂、更实时的多模态交互场景,为智能客服、实时翻译、车载语音助手等应用场景提供了更强大的技术底座。

从全球竞争格局来看,跻身全球前五表明中国 AI 企业正在从“应用跟随”向“基础模型引领”转变,具备与全球顶尖科技巨头同台竞技的实力。这不仅提升了中国在全球 AI 话语权中的地位,也为后续技术出海和国际合作奠定了坚实基础。

同时,证监会关于资本市场稳健运行及外资意愿提升的表态,与科技企业的技术突破形成良性共振。资本市场的信心增强有助于科技企业获得更多融资支持,加速技术研发与商业化落地,从而推动整个 AI 产业链的繁荣发展。阿里此次技术登顶,既是对其研发投入的肯定,也是对中国科技产业整体竞争力的有力佐证。

查看原文 →36kr.com