← 返回信息流
AI 资讯TechCrunch AI·1 天前

前高盛Meta创始人打造语音AI,服务被忽视市场

原标题:These two founders left Goldman and Meta to build voice AI for markets everyone else overlooked

速览

两名前高盛和Meta的创始人联合创立了一家专注于语音AI的初创公司。该公司的技术栈专门针对非洲和中东等被主流市场忽视的地区进行优化。目前,该方案每天能够处理超过17,000次通话,显示出强劲的市场需求和技术落地能力。

AI 深度解读

AethexAI:为被忽视的市场构建原生语音 AI,而非简单移植

背景

当前,语音 AI(Voice AI)领域最热门的应用场景无疑是客户服务与支持。然而,构建一个既听起来像真人、又能实现无感知低延迟响应的产品,在不同市场面临的难度截然不同。大多数主流语音 AI 玩家在设计之初,并未将非洲和中东市场纳入核心考量。

这些地区存在独特的语言环境(如方言、代码转换)、基础设施限制以及极高的通话量需求,导致直接套用西方成熟的 AI 解决方案往往水土不服。例如,在埃及,某呼叫中心曾因自动化效果不佳而回退系统;在非洲,许多支持中心表示,以合理成本招聘工程师来自动化呼叫是一项持续的痛点。

正是在这种背景下,AethexAI 应运而生。这家成立于去年的初创公司旨在填补这一市场空白,专注于为非洲和中东地区提供本地化的语音 AI 解决方案。

核心内容

AethexAI 最近完成了由 4DX Ventures 领投的 300 万美元种子前融资,Enza Capital、Dorm Room Fund、Mojo Ventures 和 Stanford GSB 26 Fund 等机构参与投资。此外,斯坦福大学教职员工、电信高管以及 Anthropic 的 AI 研究人员也作为个人投资者参与了此次融资。

技术架构:自建模型与编排层

与许多依赖 Vapi 或 LiveKit 等现有编排工具的公司不同,AethexAI 选择从零开始构建自己的小参数模型和编排层。这一决策源于该地区运营的特殊需求。

AethexAI 联合创始人兼 CTO Ayooluwa Odemuyiwa 指出,该地区自动呼叫中出现的延迟和抖动(jitter)令人难以接受。如果采用编排器模式,可能不得不使用托管在区域外的大型模型,从而导致更高的延迟。因此,团队意识到必须使用极小的模型,并在每一步削减延迟,才能实现可用性和响应速度的平衡。

模型策略:小而精的 Kora 系列

为了应对延迟问题并保持准确性,AethexAI 没有追逐最大的语言模型(LLMs),而是开发了自有系列的 Kora 模型,参数量在 3 亿到 17 亿之间。这仅是大型 LLM 规模的一小部分,但足以解决该地区的特定问题。

在数据训练方面,AethexAI 采取了低成本且高效的策略:

  1. 使用呼叫中心合作伙伴的匿名录音。
  2. 向非洲各地的广播电台发送硬盘以收集更多音频数据。
  3. 建立由大学生组成的贡献者网络,用于数据标注和本地名称发音,从而大幅降低人力成本。

目前,该公司每天处理超过 17,000 次呼叫。

创始团队背景

AethexAI 由 Mariama Diallo(CEO)和 Ayooluwa Odemuyiwa(CTO)共同创立。

  • Mariama Diallo:曾任职于高盛(Goldman Sachs),后加入 Y Combinator 支持的 ModelML 负责产品和增长。
  • Ayooluwa Odemuyiwa:加州理工学院(Caltech)毕业,曾在 Meta 工作,随后进入斯坦福商学院,最终联合创立了 AethexAI。

商业模式与客户策略

公司正在向企业推出平台试用服务,并提供 API 和 SDK 供开发者实验其模型。在业务拓展上,AethexAI 采取谨慎的“顾问式”策略:

  • 聚焦单一用例:CEO Diallo 表示,公司无法一开始就满足所有人的所有需求。他们建议客户从最重要的一个用例开始,通过现场演示和工作坊帮助客户识别最佳自动化场景。
  • 主要应用场景:目前主要集中在催收、客户激活以及 KYC(了解你的客户)验证——这是银行和电信行业标准的身份检查流程。
  • 本地化部署:公司正在招聘外派工程师以服务于本地市场,并与电信提供商建立渠道合作伙伴关系,以处理语音 AI 呼叫的电信基础设施。AethexAI 强调,即插即用(Plug-and-play)的解决方案在这里行不通。

关键要点

  • 市场差异化:非洲和中东市场的通话量约为西方同行的三倍,且语音仍是主要的客户互动渠道。现有系统多基于西方高端 GPU 基础设施、标准英语及欧洲语音环境构建,无法有效处理方言、代码转换和非正式口语模式。
  • 技术自主权:AethexAI 拒绝依赖外部编排工具,转而自建小参数模型(Kora 系列,3-17 亿参数)和编排层,以解决跨区域传输带来的高延迟问题。
  • 数据收集创新:通过向广播电台发送硬盘收集音频,并利用大学生网络进行低成本标注,解决了小模型训练中的数据瓶颈。
  • 务实的业务落地:不追求通用性,而是深入垂直场景(如 KYC、催收),并通过本地化工程师和电信合作伙伴关系解决基础设施适配问题。
  • 巨头盲区:尽管 ElevenLabs、Deepgram、Sierra 和 Cognigy 等巨头正在快速全球化,但它们的核心架构和激励机制并未针对这些新兴市场的特殊需求(如方言支持、现有电信基础设施兼容性及价格敏感度)进行优化。

意义与影响

AethexAI 的案例揭示了 AI 全球化进程中一个常被忽视的现实:技术扩散不等于市场适应

  1. 重新定义“通用 AI”的边界:主流 AI 公司往往假设“英语+标准基础设施”是全球默认值。AethexAI 证明,在基础设施薄弱、语言多样性高且对延迟极度敏感的市场,必须采用“本地原生”的技术架构,而非简单的模型微调。
  2. 小模型的价值回归:在特定垂直领域和边缘场景下,经过精心设计和数据优化的小参数模型(Small Language Models, SLMs)可能在延迟、成本和准确性上优于盲目追求规模的大模型。
  3. 新兴市场的 AI 基础设施缺口:非洲和中东市场存在巨大的“最后一公里”部署缺口。这不仅需要算法创新,更需要深厚的本地渠道合作(如电信运营商)和对当地业务流程的深刻理解。
  4. 投资风向标:4DX Ventures 等机构的支持表明,风险资本开始关注那些能够解决“非典型”市场痛点、具备深厚本地化壁垒的 AI 初创公司,而非仅仅追逐通用大模型的应用层。

AethexAI 的赌注在于:巨头们由于架构惯性及缺乏激励,难以填补这些细分市场的空白。而对于 AethexAI 而言,通过构建针对方言、代码转换和现有电信基础设施优化的专用模型,它正在开辟一个竞争对手难以轻易复制的利基市场。

查看原文 →techcrunch.com