← 返回信息流
AI 资讯TechCrunch AI·1 小时前

今年必备AI词汇指南

原标题:The only AI glossary you’ll need this year

速览

随着AI技术快速普及,大量新术语和俚语涌现,令人应接不暇。本文精选了最关键的AI词汇并给出定义,帮助读者快速理解行业黑话。无论是入门者还是进阶用户,这份术语表都能成为实用参考。从基础概念到前沿技术,覆盖今年最常遇到的AI表达。

AI 深度解读

背景

人工智能正在重塑世界,同时也创造了一套全新的语言来描述这一过程。如今随便参加一场产品会议、路演或圆桌讨论,你都会听到人们随口抛出 LLMs、RAG、RLHF 等十几个术语,就连科技圈最聪明的人有时也感到无所适从。TechCrunch AI 发布的这份词汇表正是为了解决这个问题:用平实的英语(本文已译为中文)定义你最可能遇到的 AI 术语——无论你是在用这些技术构建产品、投资它们,还是仅仅通过阅读 TechCrunch 或收听相关播客来跟上时代。随着领域的发展,该词汇表会定期更新,因此它本身就像所描述的 AI 系统一样,是一份活的文档。

核心内容

以下是对该词汇表中各术语的完整翻译与解读:

AGI(Artificial General Intelligence,人工通用智能)是一个模糊的术语,但通常指在大多数任务上比普通人类更强大的 AI。OpenAI CEO Sam Altman 曾将其描述为“相当于你可以雇来当同事的中等人”。OpenAI 的章程则将 AGI 定义为“在大多数具有经济价值的工作上超越人类的高度自主系统”。而 Google DeepMind 的理解略有不同:该实验室认为 AGI 是“在大多数认知任务上至少与人类能力相当的 AI”。困惑吗?不必担心——连 AI 研究前沿的专家们也尚未达成共识。

AI agent(AI 智能体)指一种利用 AI 技术代表你执行系列任务的工具——其能力超越了基础 AI 聊天机器人——例如报销费用、预订机票或餐厅座位,甚至编写和维护代码。然而,正如我们之前解释过的,这一新兴领域涉及许多动态组件,因此“AI agent”对不同的人可能有不同含义。支撑其设想的底层基础设施也仍在建设中。但基本概念意味着一个自主系统,它可能调用多个 AI 系统来完成多步骤任务。

API endpoints(API 端点)可以理解为软件后端的“按钮”,其他程序可以按下这些按钮来让软件执行操作。开发者使用这些接口构建集成——例如,允许一个应用从另一个应用拉取数据,或者让 AI agent 直接控制第三方服务,而无需人工手动操作每个界面。大多数智能家居设备和连接平台都有这些隐藏的按钮,即使普通用户从未看到或与之交互。随着 AI agent 能力增强,它们越来越能自主发现和使用这些端点,从而为自动化带来强大——有时是意想不到——的可能性。

Chain of thought(思维链):对于简单问题,人脑无需过多思考就能回答——比如“长颈鹿和猫哪个更高?”但在许多情况下,你需要纸笔才能得出正确答案,因为存在中间步骤。例如,如果一位农民有鸡和牛,它们共有 40 个头和 120 条腿,你可能需要写下简单方程才能得出答案(20 只鸡,20 头牛)。在 AI 语境下,对大型语言模型(LLM)进行思维链推理意味着将问题分解为更小的中间步骤,以提高最终结果的质量。通常获取答案需要更长时间,但答案更可能正确,尤其是在逻辑或编程场景中。推理模型是从传统大型语言模型发展而来的,并通过强化学习优化了思维链思考能力。(参见:Large language model)

Coding agents(编码智能体)是比“AI agent”更具体的概念,后者指能够自主逐步采取行动以完成目标的程序。编码智能体是应用于软件开发的专门版本。它不仅向人类建议代码供审查和粘贴,还能自主编写、测试和调试代码,处理那些通常占据开发者整个工作日的迭代试错工作。这些智能体可以跨整个代码库运行,发现 bug、运行测试并推送修复,只需极少的人类监督。可以想象成雇佣了一名从不睡觉、从不走神的极快实习生——但和任何实习生一样,仍需要人类检查其工作。

Compute(算力)虽然是一个多义术语,但通常指使 AI 模型运行的关键计算能力。这种处理能力驱动着 AI 产业,使其能够训练和部署强大的模型。该术语常作为提供计算能力的硬件类型的简称——如 GPU、CPU、TPU 以及其他构成现代 AI 产业基石的基础设施形式。

Deep learning(深度学习)是自我改进的机器学习的一个子集,其中 AI 算法采用多层人工神经网络(ANN)结构。这使得与更简单的基于机器学习的系统(如线性模型或决策树)相比,它们能够建立更复杂的相关性。深度学习算法的结构借鉴了人脑中神经元相互连接的通路。深度学习 AI 模型能够自行识别数据中的重要特征,而无需人类工程师定义这些特征。该结构还支持算法从错误中学习,并通过重复和调整的过程改进自身的输出。然而,深度学习系统需要大量数据点(数百万或更多)才能产生良好结果,并且通常比更简单的机器学习算法需要更长的训练时间——因此开发成本往往更高。(参见:Neural network)

Diffusion(扩散)是许多生成艺术、音乐和文本的 AI 模型的核心技术。受物理学启发,扩散系统通过添加噪声逐步“破坏”数据的结构(例如照片、歌曲等),直到什么都不剩。在物理学中,扩散是自发的、不可逆的——咖啡中扩散的糖无法恢复成方糖形态。但 AI 中的扩散系统旨在学习一种“逆向扩散”过程来恢复被破坏的数据,从而获得从噪声中恢复数据的能力。

Distillation(蒸馏)是一种通过“教师-学生”模型从大型 AI 模型中提取知识的技术。开发者向教师模型发送请求并记录输出。有时输出会与数据集进行比较以评估准确度。然后这些输出被用来训练学生模型,学生模型被训练成近似教师的行为。蒸馏可用于基于大型模型创建更小、更高效的模型,且蒸馏损失最小。这很可能就是 OpenAI 开发 GPT-4 Turbo(GPT-4 的更快版本)的方法。虽然所有 AI 公司都在内部使用蒸馏,但一些 AI 公司也可能利用它来追赶前沿模型。从竞争对手处进行蒸馏通常违反 AI API 和聊天助手的服务条款。

Fine-tuning(微调)指对 AI 模型进行进一步训练,以优化其在更具体任务或领域上的性能——通常通过输入新的、专门的(即面向任务的)数据。许多 AI 初创公司以大型语言模型为起点构建商业产品,但试图通过基于自身领域知识和专长进行微调来补充先前的训练周期,从而提升目标领域或任务上的实用性。(参见:Large language model [LLM])

GAN(Generative Adversarial Network,生成对抗网络)是一种机器学习框架,它在生成逼真数据(包括但不限于深度伪造工具)方面支撑着生成式 AI 的一些重要发展。GAN 涉及使用……

(注:原文在此处截断,未完整给出 GAN 的定义。)

关键要点

  • 术语爆炸与认知鸿沟:AI 领域(尤其是生成式 AI 和大型语言模型)催生了大量新术语,即使是科技行业资深人士也难以全部把握。这份词汇表旨在降低理解门槛。
  • 定义仍存争议:许多核心概念(如 AGI、AI agent)在不同公司和专家之间存在显著定义差异,反映该领域仍处于快速演进阶段。
  • 技术关联性强:多个术语相互嵌套(如 Chain of thought 与 LLM 的关系、Fine-tuning 与 LLM 的关系、Coding agents 是 AI agent 的子类),理解时需注意上下文。
  • 从学术到产业的全覆盖:词汇涵盖理论(Deep learning、Diffusion)、工程(API endpoints、Distillation)、产品(AI agent、Coding agents)以及基础设施(Compute)等层面。
  • 技术利弊并存:AI agent 和 Coding agents 展示自动化潜力,但同时也带来监管、安全和人类监督挑战;GAN 和 Diffusion 既有创意价值,也有深度伪造等风险。

意义与影响

这份词汇表不仅是便利的参考工具,更折射出 AI 产业当前的发展阶段:技术快速迭代的同时,语言体系尚在形成中,许多概念的定义仍流动不居。它帮助读者在技术讨论中更自信地参与——无论是开发者、投资者还是普通观察者——并减少因术语歧义导致的沟通障碍。更重要的是,词汇表的“活文档”特性本身呼应了 AI 系统的动态本质:随着多模态模型、推理模型、Agent 框架等新范式不断涌现,术语列表将不断扩充和修正。对该领域的任何人而言,理解这些基础概念是应对未来技术浪潮的第一步。

查看原文 →techcrunch.com