← 返回信息流
GitHub 热榜GitHub Trending · 周·7 天前

从零构建AI工程:掌握、构建与交付

原标题:rohitg00/ai-engineering-from-scratch
Python22,419 stars+11,840 本周

速览

该项目通过“学习、构建、交付”的闭环方法论,帮助开发者深入理解AI底层原理并掌握工程化落地能力。涵盖从基础理论到实际部署的全流程,适合希望系统掌握AI工程技能并具备独立交付能力的开发者。

AI 深度解读

AI Engineering from Scratch:从零构建 AI 工程能力的硬核课程

这是什么

rohitg00/ai-engineering-from-scratch 是一个基于 GitHub 的开源、免费(MIT 协议)AI 工程化课程体系。该项目由 Rohit Gupta 发起,旨在通过“从零实现”的方式,帮助学习者深入理解人工智能底层原理,而非仅仅停留在 API 调用层面。

  • 规模与结构:包含 20 个阶段(Phases),共计 473 节课,预计学习时长约 320 小时
  • 技术栈:涵盖 Python、TypeScript、Rust 和 Julia 四种编程语言。
  • 核心理念:每一节课都遵循“推导数学公式 -> 手写代码实现 -> 运行测试 -> 产出可复用工件”的闭环。最终产出物包括提示词(Prompts)、技能定义(Skills)、智能体(Agents)或 MCP 服务器配置。
  • 交付形式:每个知识点都有独立的文件夹结构,包含可运行的代码、文档叙述以及最终生成的 outputs(如 prompt 模板或 agent 配置)。

解决的问题

当前 AI 教育领域存在严重的**“理论与实践脱节”**现象:

  1. 知识碎片化:大多数教程分散在论文解读、微调博客或炫酷的演示视频中,缺乏系统性。学习者可能搭建了一个聊天机器人,却无法解释其损失函数曲线;或者将函数挂钩到 Agent,却说不清模型内部的注意力机制。
  2. 黑盒依赖:大多数材料直接引入 PyTorch 或 Hugging Face 等高级框架,导致学习者知其然不知其所以然。当遇到底层报错或需要优化性能时,缺乏排查和修改底层逻辑的能力。
  3. 职业准备不足:数据显示,84% 的学生已经使用 AI 工具,但仅有 18% 的人觉得自己具备专业使用它们的能力。该项目旨在填补这一巨大的技能差距,从线性代数基础一直延伸到自主智能体集群。

核心功能

该项目不仅仅是一套视频课程,而是一个可执行、可交互的工程化学习系统

1. 标准化的六步学习闭环

每节课严格遵循以下流程:

  • MOTTO:一句话概括核心思想。
  • PROBLEM:具体的痛点或问题场景。
  • CONCEPT:通过图表和直觉解释概念。
  • BUILD IT从零开始,使用原始数学和代码实现算法(无框架依赖)。
  • USE IT:使用 PyTorch/sklearn 等生产级库重新实现相同功能,对比理解框架底层逻辑。
  • SHIP IT:产出实际可用的工件(Prompt、Skill、Agent 或 MCP 配置)。

2. 模块化且可跳跃的阶段架构

课程分为 20 个阶段,逻辑层层递进,但允许具备基础的学习者跳过前置阶段:

  • 基础层:Phase 0 (工具链) -> Phase 1 (数学基础) -> Phase 2 (ML 基础)。
  • 核心层:Phase 3 (深度学习核心) -> Phase 4-6 (视觉/NLP/音频) -> Phase 7 (Transformer 深入)。
  • 进阶层:Phase 8 (生成式 AI) -> Phase 9 (强化学习) -> Phase 10-11 (LLM 从零构建与工程化)。
  • 应用层:Phase 12 (多模态) -> Phase 13 (工具与协议) -> Phase 14-16 (智能体工程、自主系统、多智能体集群)。
  • 生产与收尾:Phase 17 (基础设施与生产部署) -> Phase 18 (伦理与安全) -> Phase 19 (毕业设计)。

3. 智能体辅助学习路径

项目内置了与主流 AI 编程助手(如 Claude, Cursor, Codex 等)集成的指令:

  • /find-your-level:通过 10 个问题评估当前水平,智能推荐起始阶段和学习路径。
  • /check-understanding:在每个阶段结束后进行自我测试。

4. 可复用的工件库 (Artifacts)

每节课结束都会生成实际可用的资源:

  • Prompts:针对特定任务的提示词模板。
  • Skills:符合 SKILL.md 标准的技能文件,可直接安装到 AI 编程助手(如 Claude, Cursor)中,增强其特定领域的编码或推理能力。

亮点 / 与同类相比

| 维度 | 传统 AI 课程/教程 | AI Engineering from Scratch | | :--- | :--- | :--- | | 实现方式 | 直接调用高级 API 或框架 | 从零手写:先推导数学,再用原生代码实现,最后对比框架 | | 知识连贯性 | 碎片化,缺乏系统性连接 | 脊柱式结构:20 个阶段线性堆叠,强调底层原理对上层应用的支撑 | | 产出物 | 笔记、代码片段、视频 | 可复用工件:Prompt、Skill 文件、Agent 配置,可直接投入工作流 | | 语言支持 | 通常仅限 Python | 多语言:Python, TypeScript, Rust, Julia,适应不同工程场景 | | 深度 | 侧重“如何使用” | 侧重“内部机制”:理解 Attention、Backprop、Tokenizer 等底层细节 | | 成本 | 部分付费,部分免费但质量参差 | 完全免费开源 (MIT),无隐藏费用 |

独特亮点

  • Build It / Use It 分离:强制要求先手写实现,再使用框架。这种“先苦后甜”的方式确保学习者真正理解框架在做什么,而不是盲目复制粘贴。
  • Phase 14 的工作bench 机制:在智能体工程阶段,每节课前提供 mission.md 简报,模拟真实工作中 Agent 接收任务指令的场景。

适合谁用 / 上手

适合人群

  1. 希望深入理解 AI 原理的开发者:不满足于调用 API,想要知道 Transformer、Backprop 等算法底层细节的工程师。
  2. AI 工程化从业者:需要构建生产级 LLM 应用、智能体系统或多模态应用,并需要处理底层优化和调试的技术人员。
  3. 具备编程基础的学习者:需要至少掌握一门编程语言(Python 最佳,但其他语言也可),具备基本的线性代数直觉者优先。
  4. 追求系统性知识的自学者:不喜欢碎片化学习,希望有一本“AI 工程圣经”从头到尾系统掌握的人。

如何上手

方式 A:在线阅读(无需配置) 直接访问 aiengineeringfromscratch.com 或查看 GitHub 上的 Contents 部分,阅读任何已完成课程的文档。

方式 B:克隆并运行代码(推荐动手实践)

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch
# 例如运行线性代数直觉课程
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

方式 C:智能定位起点(推荐) 如果你不确定从哪里开始,可以使用安装了该项目技能的 AI 编程助手(如 Claude, Cursor, Codex 等):

  1. 在聊天中输入 /find-your-level
  2. 回答 10 个关于你当前知识水平的问题。
  3. 助手将根据结果为你生成个性化的学习路径和预计耗时。
  4. 完成阶段后,使用 /check-understanding 进行自我测试。

前置技能要求

  • 能够编写代码(任何语言,Python 最有帮助)。
  • 愿意投入时间进行深度思考和高强度编码,而非被动观看视频。
查看原文 →github.com