Agent SkillLINUX DO · AI·2026/5/20

咕泡学院第13期AI深度学习课程上线涵盖大模型与Agent实战

原标题：咕泡学院-人工智能深度学习系统班（第13期）

速览

咕泡学院正式推出第13期人工智能深度学习系统班，提供全套课件与实战资料。课程内容紧跟AI前沿，重点涵盖大语言模型（LLM）、RAG、Agent工作流搭建及LoRA微调等热门技术。同时包含计算机视觉、自然语言处理及强化学习等多模态领域的经典算法与项目实战，适合AI从业者系统学习。

AI 深度解读

背景

随着人工智能技术从单纯的算法研究迅速向工程化落地演进，深度学习的应用场景已不再局限于传统的计算机视觉或自然语言处理单点突破，而是呈现出多模态融合、大模型微调、智能体（Agent）工作流以及具身智能等多元化趋势。咕泡学院推出的“人工智能深度学习系统班（第13期）”正是在这一背景下，旨在为学员提供一套从基础理论到前沿实战的完整知识体系。

该课程资源涵盖了从底层框架配置到上层应用开发的完整链路，不仅包含经典的深度学习算法解析，更重点聚焦于当前业界最热门的 Large Language Model (LLM)、RAG（检索增强生成）、Computer Vision (CV) 大模型以及强化学习在机器人领域的应用。通过整合直播回放、课件资料及大量实战项目，该课程体系试图解决开发者在面对快速迭代的技术栈时，如何构建系统化认知并实现高效落地的痛点。

核心内容

本期课程内容极为庞大且结构清晰，主要划分为以下几个核心模块：

1. 基础架构与核心算法基石

课程从深度学习的基础出发，涵盖了深度学习必备的核心算法、PyTorch 框架实战以及 OpenCV 图像处理框架。在算法层面，深入讲解了贝叶斯算法、HMM（隐马尔可夫模型）、Word2vec 词向量构建以及 LSTM 情感分析等经典 NLP 技术。同时，针对视觉基础，详细解析了图像金字塔、Canny 边缘检测、Sobel 算子、傅里叶变换等传统图像处理技术，为后续的高级视觉任务打下坚实基础。

2. 计算机视觉（CV）深度实战

视觉部分是课程的重头戏，涵盖了从传统检测到现代大模型的完整技术栈：

目标检测与分割：深入解读 YOLO 系列（V4, V5）、Mask R-CNN、Mask2former、Deformable DETR 等主流检测框架的源码与配置。在分割领域，详细讲解了 U-Net 系列、DeepLabV3+、U2NET 显著性检测以及医学图像分割实战。
前沿视觉大模型：重点解读了 SAM (Segment Anything Model)、SAM2 视频分割、LLaVA 多模态大模型、BEIT 自监督学习算法以及 Deformable Attention 机制。
3D 与点云技术：涵盖 PointNet、PointNet++ 算法解读与实战，以及 3D 点云补全、配准和多模态 3D 目标检测。
Transformer 在视觉中的应用：详细解析 ViT (Vision Transformer)、Swin Transformer、Medical Transformer 以及 BEVFormer 在自动驾驶感知特征空间中的应用。

3. 自然语言处理（NLP）与大语言模型（LLM）

这一模块紧跟 AI 技术前沿，从传统 NLP 过渡到大模型时代：

传统 NLP 进阶：包括 BERT 通用框架实战、Huggingface 工具链使用、文本特征方法对比及知识图谱构建。
LLM 核心原理与微调：深入解读 GPT 系列（GPT-2, GPT-3/4 隐含逻辑）、Llama 系列（Llama 3 应用）、LoRA 微调策略。特别介绍了 Llama-factory 微调框架实例，以及针对下游任务的模型训练实战。
RAG 与智能体应用：详细讲解了 RAGFLOW 工具、Function Calling 机制、LangChain 助攻 RAG 构建、LangGraph 建立旅游资讯 Agent，以及斯坦福 AI 小镇架构解读。此外，还涉及了企业知识智能检索系统的构建与优化。

4. 强化学习与具身智能

课程不仅关注静态模型，还深入动态决策领域：

强化学习基础与算法：从 Q-learning、DQN 到 Actor-Critic (A3C)、PPO 算法的公式推导与实战（如月球登陆器训练）。
大模型与 RL 结合：探讨了融合大语言模型的人形机器人强化学习训练范式，以及基于分层强化学习的机器人路径规划。
具身智能：介绍了人形机器人模仿学习范式及融合具身智能的机器人学习范式，展示了 AI 从数字世界走向物理世界的最新探索。

5. 多领域综合应用与行业解决方案

课程提供了丰富的行业落地案例，包括：

推荐系统：涵盖协同过滤、矩阵分解、DeepFM 算法实战，以及基于知识图谱的电影、音乐、酒店推荐系统。
时间序列预测：讲解 Informer、TimesNet 原理及 Time-LLM 多模态预测任务。
知识图谱：Neo4j 数据库实战、文本关系抽取、医学糖尿病数据命名实体识别及医药问答系统。
其他专项：包括对抗生成网络 (GAN)、扩散模型 (Diffusion) 架构解读、语音识别、缺陷检测（钢材、布料、铁质材料）以及无人驾驶中的行为识别与姿态估计。

关键要点

技术栈全面覆盖：课程不仅包含传统的 CNN、RNN 架构，更密集覆盖了当前最火的 Transformer 架构、LLM 微调（LoRA）、RAG 架构、Agent 工作流（LangChain/LangGraph）以及具身智能，确保了技术视野的前沿性。
源码级深度解读：许多模块不仅仅是理论讲解，更深入到源码层面，如 SAM、SAM2、Mask2former、BEVFormer、Deformable DETR 等前沿模型的源码解读，有助于开发者理解底层实现逻辑。
实战导向明确：提供了大量具体的实战项目，如“基于 YOLOV5 的钢材缺陷检测”、“医学细胞分割”、“企业知识智能检索系统”、“历史人物自动化剪辑”等，强调从数据预处理、模型训练到部署优化的全流程闭环。
多模态融合趋势：课程显著强调了多模态技术，如 LLaVA 视觉语言模型、BEV 感知特征空间、多模态 3D 目标检测等，反映了 AI 技术从单一模态向多模态融合发展的必然趋势。
工程化与部署优化：除了模型训练，还专门设置了“深度学习模型部署与剪枝优化实战”章节，关注模型在实际生产环境中的效率与性能，体现了工程落地的实际需求。

意义与影响

咕泡学院第 13 期人工智能深度学习系统班的资源整理，对于 AI 从业者和学习者具有重要的参考价值。首先，它提供了一个结构化的学习路径，帮助学习者克服面对海量 AI 资料时的碎片化焦虑，从基础算法到前沿大模型形成系统认知。其次，课程对前沿技术如 SAM、LLaVA、LangGraph 等的深入解读，紧跟业界技术迭代速度，有助于开发者快速掌握最新的技术红利。最后，通过涵盖从 CV、NLP 到 RL、具身智能的广泛领域，该课程体系展示了 AI 技术的通用性与跨界融合能力，为培养具备复合能力的 AI 工程师提供了丰富的素材和实践场景。对于希望进入或深耕 AI 领域的专业人士而言，这是一份极具含金量的实战指南。

查看原文 →linux.do