← 返回信息流
AI 资讯Hacker News·3 小时前

构建可靠的智能体AI系统

原标题:Building Reliable Agentic AI Systems

速览

本文聚焦于AI智能体(Agentic AI)系统的可靠性构建。文章分析了在复杂环境中确保智能体行为稳定、可预测的关键技术与架构设计。这对于推动AI从辅助工具向自主执行者转变具有重要意义。

AI 深度解读

构建可靠的 Agentic AI 系统:拜耳 PRINCE 平台案例深度解读

背景

临床前药物发现(Preclinical drug discovery)具有内在的复杂性和数据密集型特征。在这一关键阶段,研究人员面临着从海量信息中高效访问和分析数据的巨大挑战。这些数据主要来源于过去几十年积累的临床试验报告、结构化元数据以及非结构化文档。

传统的基于关键词的搜索方法(通常依赖僵化的布尔逻辑)在面对临床前研究问题中微妙且错综复杂的性质时,往往显得力不从心。尽管拜耳(Bayer AG)早期已着手整合分散在各临床前领域的结构化研究元数据,建立了统一的“可搜索”网关,但公司大量有价值的临床前知识仍被困在非结构化的 PDF 研究报告中。由于多年的系统迁移,这些报告关联的结构化元数据往往不完整、缺失甚至包含错误标注。相比之下,经过批准的 PDF 研究报告才是信息的“黄金标准”。

随着大型语言模型(LLMs)的兴起,结合生成能力与信息检索精度的检索增强生成(RAG)技术成为了解决这一困境的关键。拜耳与 Thoughtworks 合作,开发了云托管平台 PRINCE(Preclinical Information Center,临床前信息中心),旨在通过 Agentic RAG 和 Text-to-SQL 技术,将数十年的安全研究报告整合起来,解决制药行业在药物开发中的数据访问难题。

核心内容

PRINCE 平台不仅是技术的堆叠,更是从“搜索”到“问答”再到“执行”的演进过程。该案例详细阐述了其系统架构、工程决策以及如何在生产环境中构建可信赖的 Agentic AI 系统。

1. 平台演进:从 Search 到 Ask 再到 Do

PRINCE 的发展经历了三个明确的阶段,反映了其从被动工具向主动研究助手转变的战略路径:

  • Search(搜索阶段): 初始阶段聚焦于创建统一网关,整合来自各个临床前领域的数千份非临床研究报告的元数据。主要利用结构化元数据,允许用户应用高级过滤器来检索信息。
  • Ask(问答阶段): 引入基于 RAG 的 AI 问答系统。研究人员可以使用自然语言直接查询历史报告(包括扫描版 PDF)的内容,从而从未结构化数据中直接获取洞察。
  • Do(执行阶段): 当前阶段将 PRINCE 定位为主动的研究助手。通过集成多智能体系统(Multi-agent systems),平台能够处理复杂查询、编排工作流,并支持起草监管文件等复杂任务。

2. 系统架构:工程化的可靠性设计

PRINCE 的前端基于 React 构建,后端由 FastAPI 服务,核心编排引擎采用 LangGraph。其架构设计重点在于通过“上下文工程”(Context Engineering)和“驾驭工程”(Harness Engineering)来确保系统的可控性和可靠性。

  • 上下文工程: 决定每个模型接收什么信息、不接收什么信息,以及上下文如何在研究、反思和写作等专门步骤之间流动。
  • 驾驭工程: 围绕模型构建的脚手架,包括编排、工具边界、状态持久化、重试机制、回退策略、验证、反思循环、可观测性及人工审核。

3. 工作流与智能体协作

系统通过 LangGraph 协调多阶段流程,具体包括:

  1. 澄清意图: 理解用户需求。
  2. 思考与规划: 制定查询策略。
  3. 研究执行: 使用 RAG 和 Text-to-SQL 进行数据检索。
    • 向量存储: 所有研究报告的向量表示存储在 OpenSearch 中,作为信息检索的核心知识库。
    • 结构化数据: 经过 ETL 和标准化处理的结构化数据通过 Athena 访问。
  4. 验证完整性: 确保数据收集完整。
  5. 生成响应: 由 Writer 智能体生成最终回答。

该工作流包含明确的暂停点和反馈循环,以确保在继续下一步之前数据的完整性。

4. 构建信任与韧性

在生产环境中部署 LLM 系统,信任是核心要素。PRINCE 通过以下方式建立信任:

  • 透明度与可解释性: 系统提供透明的推理过程。
  • 人在回路(Human-in-the-loop): 集成人工审核机制,特别是在关键决策点。
  • 错误处理与恢复: 通过驾驭工程构建的韧性机制,包括重试、回退和状态管理,确保系统在遇到错误时仍能保持稳定运行。
  • 数据质量增强: 利用命名实体识别(NER)和标注技术提升数据质量,解决元数据缺失或错误的问题。

关键要点

  • 从元数据到全文检索的范式转移: PRINCE 的成功关键在于突破了仅依赖结构化元数据的局限,利用 RAG 技术解锁了非结构化 PDF 报告中的“黄金标准”信息,解决了因系统迁移导致的数据标注错误问题。
  • 上下文工程与驾驭工程的双重保障: 系统的可靠性不仅取决于模型本身,更取决于如何精心设计和控制上下文流(Context Engineering)以及如何构建围绕模型的编排、监控和恢复机制(Harness Engineering)。
  • 多智能体协作解决复杂任务: 通过 LangGraph 编排多个专门化智能体(如 Researcher, Writer 等),系统能够执行从简单问答到起草监管文件的复杂工作流,实现了从“Ask”到“Do”的能力跃迁。
  • 信任建立在透明与人工介入之上: 在制药这种高合规要求的行业,AI 系统必须通过可解释性、透明度和人工审核(Human-in-the-loop)来建立用户信任,确保治理和合规性。
  • 迭代式开发策略: PRINCE 并非一次性建成,而是通过 Search -> Ask -> Do 的迭代路径逐步演进,这种策略允许团队在每一阶段验证价值并优化技术架构。

意义与影响

PRINCE 案例展示了 AI 在制药行业的变革性潜力。它不仅显著提高了数据可访问性和研究效率,还通过减少不必要的实验加速了更安全、更有效疗法的开发进程。

对于整个科技和制药行业而言,PRINCE 提供了一个重要的参考范例:

  1. 工业级 Agentic AI 的落地路径: 证明了 Agentic AI 不仅仅是概念验证,而是可以解决真实世界复杂业务问题的生产就绪型系统。
  2. 非结构化数据的价值释放: 展示了如何利用现代 AI 技术激活企业长期积累的、沉睡的非结构化数据资产。
  3. 工程化思维的重要性: 强调了在 AI 应用中,软件工程原则(如编排、监控、错误处理)与模型能力同等重要,甚至是决定系统能否在生产环境稳定运行的关键。

拜耳的这一实践表明,通过合理的架构设计和工程决策,Agentic AI 可以成为研究人员强大的合作伙伴,推动药物发现流程向更高效、更数据驱动的方向发展。

查看原文 →martinfowler.com