AI 资讯Hacker News·3 小时前

构建可靠的智能体AI系统

原标题：Building Reliable Agentic AI Systems

速览

本文聚焦于AI智能体（Agentic AI）系统的可靠性构建。文章分析了在复杂环境中确保智能体行为稳定、可预测的关键技术与架构设计。这对于推动AI从辅助工具向自主执行者转变具有重要意义。

AI 深度解读

构建可靠的 Agentic AI 系统：拜耳 PRINCE 平台案例深度解读

背景

临床前药物发现（Preclinical drug discovery）具有内在的复杂性和数据密集型特征。在这一关键阶段，研究人员面临着从海量信息中高效访问和分析数据的巨大挑战。这些数据主要来源于过去几十年积累的临床试验报告、结构化元数据以及非结构化文档。

传统的基于关键词的搜索方法（通常依赖僵化的布尔逻辑）在面对临床前研究问题中微妙且错综复杂的性质时，往往显得力不从心。尽管拜耳（Bayer AG）早期已着手整合分散在各临床前领域的结构化研究元数据，建立了统一的“可搜索”网关，但公司大量有价值的临床前知识仍被困在非结构化的 PDF 研究报告中。由于多年的系统迁移，这些报告关联的结构化元数据往往不完整、缺失甚至包含错误标注。相比之下，经过批准的 PDF 研究报告才是信息的“黄金标准”。

随着大型语言模型（LLMs）的兴起，结合生成能力与信息检索精度的检索增强生成（RAG）技术成为了解决这一困境的关键。拜耳与 Thoughtworks 合作，开发了云托管平台 PRINCE（Preclinical Information Center，临床前信息中心），旨在通过 Agentic RAG 和 Text-to-SQL 技术，将数十年的安全研究报告整合起来，解决制药行业在药物开发中的数据访问难题。

核心内容

PRINCE 平台不仅是技术的堆叠，更是从“搜索”到“问答”再到“执行”的演进过程。该案例详细阐述了其系统架构、工程决策以及如何在生产环境中构建可信赖的 Agentic AI 系统。

1. 平台演进：从 Search 到 Ask 再到 Do

PRINCE 的发展经历了三个明确的阶段，反映了其从被动工具向主动研究助手转变的战略路径：

Search（搜索阶段）： 初始阶段聚焦于创建统一网关，整合来自各个临床前领域的数千份非临床研究报告的元数据。主要利用结构化元数据，允许用户应用高级过滤器来检索信息。
Ask（问答阶段）： 引入基于 RAG 的 AI 问答系统。研究人员可以使用自然语言直接查询历史报告（包括扫描版 PDF）的内容，从而从未结构化数据中直接获取洞察。
Do（执行阶段）： 当前阶段将 PRINCE 定位为主动的研究助手。通过集成多智能体系统（Multi-agent systems），平台能够处理复杂查询、编排工作流，并支持起草监管文件等复杂任务。

2. 系统架构：工程化的可靠性设计

PRINCE 的前端基于 React 构建，后端由 FastAPI 服务，核心编排引擎采用 LangGraph。其架构设计重点在于通过“上下文工程”（Context Engineering）和“驾驭工程”（Harness Engineering）来确保系统的可控性和可靠性。

上下文工程： 决定每个模型接收什么信息、不接收什么信息，以及上下文如何在研究、反思和写作等专门步骤之间流动。
驾驭工程： 围绕模型构建的脚手架，包括编排、工具边界、状态持久化、重试机制、回退策略、验证、反思循环、可观测性及人工审核。

3. 工作流与智能体协作

系统通过 LangGraph 协调多阶段流程，具体包括：

澄清意图： 理解用户需求。
思考与规划： 制定查询策略。
研究执行： 使用 RAG 和 Text-to-SQL 进行数据检索。
- 向量存储： 所有研究报告的向量表示存储在 OpenSearch 中，作为信息检索的核心知识库。
- 结构化数据： 经过 ETL 和标准化处理的结构化数据通过 Athena 访问。
验证完整性： 确保数据收集完整。
生成响应： 由 Writer 智能体生成最终回答。

该工作流包含明确的暂停点和反馈循环，以确保在继续下一步之前数据的完整性。

4. 构建信任与韧性

在生产环境中部署 LLM 系统，信任是核心要素。PRINCE 通过以下方式建立信任：

透明度与可解释性： 系统提供透明的推理过程。
人在回路（Human-in-the-loop）： 集成人工审核机制，特别是在关键决策点。
错误处理与恢复： 通过驾驭工程构建的韧性机制，包括重试、回退和状态管理，确保系统在遇到错误时仍能保持稳定运行。
数据质量增强： 利用命名实体识别（NER）和标注技术提升数据质量，解决元数据缺失或错误的问题。

关键要点

从元数据到全文检索的范式转移： PRINCE 的成功关键在于突破了仅依赖结构化元数据的局限，利用 RAG 技术解锁了非结构化 PDF 报告中的“黄金标准”信息，解决了因系统迁移导致的数据标注错误问题。
上下文工程与驾驭工程的双重保障： 系统的可靠性不仅取决于模型本身，更取决于如何精心设计和控制上下文流（Context Engineering）以及如何构建围绕模型的编排、监控和恢复机制（Harness Engineering）。
多智能体协作解决复杂任务： 通过 LangGraph 编排多个专门化智能体（如 Researcher, Writer 等），系统能够执行从简单问答到起草监管文件的复杂工作流，实现了从“Ask”到“Do”的能力跃迁。
信任建立在透明与人工介入之上： 在制药这种高合规要求的行业，AI 系统必须通过可解释性、透明度和人工审核（Human-in-the-loop）来建立用户信任，确保治理和合规性。
迭代式开发策略： PRINCE 并非一次性建成，而是通过 Search -> Ask -> Do 的迭代路径逐步演进，这种策略允许团队在每一阶段验证价值并优化技术架构。

意义与影响

PRINCE 案例展示了 AI 在制药行业的变革性潜力。它不仅显著提高了数据可访问性和研究效率，还通过减少不必要的实验加速了更安全、更有效疗法的开发进程。

对于整个科技和制药行业而言，PRINCE 提供了一个重要的参考范例：

工业级 Agentic AI 的落地路径： 证明了 Agentic AI 不仅仅是概念验证，而是可以解决真实世界复杂业务问题的生产就绪型系统。
非结构化数据的价值释放： 展示了如何利用现代 AI 技术激活企业长期积累的、沉睡的非结构化数据资产。
工程化思维的重要性： 强调了在 AI 应用中，软件工程原则（如编排、监控、错误处理）与模型能力同等重要，甚至是决定系统能否在生产环境稳定运行的关键。

拜耳的这一实践表明，通过合理的架构设计和工程决策，Agentic AI 可以成为研究人员强大的合作伙伴，推动药物发现流程向更高效、更数据驱动的方向发展。

查看原文 →martinfowler.com