GitHub 热榜GitHub Trending · 周·7 天前

AutoResearchClaw：从想法到论文的全自动自我进化研究助手

原标题：aiming-lab/AutoResearchClaw

Python★ 12,838 stars+432 本周

速览

该项目是一个完全自主且能自我进化的研究系统，用户只需输入一个想法，它即可自动完成文献调研、实验设计、代码实现及论文撰写。适用于希望借助AI加速科研产出、实现“聊天即论文”的高效研究场景。

AI 深度解读

AutoResearchClaw：从一句话到会议级论文的自主科研代理

这是什么

AutoResearchClaw 是一个基于 Python 构建的开源自主研究代理系统，由 aiming-lab 开发。它旨在通过自然语言交互，将单一的研究想法转化为包含文献综述、实验设计、代码实现、统计分析以及最终 LaTeX 排版的完整学术论文。

该项目是 OpenClaw 生态的一部分，支持通过简单的聊天指令（如 "Research X"）触发全流程。其核心架构是一个包含 23 个阶段的端到端研究管道（Pipeline），能够自动处理从假设生成到同行评审模拟的各个环节。目前该项目在 GitHub 上已获得 12,838+ Star，并发布了相关学术论文至 arXiv。

解决的问题

传统科研流程中，研究者往往受限于时间精力，难以快速验证新想法或完成从构思到成文的完整闭环。AutoResearchClaw 主要解决以下痛点：

研究复现与验证成本高：手动搭建实验环境、编写代码、调试模型以及处理数据往往占据大量时间。
文献检索与引用管理繁琐：确保参考文献的真实性（避免 AI 幻觉导致的虚假引用）并整理格式是一项枯燥且易出错的工作。
跨学科实验门槛高：不同领域（如高能物理、生物信息学、统计学）需要特定的工具链和仿真环境，普通研究者难以快速集成。
人机协作断层：现有的 AI 写作工具通常只关注文本生成，缺乏对实验逻辑、数据验证和学术规范（如 NeurIPS/ICML 检查清单）的深度整合。

核心功能

AutoResearchClaw 提供了一套模块化的自主研究流程，主要功能包括：

23 阶段自主研究管道：涵盖从想法工作坊（Idea Workshop）、基线导航（Baseline Navigator）、实验执行到论文撰写的全过程。
多领域专家代理集成：
- 高能物理：通过 ColliderAgent 实现从拉格朗日量到 FeynRules、MadGraph5 和 Delphes 的完整模拟链。
- 生物学：集成 COBRApy 进行基因组规模代谢建模。
- 统计学：支持模拟研究代理。
- 通用领域：通过 Docker 执行器覆盖化学、材料科学等。
人机协作（HITL）系统：提供 6 种干预模式（全自动、仅门控、检查点、逐步、副驾驶、自定义）。支持“智能暂停”，即在 AI 置信度低时主动请求人类介入，或允许人类在关键决策点（如研究方向、实验设计）进行指导。
反幻觉与真实性保障：
- 集成 OpenAlex、Semantic Scholar 和 arXiv 获取真实文献。
- 内置 VerifiedRegistry 和实验诊断修复循环，自动检测并剔除虚假引用。
- 执行 4 轮论文质量审计，包括 AI 垃圾内容检测、7 维度评分及 NeurIPS 检查清单合规性审查。
自适应实验环境：自动检测硬件资源（GPU/MPS/CPU），在 Docker 沙箱中运行实验，支持失败自愈合和假设失败时的自动转向（Pivot）。
技能加载系统：支持加载开源或自定义技能（Skills），涵盖科学写作、实验设计等，社区贡献的技能（如 A-Evolve 进化代理）可直接安装使用。

亮点 / 与同类相比

真正的端到端自主性：不同于仅生成代码或仅生成文本的工具，AutoResearchClaw 能独立完成从代码编写、环境配置、实验运行到论文排版的全流程，并输出可编译的 LaTeX 文件和 BibTeX。
跨平台与多后端兼容：不局限于单一 LLM 提供商。支持 Claude Code、Codex CLI、Copilot CLI、Gemini CLI、Kimi CLI 等 ACP 兼容后端，并通过 OpenClaw 桥接 Discord、Telegram、微信等即时通讯平台。
ARC-Bench 基准测试：发布了包含 55 个主题（涵盖 ML、HEP、量子计算、生物、统计）的开放自主研究基准测试，每个主题均附带研究问题、条件、指标和评分标准，为评估自主研究能力提供了标准化参考。
MetaClaw 跨运行学习：支持从过往管道失败中提取结构化教训，转化为可复用的技能注入后续研究，显著提升鲁棒性（受控实验中提升 18.3%）。
成本与预算控制：内置成本预算护栏，支持 CLI 代理代码生成的预算控制和超时管理，避免无限循环调用导致的费用失控。

适合谁用 / 上手

适合人群：

研究人员与博士生：希望快速验证想法、生成初步论文草稿或自动化重复性实验流程。
跨学科研究者：需要集成特定领域工具链（如高能物理模拟、生物代谢建模）但缺乏相应编程背景的用户。
AI 应用开发者：希望基于自主代理框架构建垂直领域科研助手的技术人员。

上手指南：

环境准备：确保已安装 Python 3.8+ 和 Docker。

安装与配置：

git clone https://github.com/aiming-lab/AutoResearchClaw.git
cd AutoResearchClaw
python3 -m venv .venv && source .venv/bin/activate
pip install -e .

# 交互式设置（检查 Docker/LaTeX/OpenCode 等依赖）
researchclaw setup

# 初始化配置（选择 LLM 提供商，创建 config.arc.yaml）
researchclaw init

运行研究：设置 API Key 后，可直接运行：

export OPENAI_API_KEY="sk-..."
researchclaw run --config config.arc.yaml --topic "Your research idea" --auto-approve

或者使用协作模式：

researchclaw run --topic "Your research idea" --mode co-pilot

OpenClaw 集成（极简模式）：如果已使用 OpenClaw，只需分享 GitHub 仓库 URL，在聊天中输入 "Research [你的主题]"，OpenClaw 将自动完成克隆、安装、配置和运行，直接返回研究成果。

输出结果：项目将在 artifacts/rc-YYYYMMDD-HHMMSS-<hash>/deliverables/ 目录下生成编译就绪的 LaTeX 源文件、BibTeX 文件、实验代码及图表。

查看原文 →github.com