开源项目baibaiAIGC:支持多模式降AI率并适配docx
速览
该项目baibaiAIGC将社区开源的降AI率提示词封装为工作流,旨在降低文本在AIGC检测平台中的AI率。项目支持对话Skill、脚本API、Web端及App四种使用方式,并内置docx流水线以保留文档格式。作者表示项目仍在优化中,对长文友好且支持多轮检测,欢迎社区反馈。
AI 深度解读
背景
在学术写作、技术文档生成及各类内容创作中,随着大型语言模型(LLM)的普及,文本中“AI 味”或 AI 生成痕迹的检测已成为一个普遍痛点。许多用户(特别是撰写毕业论文的学生)面临 AIGC 检测率过高的问题,导致论文无法通过知网、维普等平台的审核。
尽管社区内存在多种“降 AI 率”的提示词(Prompt),但直接将整篇长文发送给大模型进行改写,往往效果不佳,容易出现前后风格割裂、逻辑混乱或生成无关内容等问题。在此背景下,LINUX DO 社区用户 poleHansen 开源了 baibaiAIGC 项目,旨在通过封装和优化现有提示词,结合分段处理、多模式调用及文档结构保留等技术手段,提供一套更稳定、更人性化的文本去 AI 化工作流。
核心内容
baibaiAIGC 是一个开源项目,其核心目标是通过自动化或半自动化的流程,降低文本在主流 AIGC 检测平台上的识别率。该项目并非简单的提示词堆砌,而是整合了社区内多个经过验证的降 AI 率提示源,并针对长文本处理、文档格式保留及不同调用场景进行了工程化封装。
1. 提示词来源与优化 项目整合了多个社区开源的降 AI 率提示词,包括:
- LINUX DO 社区用户分享的论文降 AI 提示词。
op7418/Humanizer-zh:Claude Code Skills 的汉化版本,旨在消除 AI 生成痕迹。
在迭代过程中,作者发现原有的多轮提示词策略存在缺陷:第二轮提示词容易误导模型生成与原文无关的内容,导致 AI 率不降反增。经过测试,作者决定移除第二份提示词,改为“单轮高效处理”策略。即默认只跑一轮,若效果不满意再手动进行第二轮处理,从而保证了文本的相关性和流畅度。
2. 四种使用模式
为了适应不同用户的技术背景和需求,baibaiAIGC 提供了四种主要使用方式:
- 对话 Skill 模式:适合大多数普通用户。无需配置 API 参数,系统可根据历史记录自动判断执行哪一轮操作。适合“边改边看、人工审稿”的场景,交互性强。
- 脚本 API 模式:适合具备 OpenAI 兼容接口、需要批量处理的用户。支持命令行执行,具备自动切块、逐块调用模型、自动回填结果及更新记录的功能。
- Web 端模式:提供图形化界面,操作直观方便,支持断点续跑(目前仅 Web 端支持,App 端尚未支持)。
- App 模式:提供移动端或桌面端应用,安装即可使用,进一步降低了使用门槛。
3. 长文本与 Docx 支持
针对长文本容易出现的风格不一致问题,项目采用了自动切块处理机制。此外,考虑到许多用户处理的是 .docx 格式的论文,项目单独提供了 docx_pipeline.py 脚本。该脚本能够:
- 从
.docx文件中提取纯文本。 - 提取段落结构信息。
- 将改写后的文本重新写回
.docx文件,保留原有的文档结构。
这一功能使得项目不仅适用于纯文本处理,也能无缝接入实际的论文修改工作流。
4. 效果与局限性
- 检测平台表现:经过测试,在知网(CNKI)上效果较好,在维普(VIP)上效果一般。工科类论文的处理效果优于文科类。
- 英文处理:对英文摘要的处理效果尚可,但整篇文章的英文去 AI 化效果一般,因此项目目前主要聚焦于中文场景,并去除了部分英文适配功能。
- API 兼容性:目前仅支持 OpenAI 格式的 API 请求。作者提到,由于不同公益 API 站的请求体或路径可能不同,导致部分 API 无法直接调用,目前仍需逐个适配或寻找兼容方案。
关键要点
- 开源承诺:项目完全开源,无未开源部分,并已获得 LINUX DO 社区认可。作者承诺帖子内容真实,接受社区监督。
- 核心策略调整:修复了多轮提示词导致生成无关内容的问题,改为更稳定的单轮处理机制,必要时进行第二轮人工干预。
- 多模态支持:支持 Skill、API 脚本、Web 界面和 App 四种方式,覆盖了从非技术人员到开发者的不同需求。
- 文档结构保留:通过
docx_pipeline.py实现了.docx文件的提取、改写和回写,解决了长论文修改中格式丢失的痛点。 - 效果预期管理:
- 不保证绝对有效,AI 率接近 0 并非承诺,而是部分平台(如知网)的实测结果。
- 工科论文效果优于文科,中文效果优于英文。
- Web 端支持断点续跑,App 端功能相对基础。
- 技术限制:目前仅兼容 OpenAI 格式 API,不同公益 API 站的适配仍需手动解决。
意义与影响
baibaiAIGC 的出现反映了当前 AI 工具普及后,用户对“AI 生成内容”进行“去标识化”处理的强烈需求。它不仅仅是一个工具,更是一个社区协作的产物,整合了 LINUX DO 社区内多位用户的智慧(如提示词来源、Bug 反馈等)。
其意义在于:
- 降低了技术门槛:通过封装复杂的 API 调用和提示词工程,让非技术人员也能通过 Web 或 App 使用去 AI 化服务。
- 提供了工程化解决方案:针对长文本和
.docx格式的支持,解决了实际工作流中的关键痛点,比单纯的提示词分享更具实用价值。 - 促进了社区互动:项目通过持续迭代(如修复第二轮提示词误导问题、增加 Web/App 支持)展示了开源项目的生命力,鼓励用户通过 Issue 和 PR 参与贡献。
然而,该项目也揭示了当前 AIGC 检测与反检测之间的“猫鼠游戏”本质。随着检测算法的升级,去 AI 化技巧也需要不断迭代。用户应理性看待其效果,将其视为辅助工具而非万能钥匙,并遵守学术诚信和相关平台的使用规范。
