开源项目:基于New-API改造的AI Token审计与日报系统
原标题:【开源推广】监控你的牛马是否正经在搬砖
速览
该开源项目旨在解决企业内部AI中转站的Token审计需求。通过修改New-API增加采集Hook,将请求信息和Token用量异步上报至独立的审计服务。系统支持按用户统计消耗、识别工作场景,并生成移动端友好的HTML日报通过企业微信推送,便于管理者追溯非工作用途。
AI 深度解读
背景
在 Vibe Coding(氛围编码/提示词驱动开发)日益普及的当下,许多小型工作室或团队开始依赖大模型 API 进行日常开发工作。然而,这种高效模式也带来了管理痛点:高昂的 API 订阅费用若缺乏有效监管,极易被员工用于非工作用途(如个人娱乐、游戏辅助等)。
作者作为小型工作室负责人,为了在享受 AI 提效的同时防止资源滥用,基于社区开源项目 QuantumNous/new-api 进行了定制化改造。该项目旨在解决企业内部 Token 审计的难题,通过低成本、低侵入的方式,实现对员工 API 使用情况的精细化监控与审计,确保每一分订阅成本都花在“搬砖”上。
核心内容
该项目由两个核心部分组成:一个经过轻量改造的 API 网关 Fork 版本,以及一个独立的 Token 审计服务。
1. New-API 审计专用 Fork
该项目基于 QuantumNous/new-api 构建,并非重新实现网关,而是通过增加三个微小的 Hook(钩子函数)来增强审计能力。这种设计确保了上游 new-api 的核心业务逻辑不变,且便于跟随上游进行版本更新,降低了维护成本。
主要功能包括:
- 异步数据上报:将 New-API 中已解析的请求信息和结算后的 Token 用量,异步上报给独立的
token-audit服务。 - 低侵入性:改动极小,旨在支持企业内部对 Token 消耗的精细化统计。
2. 独立审计服务 (token-audit)
token-audit 是一个独立运行的服务,负责接收来自网关的上报数据,并进行本地存储、分类分析和报表生成。
- 数据聚合与存储:通过
request_id合并 Prompt、用户、Token 用量、模型、Quota 等信息,并持久化存储至本地 SQLite 数据库。采用 30 天数据保留策略,适合 VPS 部署的小型团队。 - 智能分类与识别:自动识别请求类型,涵盖编码实现、调试修复、架构设计、配置运维、文档编写、代码审查、数据分析等工作场景,同时标记“疑似非工作”或“其他”类别。
- 可追溯性:对于疑似非工作或无法判断的请求,系统保留完整的用户、Token、模型、时间、用量及 Prompt 预览,便于人工复核。
- 轻量管理端:提供 Web 界面,支持启用/停用审计用户、维护日报显示名、查看请求历史及完整 Prompt 内容。
- 自动化通知:在每日用量稳定后,生成移动端友好的 HTML 格式审计日报,并通过企业微信 Textcard 推送摘要及详情链接,实现“企业微信日报”的自动化流转。
关键要点
- 架构解耦:将审计逻辑从网关核心中剥离,通过异步 Hook 上报,既保证了网关的稳定性,又实现了审计功能的独立迭代。
- 低成本部署:后端使用 SQLite 数据库,无需依赖复杂的数据库集群,非常适合运行在低成本 VPS 上的小型团队中转站。
- AI 辅助开发:项目全程由 Codex 开发,作者仅提供思路,证明了对于此类中小型工具,将 README 交给 AI 即可高效完成开发。
- 闭环管理:从“请求拦截/上报”到“分类识别”,再到“日报推送”和“人工复核”,形成了完整的管理闭环。
- 合规与开源:项目完全开源,无未开源部分,并遵循 LINUX DO 社区的开源推广规范,接受社区监督。
意义与影响
- 填补小型团队管理空白:目前市面上大多数的 API 网关侧重于流量控制、鉴权和计费,缺乏针对“员工使用行为”的语义级审计功能。该项目为小型工作室提供了一种轻量级的解决方案,解决了“人效”与“成本”之间的信任难题。
- 降低 AI 工具落地门槛:通过证明“AI 生成代码”在特定场景下的可行性,降低了开发者构建此类工具的技术门槛,鼓励更多开发者利用 AI 辅助构建内部运维工具。
- 推动 Vibe Coding 的规范化:随着 AI 编程的普及,如何量化和评估 AI 带来的实际工作产出成为新课题。该项目的审计分类逻辑(如区分“调试”与“闲聊”)为后续更智能的 AI 工作流评估提供了数据基础。
- 社区协作典范:项目基于成熟的
new-api进行 Fork 开发,而非重复造轮子,体现了开源社区“站在巨人肩膀上”的高效协作精神。
查看原文 →linux.do
