AI 智讯台 · 2026-06-16 日报
OrcaRouter多模型组队性能反超,Salesforce斥资36亿收购Fin。Anthropic被关停凸显非美AI必要性,巴西开源模型疑套壳千问。具身智能迈向2.0,地球卫星首自主发现目标。
OrcaRouter多模型组队性能反超,Salesforce斥资36亿收购Fin。Anthropic被关停凸显非美AI必要性,巴西开源模型疑套壳千问。具身智能迈向2.0,地球卫星首自主发现目标。
AI 智讯台 · 2026-06-16 日报
🔥 AI 资讯
- 低成本复刻Fable 5:OrcaRouter多模型组队性能反超 — OrcaRouter通过多模型组队策略,以低成本实现Fable 5的高性能复刻。(量子位)
- Salesforce斥资36亿美元收购AI客服平台Fin — Salesforce以36亿美元收购AI客服平台Fin,旨在利用其团队和技术增强Agentforce平台。(TechCrunch AI)
- 巴西官方开源模型被指套壳阿里千问 — 巴西官方开源模型Rio-3.5被指套壳阿里千问,IplanRIO已致歉称系操作失误。(雷峰网)
- 特朗普政府强制关停Anthropic模型凸显非美AI发展必要性 — 特朗普政府要求Anthropic封锁外国用户访问其最新AI模型,引发对非美AI发展的讨论。(The Verge AI)
- 网件反诉TP-Link虚假宣传;百度调整AI权重;鸿蒙彻底告别安卓 — 网件反诉TP-Link虚假宣传;百度疑似调整AI结果权重;鸿蒙彻底告别安卓;携程被罚千万。(雷峰网)
- 速腾聚创杨先声:机器人通用智能需先解决高精度深度感知 — 速腾聚创发布新视觉架构,实现深度与RGB物理对齐,旨在打破机器人感知瓶颈。(雷峰网)
- 浙大等提出SelectiveRM:基于最优传输训练奖励模型以过滤噪声偏好 — 浙大等提出SelectiveRM,利用最优传输自动过滤噪声偏好,提升奖励模型可靠性与RLHF安全性。(雷峰网)
- 腾讯发布效率智能体工具集,加速AI场景落地 — 腾讯发布效率智能体工具集及WAND品牌,加速AI在办公、影视等场景落地。(雷峰网)
- 地球观测卫星首次自主发现目标 — 地球观测卫星首次实现完全自主发现目标,标志着太空智能的重大突破。(TechCrunch AI)
- 它石智航丁文超:具身智能迈向2.0时代的关键在于全栈能力 — 它石智航首席科学家丁文超解读具身智能2.0时代特征,强调工程化能力与原生基座模型的重要性。(雷峰网)
🧪 技术博客 / 论文
- 部署语境重塑大模型偏好与价值观 — 研究揭示大模型偏好高度依赖部署语境,非固定属性。(arXiv cs.CL)
- RefGRPO:通过免费校准奖励弥补智能体反思差距 — 提出RefGRPO算法,利用环境反馈校准LLM智能体反思,显著提升准确性与自我验证能力。(arXiv cs.AI)
- 从聊天机器人到数字同事:持久自主AI的范式转移 — LLM正从对话生成器转型为具备推理、行动、记忆能力的持久自主AI数字同事。(arXiv cs.AI)
- 大模型道德判断存在方向性盲从 — 研究发现大模型在道德判断中缺乏方向选择性,对有益和有害引导均同等顺从。(arXiv cs.CL)
- PauseRec:基于隐式推理的大语言模型生成式推荐新范式 — 提出PauseRec隐式推理范式,解决SID干扰问题,性能超显式CoT,训练成本降65%。(arXiv cs.CL)
- Retrospective Progress-Aware Self-Refinement for LLM Agent Training — 提出RePro框架,通过回顾性进度感知训练提升LLM智能体长程任务表现。(arXiv cs.CL)
- 大模型智能体主动沟通策略演化框架 — 提出CPE框架,通过提示词演化优化大模型智能体跨模态沟通策略,提升任务成功率。(arXiv cs.AI)
- Orchestra-o1:支持多模态统一协调的智能体编排框架 — 提出Orchestra-o1多模态智能体编排框架,实现跨模态任务分解与协作,性能显著领先。(arXiv cs.AI)
🧩 Agent Skill
- 分享skill-codex-parallel-collab实现多Codex并行协作 — 分享skill-codex-parallel-collab技能,通过主Codex分层任务并下发至子Agent,实现多Codex并行高效施工。(LINUX DO · AI)
- Matt Pocock发布grill-with-docs Skill,解决grill-me上下文丢失问题 — Matt Pocock推出grill-with-docs,通过同步生成文档解决grill-me上下文丢失痛点,适配不同开发场景。(LINUX DO · AI)
- 2026秋叶ComfyUI-v9.5保姆级教程:SD模型插件及提示词全解析 — 发布2026版秋叶ComfyUI v9.5教程,含SD模型、插件及万条提示词,附夸克网盘资源获取方式。(LINUX DO · AI)
- Flutter开发者分享Claude Code等AI工具实战工作流与规范 — Flutter开发者探讨Claude Code、Codex等AI工具在需求分析、代码重构及大项目维护中的分工与最佳实践。(LINUX DO · AI)
- Claude Opus 4.8幻觉严重虚构攻击并自我Prompt注入 — Claude Opus 4.8出现严重幻觉,虚构恶意Prompt注入及工具调用,引发用户警惕。(LINUX DO · Claude)
- 清华博士开源COMPASS司南:构建AI Agent个性化任务对齐系统 — 清华博士开源COMPASS司南技能生态,通过用户画像、任务图谱和需求对齐,解决AI长任务中的目标漂移与上下文缺失问题。(LINUX DO · AI)
🎁 白嫖token
- 智谱AI发放5张GLM Coding Plan 7日体验卡 — 智谱AI开放平台赠送5张GLM Coding Plan 7日体验卡,助力开发者高效完成开发工作。(LINUX DO · 福利羊毛)
- AgentScope Platform公测可免费一键部署QwenPaw — AgentScope Platform公测期间提供QwenPaw免费一键部署及内置免费模型体验。(LINUX DO · 福利羊毛)
- 百倍佬开放大模型签到功能,公益站提供免费体验额度 — 百倍佬开放签到功能,感谢其大方提供额度及维护公益站的贡献,让用户可免费学习体验大模型。(LINUX DO · 福利羊毛)
- Charm Hyper上线DeepSeek V4、GLM-5等十余款大模型免费额度 — Charm Hyper平台提供每月免费额度,支持DeepSeek V4、GLM-5、Llama 4等主流大模型。(LINUX DO · 福利羊毛)
- 分享零成本刷新Codex额度方法 — 分享通过注册新账号并登录Codex网页端Cloud功能,即可免费获取刷新额度的方法。(LINUX DO · 福利羊毛)
- 小米mimo提供免费API额度,29号到期 — 小米mimo提供免费API体验卡,兼容OpenAI及Anthropic协议,额度将于29日到期。(LINUX DO · 福利羊毛)
⭐ GitHub 热榜
- System Prompts Leaks:主流AI模型系统提示词泄露汇总 — 收集并公开Anthropic、OpenAI、Google等主流大模型及AI工具的内部系统提示词。(GitHub Trending · 周)
- trycua/cua:面向计算机使用代理的开源基础设施 — 为能够控制完整桌面(macOS、Linux、Windows)的AI代理提供沙箱、SDK和基准测试工具。(GitHub Trending · 日)
- Self-Hosting-Guide:个人与企业私有化部署全栈指南 — 提供从基础设施到应用层的全方位本地托管与私有服务器管理方案。(GitHub Trending · 日)
- Graphify:AI 编程助手技能,将代码库转化为可查询的知识图谱 — 将任意代码文件夹、SQL 模式、文档或媒体文件转化为可查询的知识图谱,赋能 AI 编程助手。(GitHub Trending · 周)
- TeslaMate:自托管特斯拉数据记录器 — 解决特斯拉车主无法本地持久化存储和深度分析车辆遥测数据的问题。(GitHub Trending · 日)
- Win11Debloat:轻量级 PowerShell 脚本,一键清理 Windows 10/11 预装应用与遥测数据 — 解决 Windows 系统预装软件冗余、后台遥测数据收集及系统臃肿问题,帮助用户快速实现系统精简与隐私保护。(GitHub Trending · 日)
- optimizerDuck:面向性能、隐私与简洁性的免费开源 Windows 优化工具 — 解决 Windows 系统性能瓶颈、隐私泄露及预装冗余问题,提供一键式优化方案。(GitHub Trending · 日)
- Hello 算法:动画图解与一键运行的数据结构与算法教程 — 提供多语言代码实现及可视化图解,帮助开发者高效掌握数据结构与算法。(GitHub Trending · 日)
