← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

Kimi Code升级支持视频拖拽及多模态插件

原标题:Kimi code最新更新,可直接拖拽视频!

速览

Kimi Code近期升级,新增视频拖拽及长视频处理等多模态能力,区别于传统代码工具。同时接入股票、财报等插件,支持ACP及自定义Hooks,正从单一编码向多模态工作流Agent转型。

AI 深度解读

背景

近期,AI 编程助手领域的竞争格局正在发生微妙变化。以 Codex 和 Claude Code 为代表的工具,长期以来确立了“专注写代码的 AI 工程师”这一范式,其核心能力集中在读取代码仓库、修改代码、执行命令以及修复 Bug 等传统软件工程场景。然而,Kimi Code 的最新更新展示了一条截然不同的演进路径。这一更新不仅引入了视频作为上下文的能力,还扩展了插件生态,显示出 Kimi Code 正试图突破单一代码生成的局限,向更通用的多模态工作流 Agent 方向探索。

核心内容

Kimi Code 的最新升级揭示了其与 Codex、Claude Code 等主流竞品在产品设计理念上的显著差异。

首先,在上下文处理能力上,Kimi Code 突破了仅依赖文本代码的限制,引入了视频作为上下文输入的能力。具体应用场景包括将屏幕录制转换为代码、处理长视频内容,以及参考视频生成 LUT(查找表,常用于视频调色)。这种多模态能力的引入,是传统 Coding Agent 较少具备的特性,极大地扩展了 AI 辅助创作的边界。

其次,在生态扩展性方面,Kimi Code 不再局限于代码仓库内部。它新增了针对股票、财报、学术论文等非代码类资料的插件支持。这一举措表明,Kimi Code 的定位正在从单纯的“代码助手”转变为“能接各种资料和工具的工作流 Agent”,旨在处理更广泛的信息处理任务。

最后,在架构与兼容性上,Kimi Code 展现了更强的可扩展性。它支持 ACP(Agent Communication Protocol,智能体通信协议)、JetBrains 开发环境以及 Zed 编辑器,并提供了 Hooks 机制。这使得开发者可以灵活接入自定义的工具和工作流程,进一步增强了其在复杂工作流中的适应能力。

关键要点

  • 差异化定位:与 Codex 和 Claude Code 聚焦于传统软件工程(读 Repo、改代码、修 Bug)不同,Kimi Code 正走向“多模态 + 插件 + 自定义工作流”的方向。
  • 视频上下文支持:支持将视频作为上下文输入,具体功能涵盖屏幕录制转代码、长视频处理以及基于视频参考生成 LUT。
  • 非代码资料插件:引入了股票、财报、论文等垂直领域的插件,使其能够处理结构化与非结构化的专业资料。
  • 广泛的兼容性:支持 ACP 协议、JetBrains 系列 IDE 以及 Zed 编辑器,并提供 Hooks 接口,便于集成第三方工具和自定义流程。
  • Agent 化趋势:整体架构更像是一个能够连接多种资料源和工具的工作流 Agent,而非单一的代码生成器。

意义与影响

Kimi Code 的这一更新标志着 AI 编程工具正在从“单一任务执行者”向“通用工作流中枢”演进。

  1. 打破模态壁垒:通过支持视频上下文,Kimi Code 证明了 AI 在处理非文本、非代码的多模态数据时具有巨大潜力。这对于视频制作、UI/UX 设计以及动态内容生成等领域具有直接的应用价值。
  2. 拓展 AI 的应用边界:引入股票、财报和论文插件,意味着 AI 助手可以深入垂直行业,提供更具专业深度的信息整合与分析服务,而不仅仅局限于技术栈内部。
  3. 推动开放生态建设:对 ACP、JetBrains、Zed 以及 Hooks 的支持,表明 Kimi Code 致力于构建一个开放的、可插拔的生态系统。这种开放性有助于吸引开发者社区,促进第三方工具和插件的繁荣,从而形成更强大的网络效应。

总体而言,Kimi Code 的这次升级不仅是对自身能力的补充,更是对 AI 编程助手未来形态的一种探索:即从“写代码的工具”进化为“连接数据、工具与多模态内容的智能工作流引擎”。

查看原文 →linux.do