Agent SkillLINUX DO · AI·1 小时前

Kimi Code升级支持视频拖拽及多模态插件

原标题：Kimi code最新更新，可直接拖拽视频！

速览

Kimi Code近期升级，新增视频拖拽及长视频处理等多模态能力，区别于传统代码工具。同时接入股票、财报等插件，支持ACP及自定义Hooks，正从单一编码向多模态工作流Agent转型。

AI 深度解读

背景

近期，AI 编程助手领域的竞争格局正在发生微妙变化。以 Codex 和 Claude Code 为代表的工具，长期以来确立了“专注写代码的 AI 工程师”这一范式，其核心能力集中在读取代码仓库、修改代码、执行命令以及修复 Bug 等传统软件工程场景。然而，Kimi Code 的最新更新展示了一条截然不同的演进路径。这一更新不仅引入了视频作为上下文的能力，还扩展了插件生态，显示出 Kimi Code 正试图突破单一代码生成的局限，向更通用的多模态工作流 Agent 方向探索。

核心内容

Kimi Code 的最新升级揭示了其与 Codex、Claude Code 等主流竞品在产品设计理念上的显著差异。

首先，在上下文处理能力上，Kimi Code 突破了仅依赖文本代码的限制，引入了视频作为上下文输入的能力。具体应用场景包括将屏幕录制转换为代码、处理长视频内容，以及参考视频生成 LUT（查找表，常用于视频调色）。这种多模态能力的引入，是传统 Coding Agent 较少具备的特性，极大地扩展了 AI 辅助创作的边界。

其次，在生态扩展性方面，Kimi Code 不再局限于代码仓库内部。它新增了针对股票、财报、学术论文等非代码类资料的插件支持。这一举措表明，Kimi Code 的定位正在从单纯的“代码助手”转变为“能接各种资料和工具的工作流 Agent”，旨在处理更广泛的信息处理任务。

最后，在架构与兼容性上，Kimi Code 展现了更强的可扩展性。它支持 ACP（Agent Communication Protocol，智能体通信协议）、JetBrains 开发环境以及 Zed 编辑器，并提供了 Hooks 机制。这使得开发者可以灵活接入自定义的工具和工作流程，进一步增强了其在复杂工作流中的适应能力。

关键要点

差异化定位：与 Codex 和 Claude Code 聚焦于传统软件工程（读 Repo、改代码、修 Bug）不同，Kimi Code 正走向“多模态 + 插件 + 自定义工作流”的方向。
视频上下文支持：支持将视频作为上下文输入，具体功能涵盖屏幕录制转代码、长视频处理以及基于视频参考生成 LUT。
非代码资料插件：引入了股票、财报、论文等垂直领域的插件，使其能够处理结构化与非结构化的专业资料。
广泛的兼容性：支持 ACP 协议、JetBrains 系列 IDE 以及 Zed 编辑器，并提供 Hooks 接口，便于集成第三方工具和自定义流程。
Agent 化趋势：整体架构更像是一个能够连接多种资料源和工具的工作流 Agent，而非单一的代码生成器。

意义与影响

Kimi Code 的这一更新标志着 AI 编程工具正在从“单一任务执行者”向“通用工作流中枢”演进。

打破模态壁垒：通过支持视频上下文，Kimi Code 证明了 AI 在处理非文本、非代码的多模态数据时具有巨大潜力。这对于视频制作、UI/UX 设计以及动态内容生成等领域具有直接的应用价值。
拓展 AI 的应用边界：引入股票、财报和论文插件，意味着 AI 助手可以深入垂直行业，提供更具专业深度的信息整合与分析服务，而不仅仅局限于技术栈内部。
推动开放生态建设：对 ACP、JetBrains、Zed 以及 Hooks 的支持，表明 Kimi Code 致力于构建一个开放的、可插拔的生态系统。这种开放性有助于吸引开发者社区，促进第三方工具和插件的繁荣，从而形成更强大的网络效应。

总体而言，Kimi Code 的这次升级不仅是对自身能力的补充，更是对 AI 编程助手未来形态的一种探索：即从“写代码的工具”进化为“连接数据、工具与多模态内容的智能工作流引擎”。

查看原文 →linux.do

Kimi Code升级支持视频拖拽及多模态插件

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐