技术博客Hugging Face Blog·2026/4/29

DeepInfra 加入 Hugging Face 推理提供商

原标题：DeepInfra on Hugging Face Inference Providers 🔥

速览

DeepInfra 正式加入 Hugging Face Inference Providers 列表。用户现在可以直接通过 Hugging Face 平台调用 DeepInfra 的推理服务。此举为用户提供了更多高性能、低延迟的模型托管选择，简化了部署流程。

AI 深度解读

DeepInfra 正式接入 Hugging Face Inference Providers：无缝集成与成本优化

背景

随着生成式 AI 应用的爆发式增长，开发者对模型推理（Inference）的需求呈现出多样化、高频化和低延迟的特点。Hugging Face 作为开源 AI 社区的枢纽，一直致力于降低模型使用的门槛。此前，Hugging Face 推出了 Inference Providers（推理提供商）功能，旨在将第三方推理服务无缝集成到其生态系统中，让用户可以直接在模型页面或代码中调用不同提供商的服务器端推理服务。

在这一生态不断扩大的背景下，DeepInfra 宣布正式成为 Hugging Face Hub 支持的 Inference Provider。DeepInfra 是一个以高性价比著称的无服务器 AI 推理平台，此次合作标志着 Hugging Face 在丰富模型访问渠道、优化开发者体验以及降低 AI 应用部署成本方面迈出了重要一步。

核心内容

DeepInfra 的加入进一步丰富了 Hugging Face 的推理生态。以下是此次整合的核心细节与功能解析：

1. DeepInfra 平台概况

DeepInfra 提供行业极具竞争力的按 Token 计费模式，拥有超过 100 个模型的目录。其核心优势在于极简的集成流程，支持从大语言模型（LLM）到文本生成图像、文本生成视频、嵌入模型（Embeddings）等多种任务类型。此次初始整合重点支持对话式（Conversational）和文本生成（Text-generation）任务。

2. 支持的模型与任务

作为首批支持的任务，DeepInfra 在 Hugging Face 上开放了多个热门开源权重 LLM 的访问权限，包括：

DeepSeek V4
Kimi-K2.6
GLM-5.1
以及其他众多模型

未来，DeepInfra 还将陆续推出对文本生成图像、视频生成及嵌入任务的支持。

3. 集成方式与工作流程

网站 UI 交互

在 Hugging Face 网站的用户账户设置中，开发者可以管理第三方提供商的集成：

API Key 管理：开发者可以设置自己注册的提供商 API Key。若未设置自定义 Key，请求将通过 Hugging Face 路由。
优先级排序：开发者可以自定义提供商的偏好顺序，这将直接影响模型页面小部件和代码片段中的默认选择。
两种调用模式：
1. 自定义 Key 模式：请求直接发送至推理提供商，使用开发者自己的 API Key 进行认证和计费。
2. HF 路由模式：无需提供商 Token，请求通过 Hugging Face 路由，费用直接计入 Hugging Face 账户。

客户端 SDK 集成

DeepInfra 已无缝集成至 Hugging Face 的官方 SDK 中：

Python：huggingface_hub (版本 >= 1.11.2)
JavaScript：@huggingface/inference

开发者可以使用标准的 OpenAI 兼容接口调用 DeepInfra 上的模型。例如，通过设置 base_url 为 https://router.huggingface.co/v1 并使用 Hugging Face Token 进行认证，即可自动将请求路由至 DeepInfra 托管的模型（如 deepseek-ai/DeepSeek-V4-Pro:deepinfra）。

Agent Harness 集成

Hugging Face Inference Providers 已集成到大多数主流 Agent 框架中，包括 Pi、OpenCode、Hermes Agents、OpenClaw 等。这意味着开发者无需编写额外的胶水代码（Glue Code），即可将 DeepInfra 托管的模型直接接入这些工具。

4. 计费与账单机制

直接请求（Direct Requests）：当开发者使用提供商的 API Key 时，费用由对应的提供商（如 DeepInfra）直接收取，账单出现在提供商账户中。
路由请求（Routed Requests）：当通过 Hugging Face Hub 认证时，开发者仅支付标准的提供商 API 费率。Hugging Face 不收取任何额外加价，仅作为通道直接转嫁提供商成本。未来可能会与提供商合作伙伴建立收入分成协议。
PRO 用户福利：订阅 Hugging Face PRO 计划的用户每月可获得 $2 的推理额度（Inference credits），该额度可在不同提供商之间通用。此外，PRO 用户还享有 ZeroGPU、Spaces Dev Mode 以及 20 倍的请求限制提升。
免费用户：登录的免费用户享有少量免费推理配额，但官方建议有需求的用户升级至 PRO 以获得更好的体验。

关键要点

生态扩展：DeepInfra 成为 Hugging Face Hub 最新的 Inference Provider，进一步增强了服务器端推理的多样性。
高性价比：DeepInfra 以行业领先的低 Token 成本著称，为开发者提供了极具吸引力的经济选择。
模型丰富度：初始支持 DeepSeek V4、Kimi-K2.6、GLM-5.1 等热门开源 LLM，未来将扩展至图像和视频生成任务。
无缝集成：
- 支持 Python (huggingface_hub) 和 JavaScript (@huggingface/inference) SDK。
- 兼容 OpenAI 标准接口，简化代码迁移。
- 深度集成 Pi、OpenCode 等主流 Agent 框架，无需额外开发。
灵活的计费模式：
- 支持“自定义 Key”直接计费模式。
- 支持“HF 路由”模式，Hugging Face 零加价，仅代收代付。
- PRO 用户每月获赠 $2 通用推理额度。
用户体验优化：用户可在设置中自定义 API Key 和提供商优先级，实现个性化的推理服务调用。

意义与影响

DeepInfra 与 Hugging Face 的此次合作，对 AI 开发者和生态系统具有多重积极影响：

降低使用门槛与复杂度：通过标准化的 Inference Providers 接口和 SDK 集成，开发者无需为每个模型单独处理复杂的认证、路由和错误重试逻辑。特别是对于 Agent 开发者而言，无需编写胶水代码即可接入多种模型，极大提升了开发效率。
成本透明与优化：Hugging Face 承诺在路由模式下不收取额外加价，使得开发者能够清晰了解实际成本。结合 DeepInfra 本身的高性价比定价，这为预算敏感的项目提供了极具竞争力的解决方案。
促进开源模型流通：通过提供便捷的访问通道，Hugging Face 帮助 DeepSeek、Kimi、GLM 等优秀的开源模型更广泛地触达开发者社区，加速了开源 AI 技术的落地与应用创新。
增强平台粘性：通过提供 PRO 用户的推理额度激励和统一的计费体验，Hugging Face 进一步巩固了其作为 AI 开发核心基础设施的地位，鼓励用户从单纯的模型浏览者转变为活跃的模型使用者和贡献者。

总体而言，这一整合不仅丰富了 Hugging Face 的服务选项，更通过技术标准化和成本优化，推动了 AI 应用开发向更轻量化、更经济的方向发展。

查看原文 →huggingface.co