京东发布Oxygen AIIC:基于大模型的工业级商品知识平台
速览
京东发布Oxygen AI Item Center (Oxygen AIIC),这是一个基于大语言模型和视觉模型的工业级平台,旨在解决海量SKU下的商品知识生产与服务难题。该平台通过人机协作本体工程、S2D知识识别架构及自进化模型,实现了94.2%的精度和82.8%的召回率。目前已在搜索、推荐等核心场景部署,显著提升了商品质量与运营效率。
AI 深度解读
JD Oxygen AI Item Center (Oxygen AIIC) V1:工业级大模型驱动的商品理解与管理平台深度解读
背景
作为全球最大的电商平台之一,JD(京东)拥有超过 7 亿活跃用户和数百万商家,其商品目录(Catalog)中包含了数百亿个 SKU(库存量单位)。在这一超大规模下,高质量、结构化的商品知识不仅是提升消费者体验的基础,也是降低管理成本、提高运营效率的关键。
然而,面对如此庞大的数据体量,生产和提供服务结构化商品知识面临着三大工业级挑战:
- 新兴概念涌现快:市场趋势和新品类迭代迅速,传统静态知识库难以跟上节奏。
- 海量 SKU 的高质量知识生产:如何在数百亿 SKU 规模下,持续产出高准确率的结构化数据。
- 下游需求多样化:搜索、推荐、运营等不同业务场景对商品知识的需求差异巨大。
为了解决这些挑战,京东推出了 JD Oxygen AI Item Center (Oxygen AIIC) V1。这是一个基于大语言模型(LLM)和视觉语言模型(VLM)的工业级平台,旨在实现商品知识的自动化生产与服务。
核心内容
Oxygen AIIC 平台围绕四个核心支柱构建,形成了一个闭环的商品知识生产与服务体系:
1. 高效人机协作驱动的本体工程 (Ontology Engineering)
平台采用高效的人机协作模式进行本体(Ontology)工程。这使得本体库能够支持动态演进和敏捷扩展,目前本体条目已达数百万级。这种机制确保了商品分类和属性体系能够灵活适应市场变化和新概念的出现。
2. “语义搜索后判别” (S2D) 知识识别架构
Oxygen AIIC 提出了一种名为“Semantic Search then Discrimination” (S2D) 的知识识别架构。
- 架构逻辑:先通过语义搜索定位相关候选知识,再进行精细化判别。
- 性能优化:结合吞吐量提升策略,该架构实现了可扩展、高并发的 AI 商品库生产。
- 规模能力:能够支撑数百亿 SKU 级别的商品知识自动化生产。
3. 自进化商品理解 LLM/VLM
平台部署了自进化的商品理解大模型(LLM/VLM)。这些模型能够在稳定且可控的方式下持续改进,从而提升知识生产的准确性。
- 性能指标:目前知识生产的准确率达到 94.2%,召回率达到 82.8%。
4. 统一商品隧道 (Unified Item Tunnel)
作为一个数据和服务枢纽,“统一商品隧道”整合了底层数据与上层服务,为下游应用场景提供标准化的商品知识接口。
基础设施与部署现状
- 硬件基础:平台运行在华为昇腾(Huawei Ascend)NPU 上。
- 覆盖规模:涵盖数万个京东商品类目。
- 处理量:每天处理数亿次商品更新。
- 资产积累:已积累数千亿条商品知识资产。
关键要点
- 平台定位:Oxygen AIIC 是工业级规模的 LLM/VLM 中心化解决方案,专门用于商品的理解、管理和应用。
- 四大核心支柱:
- 基于人机协作的本体工程,支持百万级条目的动态扩展。
- S2D(语义搜索后判别)架构,实现海量 SKU 的高吞吐知识生产。
- 自进化的 LLM/VLM 模型,实现 94.2% 精度和 82.8% 召回率的知识生产。
- 统一商品隧道,作为数据和服务中心。
- 技术栈:基于华为昇腾 NPU 进行部署,体现了国产算力在超大规模 AI 应用中的落地能力。
- 业务覆盖:已部署于搜索、推荐、运营、品类规划等核心业务场景。
- 量化成果:
- 搜索流量覆盖率(Search-traffic coverage)达到 80.4%。
- 商品信息质量问题下降 37%。
- 商品上架过程中核心属性的自动填充率超过 80%。
意义与影响
Oxygen AIIC V1 的推出标志着电商平台在商品知识管理上从“人工+规则”向“AI 原生”的重大转变。
- 解决工业级规模难题:通过 S2D 架构和自进化模型,京东成功解决了数百亿 SKU 下高质量知识生产的规模化难题,证明了 LLM/VLM 在超大规模工业场景下的可行性。
- 显著提升运营效率:核心属性自动填充率超过 80%,大幅降低了商家上架商品的人力成本,同时减少了因人工录入错误导致的信息质量问题(下降 37%)。
- 赋能核心业务增长:80.4% 的搜索流量覆盖率意味着绝大多数用户搜索行为都能获得结构化、高质量的商品知识支撑,直接提升了搜索和推荐系统的准确性,进而改善用户体验和转化效率。
- 构建知识资产壁垒:数千亿条商品知识资产的积累,不仅服务于当前业务,更为未来的个性化推荐、智能客服等高级应用奠定了坚实的数据基础。
这一案例为其他拥有海量商品数据的电商平台或零售企业提供了可借鉴的工业化 AI 落地范式。
