据闪德资讯获悉,国产大模型DeepSeek于5月22日宣布,旗下旗舰模型V4-Pro API价格永久下调75%,其中输入(缓存命中)价格低至每百万Tokens仅0.025元,输入(缓存未命中)3元,输出6元,创下全球最低纪录。
当前全球AI算力成本持续上涨,核心原因在于产业链失衡。
一方面,万亿级模型推动HBM、高端DRAM等AI存储需求暴增,而三星、SK海力士、美光等原厂又将产能优先投向高利润AI产品,导致供给紧张、价格上涨;另一方面,AI智能体和生成式应用快速增长,推理端调用量激增,电力、带宽与服务器成本不断攀升,“烧钱换市场”的模式已难以持续,因此API涨价逐渐成为行业普遍选择。
但DeepSeek的降价并非单纯补贴,而是建立在技术重构带来的成本优势之上。
首先,其自研稀疏注意力机制与混合专家(MoE)架构,大幅降低长上下文推理算力消耗,V4系列处理百万级Token时,算力消耗仅为上代的27%,KV Cache占用也降至10%。
其次,DeepSeek正在深度适配昇腾等国产算力平台,降低对海外高端GPU的依赖,进一步压缩硬件成本。
此外,DeepSeek还通过推理侧工程优化提升算力利用率,并利用规模效应摊薄固定成本,形成“用量越大、成本越低”的循环。
某种程度上,这也意味着AI行业的竞争逻辑正在变化:未来比拼的不只是模型能力,更是谁能真正把推理成本打下来。
点击此处关注,获取最新资讯!






我的评论
最新评论