大理泡沫板胶 DeepSeek和国产力下了好大盘棋

发布日期:2026-04-30 点击次数:62
铁皮保温施工

摘要:

DeepSeek 与国产力力,实现 token 成本的大幅降低后,又会反向利好 AI 应用市场,催生大的市场空间。

作者|Dale、姜凡

编辑|董雨晴

两天两次降价,率成了 DeepSeek 护城河

2026 年 4 月的后个周末, AI 产业被连串消息点燃,而消息背后的主角只有个,DeepSeek。

4 月 24 日,DeepSeek 正式发布 V4 系列预览版,同步开源 Pro 与 Flash 两款模型,均支持百万 token 长上下文。紧接着的 25 日与 26 日,DeepSeek 连续两晚出手降价——先是 V4-Pro 限时 2.5 折,再是全系 API 输入缓存命中价格降至发价的十分之。两天两次调价之后,V4-Flash 每百万 tokens 输入缓存命中价格仅为 0.02 元,V4-Pro 为 0.025 元,创下全球大模型价格新低。

这样场精心策划的闪电战,背后是 DeepSeek 长达年的艰难求索。

但如果依旧将目光放在"价格战"的浅层叙事,就低估了 DeepSeek 此番出手的意。V4 的降价已经关于钱换市场,其大的意义是底层架构率革命带来的成本变化。正如盛 Ronald Keung 团队在新研报中所指出的," V4 的核心意义在于以低成本支持复杂的智能体应用落地,从而开 AI 应用规模化的新空间"。

在 DeepSeek-V4 的技术报告里,率是致的。

V4-Pro 在 100 万 token 上下文场景下,单 token 理所需浮点运量仅为 V3.2 的 27,KV 缓存占用仅为 10;V4-Flash 为激进—— FLOPs 降至 10,KV 缓存压缩至 7。这意味着什么?通俗地说,过去跑条百万字上下文需要三台机器的力,现在台机器就能从容应对,而且内存开销仅是过去的十分之。

率飞跃背后,有 V4 在架构层面的三项关键创新:混注意力机制(CSA/HCA)、流形约束连接(mHC),以及 Muon 优化器。其中核心的突破在于混注意力—— CSA(压缩稀疏注意力)沿序列维度压缩 KV 缓存后执行稀疏注意力计大理泡沫板胶,每 m 个 token 的 KV 缓存被压缩为条记录;HCA(重度压缩注意力)则施加激进的压缩策略,将 m' 个 token 的 KV 缓存并为单条记录,但仍保留稠密注意力。这套组拳在几乎不影响模型能的前提下,将长上下文场景的计与存储成本掉了个数量。

精妙的设计体现在细节处:对 KV 条目采用混存储格式,旋转位置编码维度保持 BF16 精度,其余维度使用 FP8 精度,这项便将 KV 缓存容量压缩近半。闪电索引器内部的注意力计以 FP4 精度执行,进步加速长上下文下的注意力运。

技术压缩率,率兑现成本。这才是 DeepSeek 敢于连续降价的真正底。

理解了这逻辑,便能看穿此次降价的产业含义:相比于其他 AI 大模型降价拼命上桌,这次 DeepSeek 直接用技术优势主动构建了成本壁垒。V4-Flash 以 0.02 元 / 百万 tokens 的价格横扫市场背后,每分钱的降价都有底层架构优化作为支撑,而不是资本钱补贴的逻辑。竞争对手要跟进,先得在技术上追平这份率——而这显然不是朝夕之功。

从模型等芯片,到芯片靠模型

与两次降价几乎同步发生的,是国产芯片阵营的集体"起立"。

V4 发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯 8 国产 AI 芯片,以及英伟达,均宣布完成对 DeepSeek-V4 的适配。尤其值得注意的是,这是大模型产业次实现" Day 0 "别的全栈适配:模型发布即适配上线,芯片厂商不再需要数月的"追逐式"调试周期。

这里有个细节须拆解清楚。DeepSeek 官在技术报告中表示,"我们在英伟达 GPU 和华为昇腾 NPU 两个平台上验证了细粒度 EP(并行)案,在通用理任务中实现 1.50 至 1.73 倍加速;在延迟敏感场景下达到 1.96 倍"。这是 DeepSeek 历史上次将国产芯片与英伟达 GPU 并列写入硬件验证清单,确立对等地位。

华为昇腾的反应也十分迅猛。昇腾官在 B 站直播中称,在理部署层面,保温护角专用胶昇腾 950PR 平台针对 V4 实现了多项度适配。量化面,原生的硬件加速精度明确支持 MXFP8 与 MXFP4 等低精度数据格式,兼顾模型精度与内存占用优化。子层面,华为官宣布昇腾 950 通过融 kernel 与多流并行技术,大幅降低了混注意力机制的计和访存开销,显著提升了理能。而 MoE 模块中路由与共享的计重叠等度优化,则进步确保了万亿参数模型在国产硬件上的平稳运行。

图|昇腾直播间截图

寒武纪则在基于自研 NeuWare 软件生态与 vLLM 框架上,完成了对 V4 的" Day 0 "适配并同步开源自研子库。这已是寒武纪连续二次在 DeepSeek 新模型发布日便出适案,其技术迭代速度同样不容小觑。

有说服力的信号来自财务上的持续好转,国产开源大模型的速发展,正在把力产业拉入良发展的通道里。

4 月 26 日晚,摩尔线程发布 2026 年季报:季度营业收入 7.38 亿元,同比增长 155.35;归母净利润 2935.92 万元,同比扭亏为盈。这被称为"英伟达"的国产 GPU 厂商,此前因研发投入达营收 86.68 而备受市场质疑,如今终于交出了份逆转的答卷。与此同时,摩尔线程还与某客户签订了金额达 6.6 亿元的夸娥智集群销售同。

寒武纪此前发布的年度业绩快报亦显示已率先实现盈利,沐曦股份则呈现出亏损持续收窄的态势。三国产 AI 芯片代表企业同步进入业绩通道,已经是十分有力的回应。

国产力生态临界点的到来

当 DeepSeek 的技术率革命与国产芯片的产能释放在同时间窗口交汇,条完整的产业闭环开始浮出水面。

中银在 4 月 26 日发布的研报中判断:" DeepSeek V4 的发布标志着国产大模型已基本跑通全栈国产化,理论上已形成从底层硬件、基础软件、平台服务到上层应用、安全体系的完整技术链条,国产力板块或迎来自己的质变临界点。"

反过来看,DeepSeek 与国产力实现力,在大幅降低 token 成本后,又会反向利好 AI 应用市场,催生大的市场空间。

据华泰证券表述,"市场容易将 V4 理解为‘降本压低力、存储需求’,但重要的边际变化在于长上下文成本下降后,复杂 Agent、多文档分析、长周期任务、在线学习等场景可用提升,理调用量与存储访问频次有望扩张。"换句话说,降价不会缩减蛋糕,还会做大蛋糕——越便宜用得越凶,总调用量反而会暴增。

同样在 4 月 24 日,新版本 OpenClaw 发布,直接接入了新的 DeepSeek V4 双版本,并将 V4 Flash 设置为了默认大模型。

据 OpenRouter 平台数据,DeepSeek V4 flash 今日调用量较前天上涨了 62。

奥力斯    万能胶生产厂家    联系人:王经理    手机:13903175735(微信同号)    地址:河北省任丘市北辛庄乡南代河工业区

值得提的是,DeepSeek 已明确将华为昇腾 950 节点量产纳入其商业路径,并预告下半年实现大规模供货后 API 定价将迎来显著下降。这意味着当前的降价可能只是个预告,真正的主菜还在后面。

资本市场已作出热烈反应。4 月 27 日早盘,A 股力芯片概念延续强势,CPU 向涨,海光信息、摩尔线程等跟涨;港股半体板块涨,澜起科技涨 6,中芯涨近 5。产业链上下游——从芯片设计到服务器整机,从力租赁到 AI 应用——都在重新定价这历史的产业变局。

这个 4 月,DeepSeek 以组硬核率数据为矛、以两次降价为鼓,出明—— AI 的长上下文时代已经到来,而它的"速公路"将由国产力铺就。对那些刚刚登陆科创板的国产芯片企业而言,这个春天确实比往年都暖。

相关词条:离心玻璃棉     塑料挤出机     钢绞线厂家    铝皮保温    pvc管道管件胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

热点资讯

推荐资讯