当前位置：首页 > 未命名 > 正文内容

DeepSeek V4 震撼发布：1.6T开源MoE、百万上下文，全面比肩顶级闭源模型

Openclaw1个月前 (04-25)未命名156

2026年4月24日，深度求索（DeepSeek）正式发布V4系列模型预览版并同步开源。这一消息在AI领域引发了巨大轰动——不仅因为DeepSeek选择在与OpenAI发布GPT-5.5的同一天发布V4，更因为V4在技术架构、性能表现和定价策略上均实现了质的飞跃。

一、双版本齐发：Pro与Flash满足不同场景

本次发布的DeepSeek-V4分为两个版本：

值得注意的是，Flash并非Pro的裁剪版本，而是经过独立训练的MoE模型。开启最大推理强度（Flash-Max）后，在大部分评测基准上表现接近Pro水平，但服务成本低一个数量级。

DeepSeek-V4在底层架构上引入了三项关键创新：

V4引入了压缩序列注意力（CSA）和重度压缩注意力（HCA）两种机制协同工作，在1M上下文下将单token推理FLOPs降至V3.2的27%，KV Cache占用降至10%。这意味着一百万Token的超长上下文首次真正从"高配"变成了"标配"。

在深层Transformer中引入流形约束，抑制深层梯度弥散，对超长训练序列和大规模MoE路由尤为关键，防止专家激活分布随深度坍缩。

替代传统的AdamW优化器，基于矩阵正交化的动量更新机制，在等计算量下收敛更快、最终损失更低。团队在超过32T tokens的预训练规模下验证了稳定性。

V4-Pro在各项评测中交出了令人震撼的成绩单：

在长上下文精确检索方面，V4-Pro在MRCR 1M（83.5%）和CorpusQA（62.0%）上落后于Opus 4.6。SWE-Bench Pro上以55.4%不敌K2.6的58.6%。总体来说，在短代码生成和竞赛编程上V4占优，但在长周期代码库修复场景上仍需追赶。

DeepSeek V4的定价再次展示了其"价格屠夫"本色：

模型	输入（未命中缓存）	输入（缓存命中）	输出（/1M tokens）
V4-Flash	$0.14	$0.028	$0.28
V4-Pro	$1.74	$0.145	$3.48

横向对比：

此次发布最引人注目的看点之一：DeepSeek V4首发即在华为昇腾平台上运行。这是前沿大模型首次在中国国产AI芯片上完成核心部署。

英伟达CEO黄仁勋对此评价："DeepSeek跑在华为芯片上，对美国来说是一个糟糕的结果。"这番话直接反映了事件的战略敏感性——在出口管制持续收紧的背景下，前沿AI的算力路径正在多元化。

对于正在使用DeepSeek API的开发者，以下变化需要关注：

旧API将于7月24日停用：deepseek-chat和deepseek-reasoner将在三个月后彻底停止使用。当前过渡期内，这两个旧名称分别自动路由到V4-Flash的非思考模式和思考模式。
新模型名：调用时使用deepseek-v4-pro或deepseek-v4-flash，Base URL保持不变。
接口兼容：同时支持OpenAI ChatCompletions接口和Anthropic API格式。Claude Code用户设置环境变量即可切换。
Thinking Mode：支持三档推理强度（Non-Thinking / High / Max），复杂Agent场景建议开启Max模式。
响应缓存：缓存命中可享受输入价格打1.2折（以Flash为例，从$0.14降至$0.028），批处理任务建议跑夜间时段享受半价。