DeepSeek新版本发布为何悄无声息 打破行业惯例。带着十六个字,DeepSeek新版本姗姗来迟。距离上一次更新的V3.2版本已经过去近5个月。在这期间,安索皮克的克劳德神话模型在网络攻击上展现出前所未有的能力,有机构称其将网络攻击的时代从“手工化”带到了“工业化”;GPT-Image-2也让网友惊呼“有图有真相”的时代已经过去。在这个国外主流大模型平均91.4天就迭代一个版本的时代,DeepSeek的“静默”,在很多人眼里几乎等同于落后,甚至掉队。

DeepSeek新版本发布为何悄无声息

沉默的DeepSeek让人很不习惯——2025年初横空出世、用更少的算力实现更优的性能、打破美西方营造的“算力焦虑”。这些标签让它的意义不止于一个公司的一款产品。几个月里,关于DeepSeek-V4的市场传闻就没断过。当时,国外科技媒体称V4模型将在今年春节发布,具有强大的编码能力。当一家公司最核心产品的动态被匿名信源、外媒报道和券商研报所定义——这本身已偏离了技术讨论的轨道。DeepSeek官方从未对外界的消息做过任何确认,这种沉默又让讨论升级。

DeepSeek新版本发布为何悄无声息 打破行业惯例

2月26日,事情迎来转折。路透社称,据知情人士透露,DeepSeek发布V4之前没有向美国芯片公司英伟达和超微半导体提供模型早期访问权限,而是让中国企业华为提前数周开展软件适配优化工作。路透社在报道中用了“breaking from standard industry practice”(打破行业惯例)这一表述。这是此前无论中国公司还是外国公司的大模型都没有采用过的方式。显然,此时讨论的已经不只是一个公司能否发布新产品的问题了。