没有发布会,没有新闻稿,甚至连更新说明都没有,但全球AI开发者在凌晨两点的下载中见证了中国开源大模型的又一次进化。
与OpenAI、Anthropic等公司大张旗鼓的发布风格截然相反,DeepSeek此次更新延续了其一贯的技术极客作风。在微信群简短通知后,工程师团队在29日凌晨将模型上传至HuggingFace,连模型卡都未更新就转身离开。

这种低调几乎成为DeepSeek的独特标签。今年3月更新V3模型时,团队同样“默默上新”,直到开发者自行测试才发现其性能已全面超越Claude 3.7 Sonnet。
“版本号只是营销需求”,一位业内人士猜测,DeepSeek可能认为只要模型架构不变,就不算大版本升级。这种务实态度背后,是中国团队对技术实质而非宣传声量的专注。
沉默的发布,轰鸣的性能
尽管官方未提供任何性能说明,全球开发者社区在24小时内自发完成了对新模型的全面“体检”。测试结果令人震惊:
在权威编程评测平台Live CodeBench上,DeepSeek-R1-0528得分紧咬OpenAI o4-Mini(Medium),排名第四。要知道,这几个都是Open AI旗下的高性能商业模型,而DeepSeek-R1-0528不仅性能和他们接近,最重要的是开源、免费!
页码:下一页