近日,人工智能领域再次迎来一波惊喜,国产大模型DeepSeek-R1在无明显预告的情况下,悄然发布了新版本R1-0528。此次更新并未伴随官方的Model Card或公告,却迅速在Hugging Face平台上引起了广泛关注,并一举登上大模型热搜榜榜首。
网友们对R1-0528的讨论热情高涨,纷纷表示期待看到DeepSeek后续R2及V4版本的重大更新。有趣的是,由于DeepSeek习惯于在传统节日前后发布新版本,国外网友甚至开始根据中国的国庆和端午假期推测其未来的发布时间。
在NVIDIA Q1财报发布之际,DeepSeek的小幅更新避免了再次引发关于大模型训练算力的热议。官方透露,R1-0528在推理性能、前端开发能力和工具使用智能性上均有显著提升。通过对比测试,新版本在物理世界的推理能力展现出了比Claude-4-Sonnet更自然的表现,例如小球破坏砖墙后的不规则倒塌更加符合物理规律。
在编程推理能力方面,R1-0528也有所提升,尽管相较于其长文本生成能力略显逊色。在LiveCodeBench测试中,R1-0528跃升至第四名,与OpenAI的模型展开激烈竞争。通过经典五边形小球弹跳测试,新版本不仅代码一次启动成功,还展现出了更细腻的物理效果和美观的界面设计,甚至允许用户自定义多种物理参数。
最令人瞩目的,莫过于R1-0528在长文本生成方面的卓越表现。一篇由DeepSeek仅用40秒创作的10000字科幻小说,行文流畅、科幻氛围浓厚、人物描写细腻,甚至超越了大部分网络文学的质量。这一成就不仅展现了DeepSeek在中文文本生成上的强大实力,也让人们对其未来在文学创作领域的潜力充满期待。
R1-0528在前端开发方面也不逊色于Claude Sonnet 4。两者在界面美观度和功能完整度上打成平手,但DeepSeek贴心地加入了使用说明,提升了用户体验。尽管两者在取色功能上都存在小瑕疵,但整体而言,DeepSeek的更新展现出了强大的竞争力和本土化优势。
此次更新不仅巩固了DeepSeek在大模型领域的地位,也再次证明了国产大模型的实力和潜力。DeepSeek-R1-0528以其卓越的表现,让人们看到了国产大模型与闭源模型竞争的实力,同时也展示了其不可替代的本土化优势。对于想要体验这一最新版本的用户来说,只需访问DeepSeek的官方网站即可。