DeepSeek各版本回顾
让我们首先回顾DeepSeek发布大语言模型的时间表:
2023年11月2日,DeepSeek-Coder,33B,这是2023年11月29日,DeepSeek的第一个开源大型语言模型,DeepSeek发布了DeepSeek LLM,其中包括7B和67B,分为两类:基础和聊天。总共有四个版本。 2024年1月11日,DeepSeek发布。 MoE(MoE), 145B, February 5, 2024, released DeepSeek-Math(GRPO), 7B, inference model March 11, 2024, released DeepSeek-VL, 7B, multimodal May 7, 2024, released DeepSeek-V2 (MLA), 236B, June 17, 2024, released DeepSeek-Coder-V2, 236B, September 6, 2024, DeepSeek-V2.5于2024年11月20日发布,238b,DeepSeek-r1-Lite,1.5b,2024年12月10日,DeepSeek-V2.5-1210(V2系列的最终版本),236b,2024年12月13日,2024年12月13日,DeepSeek-Vl2,DeepSeek-Vl2,27B,27B,2024年,2024年,2024年,2024年1月67日(Fpp),Fpp(Fpp),M,Fpp),M,Fpp),M,Fpp),M,Fpp) 20,2025,发行了DeepSeek-R1,671b,推理模型DeepSeek和类似产品的性能比较
上面括号中大胆字体的内容是DeepSeek的创新技术。可以看出,DeepSeek逐渐将这些技术应用于一系列产品。可以认为V3是主人,参数高达671B(6710亿)。 V3于2024年12月26日推出,在苹果的中国和美国应用程序商店的免费应用程序下载中排名第一。当时,它在大型语言模型的全球性能排名中排名第七,在复杂问题和代码领域中排名第三,在开源模型中排名第三。
R1是在V3基础上生成的
有些人可能有疑问:您不想谈论R1吗?为什么要谈论V3?因为R1是基于V3生成的!
从V3到R1
上图说明了V3如何生成R1。不用担心它太深刻了。不难理解。让我们简要解释一下:
步骤1:生成R1-Zero
基于V3,基于此基础进行增强学习(RL),主要是基于准确性和格式,而是生成R1-Zero。此版本与R1同时发布。
R1-Zero上有监督的微调(SFT),并获得冷启动数据。
步骤2:生成R1
冷启动数据经过训练。除了准确性和格式外,这次进行的加固学习还增加了一致性,以确保将来使用输入和输出的一致性。经过加强学习后,然后进行了监督和微调以获得思维链(COT)数据。
同时,我们直接从V3监督微调中获得通用知识数据,即无需计算就可以使用的知识。
合并两者后,进行了强化学习的两个方面,包括基于规则的验证(数学,代码)和人类偏好,这些偏好产生了R1。
步骤3:生成蒸馏版
使用先前生成的思想链数据和经常知识数据,监督和微调的其他开源大语模型。 DeepSeek选择了阿里巴巴的Qwen 2.5和Meta的Llama 3,其中获得了所谓的蒸馏版。
R1版本在GitHub上发布
上图是GitHub网站上的屏幕截图,您可以看到DeepSeek发布的R1版本。
关于许多人的蒸馏,我发现许多人不了解,所以我简要解释了:
用户评论
苏莫晨
终于明白为什么大家对 DeepSeek 这么疯狂了!V3集成了这么多功能,真的太强了。现在 R1 又出现了,而且是在 V3 的基础上改进,感觉技术迭代速度超级快啊!
有16位网友表示赞同!
陌上花
我一直觉得 V3 就已经很强大,没想到 R1 更厉害了!这篇博文写的太好了,让我对 DeepSeek 更加期待。希望早日体验一下 R1 的威力。
有6位网友表示赞同!
我要变勇敢℅℅
我是从 DeepSeek V2 开始了解这个项目,一直关注到现在的进展。现在看到这种持续迭代的技术发展,真的很让人感慨,感觉技术一直在进步。
有16位网友表示赞同!
盲从于你
我有点好奇蒸馏版是什么概念啊?为什么说 DeepSeek R1 不是蒸馏版的呢?还是不太理解…
有14位网友表示赞同!
遗憾最汹涌
DeepSeek V3 已经能满足我大部分需求了,R1 又有什么特别之处呢?我需要进一步学习一下。
有16位网友表示赞同!
夜晟洛
这篇文章写的真棒!让我对 DeepSeek 的未来充满了期待。这种不断迭代的更新机制太棒了!
有9位网友表示赞同!
迷路的男人
我一直觉得 DeepSeek 是一个很有潜力项目的 ,现在看到他们一直在努力改进,我觉得未来会越来越好, 期待它能成为行业领导者!
有14位网友表示赞同!
抚涟i
我个人觉得 R1 的优势在于可以更好地应用在实际场景中,V3 更侧重于功能的全面性吧。
有7位网友表示赞同!
此生一诺
感觉 V3 和 R1 并行的发展很有意思,这会不会代表 DeepSeek 未来会朝着两个方向发展的趋势呢?
有7位网友表示赞同!
来自火星的我
R1 是站在V3 基礎上的進化版,這說明DeepSeek團隊在技術力方面非常強大。
有17位网友表示赞同!
该用户已上天
我更偏爱 DeepSeek 的开源属性,这样可以让我们自由地学习和改进。希望 R1 也能保持这种良好的特性!
有15位网友表示赞同!
花花世界总是那么虚伪﹌
这篇博文太棒了!把 DeepSeek V3 和 R1 的区别写的很清楚,让我更容易理解。
有11位网友表示赞同!
何必锁我心
我现在想尝试一下 DeepSeek R1,看看它的实际效果怎么样。希望它能够像文章里说的那样强大!
有16位网友表示赞同!
咆哮
感觉DeepSeek的迭代速度确实很快,从V2 到V3再到现在的R1,都取得了很大的进步。我需要好好学习一下这方面的知识!
有11位网友表示赞同!
浮世繁华
我很想了解更多关于蒸馏版的信息,为什么说 DeepSeek R1 不是蒸馏版呢?希望作者能进一步解释!
有10位网友表示赞同!
哽咽
我觉得DeepSeek团队做得非常不错,不断改进和创新,这才能让项目更有生命力!期待他们能够带来更多的惊喜!
有11位网友表示赞同!
枫无痕
说实话,我有点难以理解 DeepSeek V3 和 R1 的关系。文中介绍的描述感觉有点抽象,希望能详细一些!
有16位网友表示赞同!