deepseek可能只是一个闹剧-网大论坛

雁塔晨钟 发表于 2025-1-30 11:37:38

deepseek可能只是一个闹剧

deepseek大概率用知识蒸馏，人家本来只是上线了一个轻量化模型deepseek r1，然后在deepseek v3的开源文档中预算了训练一个v3这些student model需要的费用。
结果海外媒体误解报道deepseek只需要500万美金就媲美openai，这是故意误传还是有意误传不得而知，但是实际上就是造成了利用这个做空了美国科技股。
而幻方量化从来没说过他们没有teacher model，也重来没说teacher model的训练费用，当然他可能也是做空美国科技股的助力。
唯一的结论，科技没有大进步，只是一场空投针对美国科技股的一次做空运动

宁汉合流 发表于 2025-1-30 11:42:39

为什么要做空呢，是不是不自信

lgyyuuki 发表于 2025-1-30 12:32:01

宁汉合流发表于 2025-1-30 11:42
为什么要做空呢，是不是不自信

西大有NPU算力硬件，所以要做空他。东大没硬件，就用deepseek来玩精神制胜法，当然在这之前先把梁文峰的p2p非法集资和量化股市割韭菜给洗白了！

宁汉合流 发表于 2025-1-30 12:51:58

lgyyuuki 发表于 2025-1-30 12:32
西大有NPU算力硬件，所以要做空他。东大没硬件，就用deepseek来玩精神制胜法，当然在这之前先把梁文峰的p ...

那后续呢，后续东大怎么跟人家比拼硬实力？

SanyouBio 发表于 2025-1-30 12:54:47

看，你又急了

董老师 发表于 2025-1-30 14:41:33

翁翁大婶子本来是很崇拜deepseek的，
一听说创始人是浙大的，马上就换了一副嘴脸，贬的一文不名
精神分裂了
:@

雁塔晨钟 发表于 2025-1-30 15:27:22

SanyouBio 发表于 2025-1-30 12:54
看，你又急了

所以你们这种真不行，纯粹讨论科技，去非要牵涉政治

吹就没用 发表于 2025-1-30 15:29:39

雁塔晨钟发表于 2025-1-30 15:27
所以你们这种真不行，纯粹讨论科技，去非要牵涉政治

浙大粉丝说了，质疑ds=不爱国=大殖子，你看着办吧

求实园 发表于 2025-1-30 16:49:41

董老师发表于 2025-1-30 14:41
翁翁大婶子本来是很崇拜deepseek的，
一听说创始人是浙大的，马上就换了一副嘴脸，贬的一文不名
精神分裂了 ...

互联网是有记忆的，董老师说的✓。

tobiaslee 发表于 2025-1-30 21:37:07

仔细看过技术报告，并且是从业者，确定的说 deepseek r1-zero 是没有蒸馏的，应该是世界上第一个证明强化学习激发推理能力的工作。R1 确是有一些训练数据可能是蒸馏的，但也是常见做法（openai google 也这么干），不起本质作用。

tianya2088 发表于 2025-1-30 21:44:20

米国股民这么好忽悠？？

北美王各加 发表于 2025-1-31 10:32:31

tianya2088 发表于 2025-1-30 21:44
米国股民这么好忽悠？？

这波nvda大跌17%。其实只有1%的市面流通股被卖出。炒股本来就是杠杆游戏。只需要恐吓忽悠1%的股民跟风卖了，就能猛砸17%。这不是很好理解吗

页: [1]

网大论坛's Archiver

deepseek可能只是一个闹剧