雁塔晨钟 发表于 2025-1-30 11:37:38

deepseek可能只是一个闹剧

deepseek大概率用知识蒸馏,人家本来只是上线了一个轻量化模型deepseek r1,然后在deepseek v3的开源文档中预算了训练一个v3这些student model需要的费用。
结果海外媒体误解报道deepseek只需要500万美金就媲美openai,这是故意误传还是有意误传不得而知,但是实际上就是造成了利用这个做空了美国科技股。
而幻方量化从来没说过他们没有teacher model,也重来没说teacher model的训练费用,当然他可能也是做空美国科技股的助力。
唯一的结论,科技没有大进步,只是一场空投针对美国科技股的一次做空运动

宁汉合流 发表于 2025-1-30 11:42:39

为什么要做空呢,是不是不自信

lgyyuuki 发表于 2025-1-30 12:32:01

宁汉合流 发表于 2025-1-30 11:42
为什么要做空呢,是不是不自信

西大有NPU算力硬件,所以要做空他。东大没硬件,就用deepseek来玩精神制胜法,当然在这之前先把梁文峰的p2p非法集资和量化股市割韭菜给洗白了!

宁汉合流 发表于 2025-1-30 12:51:58

lgyyuuki 发表于 2025-1-30 12:32
西大有NPU算力硬件,所以要做空他。东大没硬件,就用deepseek来玩精神制胜法,当然在这之前先把梁文峰的p ...

那后续呢,后续东大怎么跟人家比拼硬实力?

SanyouBio 发表于 2025-1-30 12:54:47

看,你又急了

董老师 发表于 2025-1-30 14:41:33

翁翁大婶子本来是很崇拜deepseek的,
一听说创始人是浙大的,马上就换了一副嘴脸,贬的一文不名
精神分裂了
:@

雁塔晨钟 发表于 2025-1-30 15:27:22

SanyouBio 发表于 2025-1-30 12:54
看,你又急了

所以你们这种真不行,纯粹讨论科技,去非要牵涉政治

吹就没用 发表于 2025-1-30 15:29:39

雁塔晨钟 发表于 2025-1-30 15:27
所以你们这种真不行,纯粹讨论科技,去非要牵涉政治

浙大粉丝说了,质疑ds=不爱国=大殖子,你看着办吧

求实园 发表于 2025-1-30 16:49:41

董老师 发表于 2025-1-30 14:41
翁翁大婶子本来是很崇拜deepseek的,
一听说创始人是浙大的,马上就换了一副嘴脸,贬的一文不名
精神分裂了 ...

互联网是有记忆的,董老师说的✓。

tobiaslee 发表于 2025-1-30 21:37:07

仔细看过技术报告,并且是从业者,确定的说 deepseek r1-zero 是没有蒸馏的,应该是世界上第一个证明强化学习激发推理能力的工作。R1 确是有一些训练数据可能是蒸馏的,但也是常见做法(openai google 也这么干),不起本质作用。

tianya2088 发表于 2025-1-30 21:44:20

米国股民这么好忽悠??

北美王各加 发表于 2025-1-31 10:32:31

tianya2088 发表于 2025-1-30 21:44
米国股民这么好忽悠??

这波nvda大跌17%。其实只有1%的市面流通股被卖出。炒股本来就是杠杆游戏。只需要恐吓忽悠1%的股民跟风卖了,就能猛砸17%。这不是很好理解吗
页: [1]
查看完整版本: deepseek可能只是一个闹剧