deepseek可能只是一个闹剧
deepseek大概率用知识蒸馏,人家本来只是上线了一个轻量化模型deepseek r1,然后在deepseek v3的开源文档中预算了训练一个v3这些student model需要的费用。结果海外媒体误解报道deepseek只需要500万美金就媲美openai,这是故意误传还是有意误传不得而知,但是实际上就是造成了利用这个做空了美国科技股。
而幻方量化从来没说过他们没有teacher model,也重来没说teacher model的训练费用,当然他可能也是做空美国科技股的助力。
唯一的结论,科技没有大进步,只是一场空投针对美国科技股的一次做空运动 为什么要做空呢,是不是不自信 宁汉合流 发表于 2025-1-30 11:42
为什么要做空呢,是不是不自信
西大有NPU算力硬件,所以要做空他。东大没硬件,就用deepseek来玩精神制胜法,当然在这之前先把梁文峰的p2p非法集资和量化股市割韭菜给洗白了! lgyyuuki 发表于 2025-1-30 12:32
西大有NPU算力硬件,所以要做空他。东大没硬件,就用deepseek来玩精神制胜法,当然在这之前先把梁文峰的p ...
那后续呢,后续东大怎么跟人家比拼硬实力? 看,你又急了 翁翁大婶子本来是很崇拜deepseek的,
一听说创始人是浙大的,马上就换了一副嘴脸,贬的一文不名
精神分裂了
:@
SanyouBio 发表于 2025-1-30 12:54
看,你又急了
所以你们这种真不行,纯粹讨论科技,去非要牵涉政治 雁塔晨钟 发表于 2025-1-30 15:27
所以你们这种真不行,纯粹讨论科技,去非要牵涉政治
浙大粉丝说了,质疑ds=不爱国=大殖子,你看着办吧 董老师 发表于 2025-1-30 14:41
翁翁大婶子本来是很崇拜deepseek的,
一听说创始人是浙大的,马上就换了一副嘴脸,贬的一文不名
精神分裂了 ...
互联网是有记忆的,董老师说的✓。 仔细看过技术报告,并且是从业者,确定的说 deepseek r1-zero 是没有蒸馏的,应该是世界上第一个证明强化学习激发推理能力的工作。R1 确是有一些训练数据可能是蒸馏的,但也是常见做法(openai google 也这么干),不起本质作用。 米国股民这么好忽悠?? tianya2088 发表于 2025-1-30 21:44
米国股民这么好忽悠??
这波nvda大跌17%。其实只有1%的市面流通股被卖出。炒股本来就是杠杆游戏。只需要恐吓忽悠1%的股民跟风卖了,就能猛砸17%。这不是很好理解吗
页:
[1]