|
饶议科学 2025年07月13日 11:01 北京7 p" d$ a) Y/ `; M5 u0 \, w. t
欢迎回归0 H4 @( W- E f- T! P
9 r }" g6 e+ k3 z$ e
科学上,当然有大项目" c9 C+ a5 C1 ?6 O$ L% k
: J3 Y: [4 C3 y0 J9 G3 Y: x
但是,那只能是少数学科,少数时候。
$ \ R4 `3 c2 e9 v k9 P7 d$ |" \( t
很多大项目,是忽悠、如果不是欺骗的话。0 q. p' p3 B" B- O
( k9 c7 h! l1 ?, a君不见,蒲慕明在主持国家脑计划的时候,就给自己单位、自己学生一堆钱。他还呼冤枉,到位不多,两三亿?
0 T! G- C6 \. ]! O* H. z6 r他不说自己提议是多少,被我在委员会砍到二十多亿,其他人到财政部再砍到6/7亿?财政部再不愿给他而故意拖拖拉拉才到位2/3亿?; u* x' m, e4 y+ f/ I( B
. D! m0 ~3 o, g" N. M# I
他这是失道寡助的结果,不是他自己的意愿和使劲蛮力的结果。提议经费第二的脑计划项目,数量低于他的二十多亿,而我也不能批评脑计划的每一个专家,只能捡嘴恶劣的、最不应该的批。其他漏网,就没有办法,蒲慕明也不用妒忌那些人。
- F$ o4 a1 j9 P0 E) m9 D/ Z
- ~8 m) z, @( c% [) F而经过至少三轮反抗还是失败后,也就没有人愿意蒲慕明主持脑计划。他成为一般(第三档)的没有权力的(接近于旁听的)成员。
$ f5 A% ^2 D6 L O" \ V5 d9 e( \: W/ f* U$ l0 p3 c: x. W9 ]
最近,蒲慕明借用Deepseek的机会写文章,重新提倡探索、提倡小团队,不鼓吹大科学了。+ e4 ?& W. a8 L) j( k, d
% j4 ^% {: { U: ?! G
似乎回归初心了。6 O1 i* E: Z; w0 I+ \+ @3 g
6 ]( l% w4 Q, [9 @+ t: M: U
好事、好事,至少看起来、听起来是好事。7 y7 W( B5 E& X) t; g
/ v# N0 d/ t- ~欢迎回归本心,即使是迷途知返,即使是屁股决定脑袋。) @3 k% O( [& A
: n: E( s% S2 d
他是这样教训其他行业的:# R. T- B( d# H: T9 ?
8 r( u4 U+ C! Q1 a z“DeepSeek也对中国研究机构敲响了警钟,这些机构获得了大量政府资金用于人工智能,并雇佣了绝大多数中国人工智能研究人才。尽管近年来中国人工智能研究人员发表的研究论文数量惊人地增加,但在人工智能领域真正有影响力的重大发现或发明仍然稀缺,快速发表增量价值论文的文化盛行。DeepSeek的领导者梁文峰学术资历并不显赫,也很少被邀请在学术人工智能会议上发言,但他有信心和胆量去解决开发AGI的最重要问题。这一警钟对中国年轻科学家和工程师来说既是警醒也是鼓舞,他们渴望在世界上有所作为。DeepSeek的创新文化的关键,正如梁最近解释的那样,是培养他的研究团队的信心和自下而上的主动性。像DeepSeek这样的小团队在快速闭环互动、朝着既定目标的凝聚努力以及团队成员的精神纽带方面更有效率。大多数中国机构几乎没有为层级结构底层的年轻人留出空间去追求自己的想法”。; }4 n1 Q# e" d9 t' m( l
" ?# f G, _( p+ A4 a6 P+ t2 f他自己的行业呢?他自己的机构呢?为什么放弃自下而上?为什么不给年轻人空间而自己指定他们转向?8 R4 |- `! X7 B/ l5 z
" a. t' n5 X Z1 x, |
奇葩不过如此——出尔反尔再出尔:
r) u7 K) ^2 f) z6 _* Q
1 P' @# }& h2 e小团队-大团队-现在又回归小团队。
. X: K* s T; W- B" k b6 G1 k- x# F, S6 D" h' _1 l
一切不以科学出发、没有原则,他不管钱就要小团队,他管钱就大团队,他不再管钱又小团队。- ~6 L! |, O4 e
$ b. W/ m0 P# o; z, j, s3 b; A( H& i3 d
NSR述评| 蒲慕明院士:对DeepSeek突破的反思 2025年02月19日 11:12 $ v" x* F9 k$ z t
2 N- G. e+ I1 d6 p9 s2025年将是近几十年来中国科学最难忘的年份之一。1月20日,杭州一家小型人工智能公司DeepSeek宣布了一款极其高效的“推理”人工智能模型DeepSeek R1,在全球范围内引起了轰动,一些爱好者称之为“人工智能革命”。这一震惊源于DeepSeek R1与大型科技公司生产的顶级大型语言模型(如ChatGPT-o1)相媲美,但R1的基础大型语言模型V3(几周前宣布)的构建成本仅为当前顶级大型语言模型的一小部分,且使用的低级计算机芯片(GPU)数量也少得多。最值得注意的是,DeepSeek的模型是开源的,完整披露了技术细节,并且对人工智能开发者的收费远低于市场上的其他闭源大型语言模型。随着震惊逐渐平息,我们可以反思DeepSeek突破的真正意义。DeepSeek R1非常巧妙地利用了现有的网络工具,如专家混合、强化学习和数据蒸馏,实现了完全出乎意料的推理效率。它首次向用户展示了其推理过程的“思维链”。然而,R1并没有像反向传播算法和变压器网络那样带来新的突破性人工智能技术发明,这两种技术分别引发了最近的两次人工智能革命——深度学习和大型语言模型。用通俗的话来说,这并不是从0到1的发明,而是以空前的速度从1到100的发展。这一速度宣告了人工通用智能(AGI)的即将到来——机器的自我学习和泛化能力,能够在复杂环境中执行各种任务,其智能水平与甚至超过人类智能。重要的是,DeepSeek清楚地表明,从1到100的发展可能比从0到1的发明具有更重大的影响。DeepSeek的大型语言模型出现在人工智能界普遍信服规模定律的时候,即人工智能模型的性能随着模型规模、数据集和计算能力的增加而提高。尽管有一些证据表明这一规律正接近其极限,但美国和中国的许多科技巨头仍在要求投资者和政府支持越来越大且能源消耗不可持续的数据中心。许多大型数据中心正在建设中,美国总统刚刚宣布了5000亿美元的支持。7 D( e* ]; Z0 r, `9 P* j/ [9 t q9 n
* ?4 f$ B6 a/ s5 hDeepSeek R1强烈表明,改进计算算法的效率可能比坚持规模定律更具吸引力。正如特朗普总统所言,DeepSeek的“警钟”不仅在于中国人工智能技术在“中美”人工智能竞赛中迅速追赶,而且也是对全球人工智能界的一个呼吁,即人工智能的未来并不只掌握在少数科技巨头手中。小型研究团队在推动人工智能前沿方面可以发挥重要作用。人工智能技术的“民主化”或许是DeepSeek突破的最显著方面。DeepSeek也对中国研究机构敲响了警钟,这些机构获得了大量政府资金用于人工智能,并雇佣了绝大多数中国人工智能研究人才。尽管近年来中国人工智能研究人员发表的研究论文数量惊人地增加,但在人工智能领域真正有影响力的重大发现或发明仍然稀缺,快速发表增量价值论文的文化盛行。DeepSeek的领导者梁文峰学术资历并不显赫,也很少被邀请在学术人工智能会议上发言,但他有信心和胆量去解决开发AGI的最重要问题。这一警钟对中国年轻科学家和工程师来说既是警醒也是鼓舞,他们渴望在世界上有所作为。DeepSeek的创新文化的关键,正如梁最近解释的那样,是培养他的研究团队的信心和自下而上的主动性。像DeepSeek这样的小团队在快速闭环互动、朝着既定目标的凝聚努力以及团队成员的精神纽带方面更有效率。大多数中国机构几乎没有为层级结构底层的年轻人留出空间去追求自己的想法。例如,支持极具天赋的应届博士生设立独立研究实验室而无需进行博士后训练,这在麻省理工学院怀特黑德研究员项目和中国科学院神经科学研究所青年研究员项目的成功案例中得到了体现。尽管DeepSeek的突破具有创新性,但仍处于目前主导人工智能领域的大型语言模型框架内。随着对计算能力的需求达到极限,大型语言模型的进一步发展将取决于更高效的计算算法和网络结构。大多数人工智能研究人员现在很少关注大脑的工作原理,因为大型语言模型在许多方面似乎比人脑强大得多,且大型语言模型的应用机会众多。然而,随着AGI成为一个更接近的目标,我们可能需要更认真地研究大脑如何实现高效的计算,以及人类智能是如何体现在一个能够与外部世界有效互动的系统中的。在类人机器人等物理系统中开发具身AGI需要软件工程师、生物工程师和神经科学家之间的密切跨学科互动。任务似乎很明确:基于语言的推理和决策大型语言模型需要在输入端与多种感官信号的综合感知(包括基于语言的指令)相连接,在输出端与执行行为的复杂运动系统相连接。
: i7 m6 [6 r- D4 O+ [# @! `, V! p) ]1 G0 I1 G1 i! m [% Y1 z& t
作者:蒲慕明院士《国家科学评论》主编 中国科学院脑科学与智能技术卓越创新中心神经科学研究所科学主任 |
|