95后在DeepSeek干得好好的,为啥突然投奔小米?2025-11-17 21:22
1 M8 l7 B' W' L
9 k" r o6 s0 t* G V2 b罗福莉在朋友圈里发了条话,正式承认自己已经加入了小米MiMo团队。她写得很短: “智能终将从语言迈向物理世界。”一句话,很多人当成了暗示,圈子里立刻热闹起来,过去那些关于高年薪、被雷军挖角的传闻又被翻出来对照着看。 # P; `, P. o6 T* z8 @
把时间线往回拉一拉,这事并不是一夜之间的突发新闻。4月30日,小米把MiMo模型开源了,模型参数量是7B。虽然参数不大,但在公开的数学推理和代码评测里,MiMo的分数超过了市场上某些闭源模型,甚至比一些更大参数的对手表现还稳。页面最后顺手留了个招聘邮箱,意思明显:我们要人才来填坑。接着五月有消息说小米在搭大规模GPU集群,想着把这些大模型往真实产品里推。到了六月的发布会上,手机、AI眼镜、智能家居、汽车一股脑儿拿出来秀,雷军也当众说要在未来几年大幅增加研发投入,其中一部分明确投到AI上去。 2 H3 z1 }2 @ B/ j5 a5 L" D
再往前看,二月那会儿DeepSeek把DeepSeek V2推出来,把行业气氛带热了。罗福莉那时是DeepSeek的核心研究员,名字也被更多人记住。她在DeepSeek主抓底层模型技术,负责训练、论文和开源这些东西,岗位性质更偏学术、看榜单和影响力。DeepSeek走红后,外界关于她被挖角、年薪的传闻没少,但她一直没回应。直到11月中旬朋友圈那条确认信息,猜测才变成事实。
9 z: D2 B" Y/ W0 o+ a1 w把她的职业轨迹拉直看,会发现两条线并行。一条是学术研究路线:北大、达摩院、DeepSeek,重心是论文和学术影响力;另一条是产业化路线:把技术做成产品,放到手机、家电、汽车这些面对几亿用户的场景里。她在DeepSeek做的是模型架构、训练优化这种偏科研的活;到小米后,工作重心会变成怎么把模型放到终端、嵌入设备、处理设备间的联动问题,这需要从纯学术思路切换到工程化、产品化思路。 , e0 s5 U% \$ K* \# T7 {1 a
这中间的决定不是只看钱能解释清楚的。圈里有个杭州工程师的例子被拿来类比:他从去年开始每月定投两只ETF,不去看短期涨跌,长期下来反而稳了。这种做法反映出一种偏好:在不确定里选择长期可见的回报和确定性。对顶尖研究员来说,选择一个能把技术真正落地的平台,意义差不多:你的成果不只是挂在论文里被少数人读到,而是真正进入用户生活,影响面更明朗。待遇固然重要,但职业路径、能做的事以及成就感也占很大比重。
1 }$ q. ~( V$ w, g; q# a; P关于她的来头,细节不少。早年学术阶段就有亮眼表现:2019年读研二那年,在ACL等顶会上发表了8篇论文,其中两篇是第一作者,这在学界并不常见。工作经历也挺有层次:在到DeepSeek之前,她在阿里巴巴达摩院做事,主导过多语言预训练模型VECO,还推动了AliceMind的开源,这些经历让她在大规模训练、多语言处理上积累了不少实操能力。个人背景也不是靠家里资源堆出来的:1995年出生在四川宜宾,父亲是电工,母亲是老师,家庭并不宽裕。高中读的是宜宾市第一中学的“清北班”,后来考进北京师范大学计算机专业。前期成绩并不拔尖,曾在班里排到后面,到了大二突然发力,最终保研到北京大学计算语言学研究所。她的高中班主任回忆里说,学生时代既努力也有过犹豫期,走到今天看,那个犹豫最后变成了选择。
; u- H7 `' e4 Q" Z# {2 V" l1 @* `) L技术上,MiMo的设计和小米的目标决定了他们要找什么样的人。7B参数的MiMo在公开测试里展示出很强的稳定性,数学推理和代码任务上成绩不俗。小米更想把这种能力塞进其生态里:手机在车里、在家里的应用场景其实是联网协同的系统工程。这样的场景要求模型不仅能回答问题,还要管延迟、合理分配算力、保护隐私、和硬件协同工作。罗福莉在MoE(专家混合模型)和大模型训练上的经验,正好对这些挑战有用——把云端能力下沉,和上千万设备做协同,这技术活既要深度学*背景,也要懂工程实现。
, t/ ^1 x* @/ q" r& E再说回公司层面,那一连串动作很值得看。4月底开源、5月传GPU集群、6月把硬件生态拉出来秀,这些事证明小米在短时间里想把研究和工程连成链。雷军公开谈研发投入,这是资源承诺,确实会成为吸引人的一部分。对研究者来说,能不能把工作做成产品,靠的是资源、组织和跨部门配合;DeepSeek那边的节奏偏学术、注重发表和指标,小米那边则要把成果迅速工程化,这两种体系对人的要求不太一样。 1 T: w3 v% x% b# W9 |2 l
圈子里对她跳槽的解读也挺多样。一部分人把它看成人才流动的标志,说明大公司越来越看重把技术推向真实场景的能力。另一些人把目光放在小米想做的人车家全生态里:如果底层模型能在不同设备间高效协同,用户体验就会明显提升。她能否补齐小米在大模型工程化上的短板,能否推动MiMo在更多产品线看到实际效果,市场和用户会慢慢给出答案。 ; i* |% p( Y! ~" L+ U
个人细节里还有耐人寻味的地方:北大读研时她高产论文的记录,说明她不是一路顺风,而是在关键时间集中精力突破瓶颈。父母普通职业让她的成长路径看起来更像靠个人努力和选择一步步走出来的,这一点在很多人的职业故事里常见,但放在顶尖AI人才身上就有点不常见了。 3 I6 v$ O. \, B; S
关于她正式公布加入的时间和背景,朋友圈截图显示的是11月中旬的消息。官方没把她的岗位和具体分工全部对外披露,接下来她会参与哪些具体项目,什么时候能在消费者产品上看到她的贡献,这些细节还得继续观察。
+ [! }$ ~% J7 I3 A0 i& Z0 U: B# g( K7 v( W% [+ W
M, G" e- H" `* [+ j |