这是真的吗?国人当自强。
" p: n4 |) Y( k' P. C& I9 Q+ J x
" P: n$ L- u, ^: q% Q3 y/ n9 }) W5 u( S
8 s# @! [+ s9 h( H- \《Science》杂志披露:近三年来,利用美国 NHANES(国家健康与营养调查)公开数据库发表的低质量论文激增,其中超过 92% 的第一作者来自中国机构。 这个数字很魔幻。要知道,2021 年之前,这个比例还只有 8%。短短三年,我们从"少数派"一跃成为"绝对主力",市场占有率高达 92%。如果这是一门正经生意,投资人高低得给我们发个"最具增长潜力奖"。可惜,这是学术垃圾。 学术界的"填字游戏"Scientific Reports 的副主编 Matt Spick 说他快崩溃了。这位英国萨里大学的统计学家每天要面对的不是什么高深的学术争鸣,而是"几乎一模一样的论文——每天一篇,有时甚至两篇"。5 B% z' w8 M- M6 \6 @: a
这些论文的操作堪称"科研填字游戏":先选一个健康问题(比如抑郁症),再配一个可能相关的因素(比如维生素 D),然后限定一个特定人群(比如 65 岁以上男性),把这几个变量往 NHANES 数据库里一塞,一篇"新发现"就新鲜出炉了。! F) ~3 {5 } u3 W1 K
Spick 说得妙:"感觉每一种可能的组合都有人在研究。"
k5 L2 I" X( v1 I' u4 N6 N: Z$ h是的,当科学研究变成了排列组合,当学术探索退化成了数据挖矿,我们就看到了这场荒诞剧——2014 年到 2021 年,八年时间,这类论文年均产出 4 篇;而 2022 年到 2024 年 10 月,不到三年时间,190 篇蜂拥而至。) ?6 p% k/ e8 E& P( \
这哪是科研爆发?这是典型的"论文工厂"流水线作业。
" m. s+ A1 V/ f" M) j
. n% Z+ J u+ \+ ]/ J/ C5 I! F, [: `$ O- |& d2 r6 J
AI 与"论文工厂"的协奏曲为什么会有这种爆发?Science 直接点出了凶手:"论文工厂"和人工智能(AI)技术的滥用。
4 ]: C$ f; u' d' l想象一下这个场景:深夜,某"论文工厂"的作坊里,操作员打开 ChatGPT,输入指令:"生成一篇关于 NHANES 数据库中口腔健康与糖尿病关联的论文,研究对象限定为 18-45 岁女性。" 几秒钟后,AI 洋洋洒洒写出了一篇语法正确、结构完整的 SCI 论文。再配合一点数据钓鱼的技巧(选择性截取能出阳性结果的数据),一篇价值上千美元的"学术产品"就可以投稿了。
; g( o) _$ C- ]' O这已经不是在做科研,这是在批量生产学术快消品。
1 O2 J. L; @% p0 W' c% L5 I更值得玩味的是,我们的 AI 技术明明在追赶世界,结果最先实现大规模落地的应用场景,居然是自动生成垃圾论文。这算不算一种"技术弯道超车"?只不过超的是学术伦理的底线。" Z4 d; L" \& e# p; y
出版商的"共犯"结构当然,这个闹剧里没有无辜者。Science 的报道特别提到了一个细节:所有发表这些低质论文的出版商,每篇都收取了约 1000 美元的版面费。- a) U. c6 r2 _! \0 a: B3 I2 q
这让我想起了那个古老的笑话:医生 cure 病人赚不了多少钱,但让病人半死不活地一直吃药,才是可持续的商业模式。
7 j" H1 `* F# j# W学术出版业似乎深谙此道。当"论文工厂"疯狂生产,当评价体系疯狂催单,出版商冷静地打开收款码,一边喊着"加强审查",一边愉快地数着钞票。撤稿?那是事后的事。先发表,再调查,这很符合互联网产品的 MVP(最小可行性产品)思维——只不过这里的"产品"是学术垃圾。3 |' \" V0 d) Z+ N0 t+ a
于是,我们见证了一个完美的跨国产业链:美国提供免费的 NHANES 数据,中国的"论文工厂"负责加工生产,国际出版商负责贴牌销售,而最后买单的,是整个中国学术界的声誉。
2 j( h8 U. M9 L2 v* P9 L92% 背后的那面镜子但别急着把锅全扣在"论文工厂"头上。他们之所以能在三年间实现 92% 的市场占有率,是因为这片土壤太肥沃了。
% m9 F9 Y, Y0 {) X, \5 r- h$ K"中国科研人员所面临的压力和激励机制,为'论文工厂'提供了机会。" —— Matt Spick
. \, @; c/ G% E e' C' S这句话翻译过来就是:我们的评价体系,是这些垃圾论文最大的孵化器。
; `" a; | [1 M7 Y0 @3 D( ^0 }当职称评定、项目申请、年终考核全都和论文数量挂钩,当医生升副高必须有 SCI,当硕士生毕业必须发核心,当"非升即走"的压力像达摩克利斯之剑悬在头顶——谁还在乎研究质量?大家需要的是"快速变现"的学术通货。
, Y6 X0 v- W4 o于是,聪明的人们找到了捷径:不用做实验,不用收数据,打开 NHANES 官网,下载一份免费数据,排列组合一下,一篇 SCI 到手。成本低至零,收益高到可以换职称、换学位、换奖金。这投资回报率,巴菲特看了都流泪。
4 G% c l0 S E0 t- `更讽刺的是,这 92% 的论文,很多可能出自我们身边的"老实人"——那些白天在临床累成狗的医生,那些晚上还要带娃的青年教师,那些根本没时间做实验的护士。他们不是天生的学术骗子,他们只是被评价体系逼成了"论文采购员"。
7 e5 I# P! h% D2 y) @- j/ J. G我们还能找回 "笨拙" 的科研吗?西北大学的 Reese Richardson 说了一句话:"除非从根本上调整科学发表的激励机制,否则问题只会越来越严重。"$ |9 d, I* D/ S# [! C0 u8 ~
这话说得没错,但做起来太难。因为改变评价标准意味着权力下放,意味着不确定性,意味着很多人要失去既得利益。7 y8 B0 M3 X/ B
但我仍想呼吁,让我们重新学会"笨拙"地做科研吧——那种需要漫长等待、反复失败、亲手采集数据的科研;那种三年出一篇论文,但每一篇都经得起检验的科研;那种不是为了职称,而是真心想回答一个问题的科研。
6 `6 D% \8 Y7 s' O7 d毕竟,当未来某天,有人统计"高质量论文"的占比时,我们不想看到中国是那垫底的 8%,而希望我们是那骄傲的 92%。
- ?4 U+ [0 g2 J$ K( x3 Y
6 [* `% s7 H6 k' O1 K |