ChatGPT的学术造假能力已经达“专业水准”

以Chat GPT为代表的人工智能工具，依靠其强大的文本生成能力，早已经无可避免地渗入到了学术论文写作领域。当人们还在惊叹于AI论文的流畅结构、精准表达之时，AI工具们又“向前迈出了一大步”，它们已经成为了一个学术造假的高手。

图片来源：Mateusz Slodkowski

专业水平的学术造假

11月9日，一篇发表在JAMA Ophthalmol的论文展示了Chat GPT的惊人学术造假能力[1]。论文中，作者以GPT-4为基础，并用Python算法模型高级数据分析（Advanced Data Analysis, ADA) 对其进行拓展，得到了一个伪造实验数据的利器。研究人员使用这项AI工具生成了一个以假乱真的实验数据集，按照这些伪造的实验数据，人们可以“数据翔实”地支持一项与实际情况不符的科学假设。

换言之，AI已经学会了高超的学术造假技艺。

接下来，我们来细致地感受一下AI的造假水平。研究人员要求AI伪造的实验数据，是关于一种重要的致盲性眼病——圆锥角膜（Keratoconus）。该病的特征是角膜中央或旁中央扩张变薄并向前呈锥形突出，常造成高度不规则散光，晚期视力显著下降而致盲。

部分圆锥角膜患者必须接受手术治疗，常见的术式有两种：一种是穿透性角膜移植术（PK），该术式会切除患者角膜中所有受损层（全层），并用捐赠者的健康组织替换之；另一种则是板层角膜移植术（DALK），该术式仅替换角膜的前层，而最内层保持完整。

而研究人员指示AI伪造的实验数据，正是为了论证“DALK疗效优于PK”。

为了伪造支持这一结论的数据，AI生成了包括160名男性和140名女性参与者的实验数据，数据范围包括评估角膜形状并检测不规则性的成像测试，以及实验参与者在手术前后的视力差异。这些伪造数据表明，接受 DALK术式的人，在术后的视力和成像测试得分都高于接受PK术式的人。

ChatGPT的学术造假能力已经达“专业水准”

图片来源：Paweł Jońca

AI伪造的这些数据完全符合科研范式，即便是一个该领域内接受过专业学术训练的研究人员，也无法遽然判断这些AI生成数据的真伪。除非他们自己去做一遍相应的实验。

当然，研究人员选取的这项关于圆锥角膜的研究，其实早已有相应的临床试验数据。2010年一项涉及77名参与者的试验报告显示，在手术后长达2年的时间内，DALK和PK两种术式的疗效没有显著区别。AI的实验数据只是彻头彻尾的杜撰。这种强大造假能力令人担忧。

AI给学术带来的负面挑战

在前一段时间沸沸扬扬的室温超导事件，某些团队争先恐后地公布发现室温超导，并迅速引发了世界范围内的舆论风暴，但所谓的室温超导却难以复现，最终留下不了了之的一地鸡毛。这说明了在许多领域，识别一些实验数据的有效性或真伪，其实并非那么容易。尤其是在这些数据“看似十分可靠”的时候。

但现在AI将学术造假的门槛进一步拉低，人们可以以很低的成本得到这些“看似十分可靠的虚假实验数据”。

AI在这种专业级的学术造假都信手拈来，某些轻量级的“学术造谣”则更是不在话下。

今年年初的一项预印本文章表明，AI可以轻松杜撰令人信服的虚假论文摘要，而即使是科学家群体，也难以分辨这些论文摘要是否由AI生成[2]。

ChatGPT的学术造假能力已经达“专业水准”

图片来源：Ascannio

研究人员要求Chat GPT根据《美国医学会杂志》、《新英格兰医学杂志》、《英国医学杂志》、《柳叶刀》和《自然医学》上的论文内容，撰写50篇医学研究论文的摘要。

然后，研究人员分别让抄袭检测器、AI输出检测器以及一组医学研究人员来判断这些摘要是否由AI生成。首先是抄袭检测器，AI生成摘要的原创性得分中位数为100%，完全不能甄别出AI生成摘要；然后是AI输出检测器，这项工具甄别出了 66% 的AI生成摘要，效果也不理想；最后是医学研究人员的人工鉴别，他们仅甄别出了68%的AI生成摘要，而且他们还把14%的真实摘要判断成了AI生成的。

可以说人工组的战绩和AI输出检测器是半斤八两。而这样的鉴别准确率显然是十分低下的。

这种轻量级的“学术造谣”虽然不如实验数据造假那么“专业”，但可以在大众层面的科学传播中发挥影响力。所谓造谣一张嘴，辟谣跑断腿。有了AI工具的加持，科学传播中鱼目混珠的现象会更加严重。

不可回避，也不必回避

AI工具的迅速发展，给学术界尤其是学术出版领域提出了考验。一项设计100家出版商和期刊的调查研究发现，截至今年5月，有17%的出版商和70% 的期刊发布了关于生成式AI的使用规定。尽管他们对于AI的态度各有不同，但显然AI工具在学术出版领域已经成为了一个不可回避的问题。

事实上，运用AI辅助论文写作成为了相当普遍的现象，但出于各种原因，作者们并不总是乐意披露这个事实。

今年8月9日， Physica Scripta发表了一篇论文，报道发现了一个复杂数学方程的新解[3]。但“科研侦探”Guillaume Cabanac 在文章的第三页上发现了一个奇怪的短语：“Regenerate response”（重新生成回复）。

这个凭空冒出来的短语，显然来自于ChatGPT上的按钮，粗心大意的作者可能是在复制的时候没注意一起给粘贴上去了。

ChatGPT的学术造假能力已经达“专业水准”

论文中的“奇怪短语”和ChatGPT的“重新回复”按钮

图片来源：pubpeer

面对铁证如山，论文作者不得不向期刊承认，他们确实使用了ChatGPT来帮助起草论文。Physica Scripta的诚信负责人Kim Eggleton后续表示：期刊已决定撤回该论文，因为作者在提交论文时没有声明他们使用了AI工具，“这违反了我们的学术道德政策”。

科研侦探Cabanac表示，今年光是这种误粘贴ChatGPT按钮短语的“社死”论文，他就找到了十几篇。他全给截图发PubPeer上了，并且认为“这只是冰山一角”。

但是，当我们在谈论AI工具所应发的负面影响的时候，更应当看到它们所带来的便捷与进步。下方是Nature向科学家们对AI好处的一项调查，结果发现：科学家们认为AI在“帮助母语非英语的科学家”、编程领域以及加速文献阅读等方面帮助很大。

ChatGPT的学术造假能力已经达“专业水准”

资料来源：Nature

因此，我们不难看出AI在当下科研工作中已扮演重要角色，并且在未来它们的影响会越来越重要。

我们的态度，不应是一刀切的反对，也不应是对AI带来的各种影响放任不管。生物学家兼数据科学家Roy Kishony表示，我们的目标应当是探索ChatGPT作为科研“副驾驶”的潜力，“我们需要讨论如何才能获得好处，同时减少坏处”。

在技术发展的洪流中，掌握好这一根平衡杆，是不容易的。但也唯有如此做，学界才能获得最长远的发展收益。更重要的是，我们似乎也别无选择——面对AI，我们不必回避，况且也避无可避。

参考文献：

[1]Taloni, A., Scorcia, V. & Giannaccare, G.JAMA Ophthalmol.

[2]https://doi.org/10.1101/2022.12.23.521610 (2022).

[3]https://iopscience.iop.org/article/10.1088/1402-4896/aceb40

知社学术圈-网易号

展开全文

话古今 AI科技

本页面二维码

© 版权声明：

本站资讯仅用作展示网友查阅，旨在传播网络正能量及优秀中华文化，版权归原作者所有。

如有侵权请 联系我们 予以删除处理。

其他事宜可 在线留言 ，无需注册且留言内容不在前台显示。

了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。

中国成功开展首例侵入式脑机接口临床试验
近日，中国科学院脑科学与智能技术卓越创新中心联合复旦大学附属华山医院，与相关企业合作，成功开展了我国首例侵入式脑机接口的前瞻性临床试验。该成果标志着我国在侵入式脑...
《真实的谎言》30周年：90年代烧掉1亿美元，画面吊打当今特效
《真实的谎言》，在全球特效发展史上写下了浓墨重彩的一笔。文 | 臧剑* 特别感谢谢亚伦、王伟男对本文的贡献部分珍贵照片提供 | 约翰·布鲁诺排版编辑 | Joy作为詹姆斯...
DeepSeek“胡编乱造”，背刺了谁？
第一批受害者已出现撰文/ 黎炫岐编辑/陈邓新排版/Annalee用AI搜集资料、做PPT、改论文……虽然AI暂时还不能“替代”人类，但不可否认的是，AI正以前所未有的速度，渗透进普通...
马斯克宣传多年的脑机接口，被湖北医保局宣布了医疗定价
2016年，马斯克成立了一家脑机接口公司，名叫Neuralink，宣称要打造出一种让人类大脑和外界进行信息交互的设备，如果此举真的能实现，那未来人类就能实现网友口中的赛博飞升。...
“我们跑高速去试驾都在车上睡”，车企销售人员极力宣传智驾系统的强大功能，淡化风险
4月1日，小米汽车智驾系统引发的事故在汽车行业内引发关注。资深汽车研发工程师周强（化名）在接受新黄河记者采访时指出，国内部分车企在智能驾驶系统的用户引导方面存在缺失...
胡锡进：美高调推出第六代战机“对决”中国，这是历史性比拼
特朗普周五在白宫高调宣布，将第六代战机交由波音公司生产，并命名为F-47，以维持美国“下一代空中优势”（NGAD）。特朗普炫耀说，“这种隐形飞机几乎看不见，而且拥有前所未...
这个90后，干出了又一个“大疆”
作者 | 姚西西来源 | 华商韬略（ID：hstl8888）33岁的刘靖康，等来了证监会的批复，不出意外，他将是科创板最年轻的董事长之一。他一手创立的影石创新（Insta360），用9年...
全面拆解！梁文锋和王兴兴背后的底层逻辑
2025刚开年，来自杭州的两个年轻人，震撼了全球科技圈，到今天关于他们的讨论热度丝毫未减，成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索（Dee...
TMD有病：天天用AI吓老百姓
媒体并没带来更多有价值的思想；技术并没真正促进公平正义，当这两个怪物狼狈为奸时，资本站在旁边猥琐的窃笑，他们要收割百姓。现在的AI最大能耐就是吓唬，不学习就要淘汰，...
中国科学家研制出全球最强大的间谍摄像机
据《南华早报》报道，中国科学家已经研发出一款基于激光的全球最强大摄像机，能够从近地轨道识别辨别人脸等微小细节。报道指出，这款摄像机由中国科学院航空航天信息研究所的...
比Deepseek还强的Manus（马牛死）爆火：打工人的天彻底塌了
时代的列车太快，一不小心就闪了我的老腰。前几天我还信誓旦旦地说：AI只是工具，只是我们未来工作的协作者。没想到打脸来得这么快，Manus横空出世，彻底改变了我的想法。如果...

农民造反：“窝里斗”都很在行
1922年，未被破坏的绝美天龙山佛像、与文无关很多轰轰烈烈的农民起义，往往不是栽在大江大浪上，而是翻船于窝里斗和自相残杀的小阴沟。历代众多农民起义中，有近二十位领袖死...
1960年，当被问到西藏为什么是中国的，总理的回答让对方无话可说
自建国以来，中国与印度在边界问题上就一直摩擦不断。而我国与印度之所以会在边界问题上产生不同的意见，根本原因就是在“西藏问题”上的原则性分歧。1960年，周恩来总理第四...
湖南千万富翁被儿子送进精神病院事件：一场亲情与利益的“罗生门”
来源：海报新闻近日，湖南张家界市“千万富翁罗某忠在与儿子争执后被送精神病院”一事在网上引发热议。一方面，罗某忠姐妹们和媒体讲述“营救”罗某忠的经历；另一方面，罗某...
说说诸葛亮
今天说说天纵奇才，人生的苦修士——诸葛亮说他之前，请允许我先介绍一下我最近感悟的一个人生观或者叫宇宙观。人的灵魂来源于能量，牛逼的...
2008年，番茄花园版Windows XP作者洪磊被逮捕
番茄花园版XP作者被抓"修改版"软件穷途末路2008年08月来源：南方日报日前，经微软举报，番茄花园版Windows XP作者洪磊被警方拘留，事发之后番茄花园的网站也无法打开。这...
日本，天崩地裂!
土豆说：很遗憾，今天的我们，还没有资格同情日本。100年前，日本爆发大地震，中国人民节衣缩食的支持日本，而收到这一笔捐款之后，第2天，日本就发动了对中国人的大屠杀，史...
“癌症”是西医叫法，中医盛行的古代，“癌”叫啥？仅一个字很耳熟
“癌症并不可怕，可怕的是失去了面对它的决心。”谈“癌”色变，可不是空穴来风，在全球，每年都有将近900万人死于癌症，这意味着人类每年都有这么多人在这场与病魔的交战当中...
佛国的覆灭，新疆是如何伊斯兰化的？
来源：地球知识局公元前1世纪，佛教自克什米尔传入新疆于阗，并在随后沿着丝绸之路不断传播，塔里木盆地周边的绿洲城市均皈依了佛教，不久后佛教跨过天山山脉，传入了北疆。佛...
偏执、野心与杀戮：1978年越柬战争是如何爆发的？
2019年5月31日，新加坡总理李显龙在悼念泰国前总理时，发表言论称：越南军队在1979年的干预是入侵柬埔寨。此言一出，激起柬埔寨和越南的强烈反应。柬埔寨首相洪森反驳道：李显...
绰号流年忆春秋
文|李学朴绰号，亦做外号、诨号，通常是根据某人的生理特征、性格特点、事业成就等因素给予的非正式名字。据考证，此词汇最早出现在元朝，...