以Chat GPT为代表的人工智能工具,依靠其强大的文本生成能力,早已经无可避免地渗入到了学术论文写作领域。当人们还在惊叹于AI论文的流畅结构、精准表达之时,AI工具们又“向前迈出了一大步”,它们已经成为了一个学术造假的高手。
图片来源:Mateusz Slodkowski
专业水平的学术造假
11月9日,一篇发表在JAMA Ophthalmol的论文展示了Chat GPT的惊人学术造假能力[1]。论文中,作者以GPT-4为基础,并用Python算法模型高级数据分析(Advanced Data Analysis, ADA) 对其进行拓展,得到了一个伪造实验数据的利器。研究人员使用这项AI工具生成了一个以假乱真的实验数据集,按照这些伪造的实验数据,人们可以“数据翔实”地支持一项与实际情况不符的科学假设。
换言之,AI已经学会了高超的学术造假技艺。
接下来,我们来细致地感受一下AI的造假水平。研究人员要求AI伪造的实验数据,是关于一种重要的致盲性眼病——圆锥角膜(Keratoconus)。该病的特征是角膜中央或旁中央扩张变薄并向前呈锥形突出,常造成高度不规则散光,晚期视力显著下降而致盲。
部分圆锥角膜患者必须接受手术治疗,常见的术式有两种:一种是穿透性角膜移植术(PK),该术式会切除患者角膜中所有受损层(全层),并用捐赠者的健康组织替换之;另一种则是板层角膜移植术(DALK),该术式仅替换角膜的前层,而最内层保持完整。
而研究人员指示AI伪造的实验数据,正是为了论证“DALK疗效优于PK”。
为了伪造支持这一结论的数据,AI生成了包括160名男性和140名女性参与者的实验数据,数据范围包括评估角膜形状并检测不规则性的成像测试,以及实验参与者在手术前后的视力差异。这些伪造数据表明,接受 DALK术式的人,在术后的视力和成像测试得分都高于接受PK术式的人。
图片来源:Paweł Jońca
AI伪造的这些数据完全符合科研范式,即便是一个该领域内接受过专业学术训练的研究人员,也无法遽然判断这些AI生成数据的真伪。除非他们自己去做一遍相应的实验。
当然,研究人员选取的这项关于圆锥角膜的研究,其实早已有相应的临床试验数据。2010年一项涉及77名参与者的试验报告显示,在手术后长达2年的时间内,DALK和PK两种术式的疗效没有显著区别。AI的实验数据只是彻头彻尾的杜撰。这种强大造假能力令人担忧。
AI给学术带来的负面挑战
在前一段时间沸沸扬扬的室温超导事件,某些团队争先恐后地公布发现室温超导,并迅速引发了世界范围内的舆论风暴,但所谓的室温超导却难以复现,最终留下不了了之的一地鸡毛。这说明了在许多领域,识别一些实验数据的有效性或真伪,其实并非那么容易。尤其是在这些数据“看似十分可靠”的时候。
但现在AI将学术造假的门槛进一步拉低,人们可以以很低的成本得到这些“看似十分可靠的虚假实验数据”。
AI在这种专业级的学术造假都信手拈来,某些轻量级的“学术造谣”则更是不在话下。
今年年初的一项预印本文章表明,AI可以轻松杜撰令人信服的虚假论文摘要,而即使是科学家群体,也难以分辨这些论文摘要是否由AI生成[2]。
图片来源:Ascannio
研究人员要求Chat GPT根据《美国医学会杂志》 、《新英格兰医学杂志》、 《英国医学杂志》、《柳叶刀》和《自然医学》上的论文内容,撰写50篇医学研究论文的摘要。
然后,研究人员分别让抄袭检测器、AI输出检测器以及一组医学研究人员来判断这些摘要是否由AI生成。首先是抄袭检测器,AI生成摘要的原创性得分中位数为100%,完全不能甄别出AI生成摘要;然后是AI输出检测器,这项工具甄别出了 66% 的AI生成摘要,效果也不理想;最后是医学研究人员的人工鉴别,他们仅甄别出了68%的AI生成摘要,而且他们还把14%的真实摘要判断成了AI生成的。
可以说人工组的战绩和AI输出检测器是半斤八两。而这样的鉴别准确率显然是十分低下的。
这种轻量级的“学术造谣”虽然不如实验数据造假那么“专业”,但可以在大众层面的科学传播中发挥影响力。所谓造谣一张嘴,辟谣跑断腿。有了AI工具的加持,科学传播中鱼目混珠的现象会更加严重。
不可回避,也不必回避
AI工具的迅速发展,给学术界尤其是学术出版领域提出了考验。一项设计100家出版商和期刊的调查研究发现,截至今年5月,有17%的出版商和70% 的期刊发布了关于生成式AI的使用规定。尽管他们对于AI的态度各有不同,但显然AI工具在学术出版领域已经成为了一个不可回避的问题。
事实上,运用AI辅助论文写作成为了相当普遍的现象,但出于各种原因,作者们并不总是乐意披露这个事实。
今年8月9日, Physica Scripta发表了一篇论文,报道发现了一个复杂数学方程的新解[3]。但“科研侦探”Guillaume Cabanac 在文章的第三页上发现了一个奇怪的短语:“Regenerate response”(重新生成回复)。
这个凭空冒出来的短语,显然来自于ChatGPT上的按钮,粗心大意的作者可能是在复制的时候没注意一起给粘贴上去了。
论文中的“奇怪短语”和ChatGPT的“重新回复”按钮
图片来源:pubpeer
面对铁证如山,论文作者不得不向期刊承认,他们确实使用了ChatGPT来帮助起草论文。Physica Scripta的诚信负责人Kim Eggleton后续表示:期刊已决定撤回该论文,因为作者在提交论文时没有声明他们使用了AI工具,“这违反了我们的学术道德政策”。
科研侦探Cabanac表示,今年光是这种误粘贴ChatGPT按钮短语的“社死”论文,他就找到了十几篇。他全给截图发PubPeer上了,并且认为“这只是冰山一角”。
但是,当我们在谈论AI工具所应发的负面影响的时候,更应当看到它们所带来的便捷与进步。下方是Nature向科学家们对AI好处的一项调查,结果发现:科学家们认为AI在“帮助母语非英语的科学家”、编程领域以及加速文献阅读等方面帮助很大。
资料来源:Nature
因此,我们不难看出AI在当下科研工作中已扮演重要角色,并且在未来它们的影响会越来越重要。
我们的态度,不应是一刀切的反对,也不应是对AI带来的各种影响放任不管。生物学家兼数据科学家Roy Kishony表示,我们的目标应当是探索ChatGPT作为科研“副驾驶”的潜力,“我们需要讨论如何才能获得好处,同时减少坏处”。
在技术发展的洪流中,掌握好这一根平衡杆,是不容易的。但也唯有如此做,学界才能获得最长远的发展收益。更重要的是,我们似乎也别无选择——面对AI,我们不必回避,况且也避无可避。
参考文献:
[1]Taloni, A., Scorcia, V. & Giannaccare, G.JAMA Ophthalmol.
[2]https://doi.org/10.1101/2022.12.23.521610 (2022).
[3]https://iopscience.iop.org/article/10.1088/1402-4896/aceb40
知社学术圈-网易号
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
DeepSeek仿照崔颢的《黄鹤楼》写了一首七律,李白读后都会震惊
DeepSeek仿照《黄鹤楼》写了一首七律,是所有AI诗中水平最高的崔颢的《黄鹤楼》闻名遐迩,是流传千古的名篇,在很多诗词排行榜中都位居榜首,至少能进入前十。唐朝崔颢的《黄... -
凤凰卫视专访王兴兴:从200块到7万亿美元市场,宇树科技改变世界的逆袭之路
据凤凰卫视报道,从低空经济的新兴崛起,到大型智能制造的精密工艺;从智能机器人的奇妙世界,到无人驾驶的未来出行、新能源材料创新的无限可能,每周二晚7:30,锁定凤凰卫视... - 美国造“大家伙”的能力越来越堪忧了,不光有波折不断波音,还有人造工业产品中“最大的大家伙”——船。虽然美国跑遍全球的航母依然威风,但最近的一个新闻,毫无疑问暴露了...
- 2025刚开年,来自杭州的两个年轻人,震撼了全球科技圈,到今天关于他们的讨论热度丝毫未减,成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索(Dee...
- 壹公元752年,撒马尔罕的造纸坊里,一个杜姓老人,已经习惯了当战俘的日子。只是偶尔在打水浸泡树皮的时候,他才会想到,一年之前的早上,他在怛罗斯河畔清洗盔甲时,水也是一...
-
《哪吒2》第一版敖光长的不咋地!饺子导演也后怕:幸好听了网友建议
《哪吒2》不负众望,票房过百亿了!每个角色都有自己的弧光,熠熠生辉的群像,让每个观众都找到了共情点。这也是影片大获成功的一个原因吧!其中敖丙亲爹敖光,硬是凭借自己的... - 上着上着班,公司没了。春节假期之后,纵目科技的员工回去上班,不仅老板没了,领导们也没了。放假前,老板唐锐跟员工们说,“我是美国国籍,买张机票就能走,但还是要留下来...
-
七款国产AI大模型:Kimi,智谱清言,通义千问,文心一言,豆包,天工AI,讯飞,各自的优缺点是什么?
随着GPT的问世以来,国内的大大模型也开始呈现喷井式的爆发,而其中最具有代表性的莫过于“Kimi,智谱清言,通义千问,文心一言,豆包,天工AI,讯飞”这几家大模型遥遥领先。... -
被流量鸦片摧毁的中国小老板:从年入百万到负债直播,谁在吸食他们的最后一滴血?
2024年初的一天,在杭州四季青服装市场的地下仓库,37岁的服装店主张伟对着手机嘶吼:"家人们三二一上链接!",屏幕显示在线人数7人。这已是他连续第89天熬夜直播,喉咙带着血... - 越来越多人关注到,开发DeepSeek的AI公司深度求索、开发现象级国产游戏《黑神话:悟空》的公司游戏科学,都来自浙江杭州。不仅如此,这两家企业,与开发春晚扭秧歌机器人的宇...
-
2025年1月28日的春节晚会,全国观众见证了一场炫技式的表演:16位机器人演员整齐划一地扭秧歌、转手绢、最后把手绢抛向台下。编排过程中,春晚导演组一度因为时长问题,想要删...
-
1960年,当被问到西藏为什么是中国的,总理的回答让对方无话可说
自建国以来,中国与印度在边界问题上就一直摩擦不断。而我国与印度之所以会在边界问题上产生不同的意见,根本原因就是在“西藏问题”上的原则性分歧。1960年,周恩来总理第四... -
说到三国时代后期的蜀汉与东吴挑大梁的人,蜀汉非诸葛亮莫属,东吴非陆逊莫属。陆逊出生于公元183年,诸葛亮出生于公元181年,诸葛亮比陆逊...
-
向来勇猛的林彪,为何始终反对出兵朝鲜,邓小平一语道破他的心思
1950年,朝鲜战争爆发,这原本只是一场民族内战,可因为美国的缘故,硬生生将中国卷入了这场争端。这仗是非打不可了。毛主席一下子就想到了林彪,无论是从才能还是资历上来讲... -
2004年,大学生马加爵连杀4位同窗独放过1人,被枪毙后父亲觉得丢脸拒领骨灰
就因为一次打牌吵架,我决定了走上这条路。现在我以一个旁观者的身份看,这是多么荒谬,多么无知啊!这是多么地悲哀,多么地残酷啊!(马加爵遗书)“317寝室怎么这么臭。”“... -
最近一段时间,以色列因为耶路撒冷的事情又被很多人拉进了视线内。生灵涂炭的战争造成了巨大数字的平民百姓伤亡,然而以色列在中国却被人刻意的洗白。在网络上关于以色列对中...
-
墨西哥:曾惨遭美国肢解,戕害世界罪行累累——起底美国军事霸权
戕害世界罪行累累——起底美国军事霸权“这个国家是通过残忍无情、毁坏灵魂的战争建立起来的。认清了这一点,才能理解美国的过去与当下。”德国历史学家霍尔格·霍克在《... - 冀南梨花鼓 名角代代传韩伟:上一回听过了沧州大地的故事,感受了木板大鼓的魅力。在河北的最南边还有一个传奇的剧种,要问它到底怎么个好法,当地的老乡说了——“到苏州不...
-
要说在我国从古至今,都有一个非常特别的行当。这个行当,入门门槛极高,利润极大,风险也一样巨大,同时危害也相当恐怖,它就是造伪钞。贯穿我国货币发展史,与我国货币发展...
- 编者按:当张国焘从王明的口中获悉李特、黄超被处决的消息,精神受到极大的震动。王明奉共产国际的指示从苏联启程回到延安后,俨然以钦差大臣和中共领袖自居。张国焘挨过王明...
-
红军史上曾经把一次重大失败列为悬案,进行数十年追查。这次失败,不仅丢失一省之地,就连省委书记都生死不明、不知所踪。丢失的这一省之地,现在大家肯定也都没听过:闽赣省...