就在前不久,《科学》(Science)系列期刊抛出一枚重磅炸弹:规定允许在论文的「方法」章节说明后,正当地采用生成式人工智能(AI)和大型语言模型制作插图、撰写论文内容。这意味着 Science 及旗下子刊颠覆了先前于 2023 年 1 月所设定的铁律 —— 严禁任何 AI 工具生成的内容包括文本、数字和图像出现在论文中,同时将 AI 程序列入作者行列亦被视为篡改图像和抄袭等严重学术不正当行为。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:science 官网

AI 写作从「学术不端」摇身一变,成为合法工具,实在让科研人费解。不过从全球范围内来看,这类纠结的「禁令」,还不少出现。

去年开始,各大期刊也陆续发布了对 AI 写作的要求,但还是以保守态度为主。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:丁香园

态度各异,科研人员面临「规则迷宫」

而就在 Science 改变立场之后,中华医学杂志社却再次重申了严格的 GenAI(也就是常见的 AI)使用规范:明确指出 GenAI 由于不具备基本的作者属性和责任承担能力,不能作为论文署名作者

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:中华医学杂志社

一个顶刊封杀 AI 又解封,随即国内权威期刊再次下发 AI 禁令,科研人无一不迷糊。

其实,「反复横跳」的规则变化,可能离不开最近两年频繁被曝光的「AI 论文乌龙事件」。无论是图像描绘还是文字撰写,AI 已然悄无声息地渗透进论文创作的各个环节。

信任危机,AI 论文频出乌龙遭撤稿

早在去年 8 月,就出现了「忘记删除 AI 提示语」的可笑论文问题。一篇收录于《Physica Scripta》期刊上的论文,提出了一种复杂数学方程的全新解决方案。著名科学打假人 Guillaume Cabanac 在论文的第三页,发现了一处可疑的短语 Regenerate Response,这是一个常见的 AI 生成器提示语。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:论文截图

而这一次乌龙事件,并没有引起科研人员的警惕,反而让 AI 论文愈演愈烈。

2024 年刚开始不久,国内便也传出科研圈「AI 笑话」。2  月  17  日,国内一研究团队在 《Surfaces and Interfaces》发表论文,而在介绍部分,开篇第一句就让常用 AI 的科研人倍感熟悉:「当然,以下是您的主题的一个备选引言.......

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:论文截图

随即,今年 3 月,《Radiology Case Reports 》在线发表的一篇病例报告与文献回顾的文章也明显地暴露了 AI 工具的痕迹:「总之,处理双侧医源性 …… 我很抱歉,由于我是个 AI 语言模型,我没有获取实时信息或特定病人资料的能力」。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:论文截图

以上低级失误,真实让人哭笑不得。AI 写论文本就是一个敏感的话题,即使各大期刊禁止后又解封,但是在文中没有明确「声明」的前提下,直接粘贴上 AI 的回复,足以让一个科研人在圈内「名誉扫地」。
除了这种谜底写在谜面儿上的乌龙事件,今年还爆出了因 AI 绘画不专业,出现「4 个睾丸小鼠」插图的国内基础研究。该研究成为 3 天就被撤稿的超短命论文。文章中的配图由人工智能(AI)生成,除了刚提到的畸形老鼠,还有「充满拼写错误的信号通路图」、「形似香肠番茄披萨的特征描述图」。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:论文截图

不过种种论文事件,也让众多明眼人,产生疑问:配有如此「奇葩」的图像,这篇文章为何能够成功发表在 5.5 分期刊上呢?此外,这么多直接标记了 AI 回复语的论文,为什么还能「逃过」 专业审稿人的眼睛,得以顺利发表呢?

AI 论文真伪难辨?学术公平如何判定

AI 论文铺天盖地,网友纷纷吃瓜吐槽。一篇丁香园推文下面的网友回复,点出了 AI 论文事件背后的一个巨大的问题 —— 除了这些明显的例子外,是否真的有工具让审稿人检测这些文章、图片来源于 AI,以确保学术的公平公正以及科学性?

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:丁香园公众号

答案是:有点困难。

最近美国南佛罗里达大学的一项研究表明,AI 生成的文字内容,可能已经无法与人类写的区分开来。

Science 重磅!旗下期刊允许论文使用 AI 写作,国内却再发严格禁令-期刊+
图源:论文截图

该研究邀请了 72 位顶级语言学期刊的专家,要求他们来审查各种类型的文章摘要,但即使是这样的专业人士,也很难确定,究竟哪些摘要是人写的?哪些是 AI 写的?

研究发现,即使是语言学专家,也会有 62% 的可能性被 AI 骗到。甚至 13% 的专家在这项研究中,一个都没猜对。

总的来说,虽然技术与专家,暂时无法准确检测论文是否完全由 AI 撰写,但全球学术界已经开始要求透明化 AI 的使用,确保科研诚信的同时鼓励合理利用 AI 工具为科学研究服务。换言之 「AI 是无法避免的,但是大家要公开使用方式,以确保学术公正性」。

而在这样的背景下,科研人员还是需要花些心思,学习下如何在遵循规范的前提下有效结合 AI 工具开展研究工作。比如:查论文、整理数据、整理资料等等。以免真正 AI 政策下发后,手忙脚乱,被同行赶超~

参考资料:

  • https://mp.weixinbridge.com/mp/wapredirect?url = https%3A%2F%2Fwww.science.org%2Fcontent%2Fblog-post%2Fchange-policy-use-generative-ai-and-large-language-models&action = appmsg_redirect&uin = MTYyOTAxNzk4MQ%3D%3D&biz = MzA5NDkzNjIwMg ==&mid = 2651757821&idx = 1&type = 1&scene = 0
  • Bader R, Imam A, Alnees M, et al. Successful management of an Iatrogenic portal vein and hepatic artery injury in a 4-month-old female patient: A case report and literature review. Radiology Case Reports. 2024;19(6):2106-11.
  • https://pubpeer.com/publications/F93A8D69350BC6B12AB48B132161A7
  • Cabanac G, Labbé C, Magazinov A. The'Problematic Paper Screener'automatically selects suspect publications for post-publication (re) assessment. arXiv e-prints. 2022:arXiv-2210.Faulds J, Johner A, Klass D, et al. Hepatic artery transection reconstructed with splenic artery transposition graft. Perspect Vasc Surg Endovasc Ther. 2012;24(2):87-9. doi: 10.1177/1531003512454580
  • Zhang M, Wu L, Yang T, et al. The three-dimensional porous mesh structure of Cu-based metal-organic-framework-aramid cellulose separator enhances the electrochemical performance of lithium metal anode batteries. Surfaces and Interfaces. 2024:104081.
  • https://pubpeer.com/publications/CAABBF887348FB2D1C0329E0A27BE6
  • https://scienceintegritydigest.com/2024/02/15/the-rat-with-the-big-balls-and-enormous-penis-how-frontiers-published-a-paper-with-botched-ai-generated-images/
  • https://doi.org/10.3389/fcell.2023.1339390

编辑:苍术

投稿合作:jiangjiahui@dxy.cn