UFO中文网

 找回密码
 注册会员
查看: 224|回复: 5
收起左侧

资深专家也无法准确分辨出 ChatGPT 生成的科学论文,未来 ...

[复制链接]
online_member 发表于 2023-1-15 19:09:25 | 显示全部楼层 |阅读模式
IT之家 1 月 14 日消息,美国科普杂志《科学美国人》(Scientific American)今天发布文章,表示由 ChatGPT 撰写的科学论文具备非常高的学术性,以至于资深的科学家也无法分辨。


资深专家也无法准确分辨出 ChatGPT 生成的科学论文,未来 ...383 / 作者:在冰雪中的玫瑰 / 帖子ID:104813

图源 Nature
在 12 月下旬发表在  bioRxiv 服务器上的预印论文中写道,人工智能 (AI) 聊天机器人已经具备撰写令人信服的虚假研究论文,以至于科学家们在不仔细甄别的情况下也无法分辨。
英国牛津大学研究技术和监管的 Sandra Wachter 表示:“我对此非常担心。如果连专家都无法甄别论文的真假,那么就会影响我们的研究基石”。
IT之家小课堂:聊天机器人 ChatGPT 会根据用户提示创建逼真且听起来很智能的文本。它是一种“大型语言模型”,一种基于神经网络的系统,通过消化大量现有的人类生成的文本来学习执行任务。位于加利福尼亚州旧金山的软件公司 OpenAI 于 11 月 30 日发布了该工具,并且可以免费使用。
由伊利诺伊州芝加哥市西北大学的 Catherine Gao 领导的小组使用 ChatGPT 生成人工研究论文摘要,以测试科学家是否可以发现它们。研究人员要求聊天机器人根据发表在《美国医学会杂志》(JAMA)、《新英格兰医学杂志》(The New England Journal of Medicine)、《英国医学杂志》(The BMJ)、《柳叶刀》(The Lancet )和《自然医学》(Nature Medicine)上的选集撰写 50 篇医学研究摘要。
然后,他们通过剽窃检测器和 AI 输出检测器将这些摘要与原始摘要进行比较,并要求一组医学研究人员找出捏造的摘要。
ChatGPT 生成的摘要顺利通过了剽窃检查器(plagiarism checker):原创得分中位数为 100%,这表明没有检测到剽窃。
AI 输出检测器发现了 66% 的生成摘要,而人工审核仅正确识别了 68% 的生成摘要和 86% 的真实摘要。专家错误地将 32% 的生成摘要识别为真实摘要,将 14% 的真实摘要识别为生成的。
online_member 发表于 2023-1-15 19:09:55 | 显示全部楼层
问题不大,用魔法对抗魔法即可——你用AI写论文,我就再做一个AI来检验你是否用AI写论文呗。普利斯顿大学已经有研究人员开发出了相应的检测工具:https://gptzero.me/。

资深专家也无法准确分辨出 ChatGPT 生成的科学论文,未来 ...86 / 作者:因为我是真真 / 帖子ID:104813
online_member 发表于 2023-1-15 19:10:16 | 显示全部楼层
确实如此,但总体来看,AI对“创新”没有概念,回答也只是对过去所有论文机械性综述
无法对比评判不同文章创新点、实验可行性,也无法排名,确定不了权重,很难指导科研
online_member 发表于 2023-1-15 19:10:25 | 显示全部楼层
试问ChatGPT可以访问的数据库里什么样的论文最多?当然是灌水论文!
本来论文库中就已经一大半都是这种垃圾,这都不需要ChatGPT加一脚进去了,毕竟好论文哪是那么好写的。
而ChatGPT本就是一个人造的经验系统,它根本不知道什么是好什么是坏,用富含垃圾的样本去训练出来的AI自然也会产出垃圾,这是完全可以预估的。
那么当ChatGPT也开始大量产出灌水论文之后会发生什么?论文库会从一大半垃圾变成几乎全是垃圾,认真地去看论文就显得更彻底地浪费时间。
然而,如果我们把它反过来用的话,情况就会完全不一样了。
我们可以把ChatGPT当作一个灌水论文的筛选器
用大致一样的题目让它再水一篇论文,如果水出来的看起来像模像样,那么这论文要不写的是常识,要不就是灌水,反正价值都不高。
相反,同样的操作之下,如果ChatGPT搞出来的是一堆狗屁不通,而且多次调参都不能好转,那么这论文要么也是狗屁不通,要么就真的有独到见解,有值得一看的价值。
当然,我们也可以把它看作是一种更先进的查重器,只不过这个查重可能就太严苛了,绝大部分人一辈子可能都写不出一两篇能发的论文。
online_member 发表于 2023-1-15 19:11:13 | 显示全部楼层
我觉着这是科研人员的福音啊。
在科学问题设立好的情况下,科研最终要的是证据,然后是论证过程。
chatgpt无法产生证据,而论证过程由人的逻辑来判断,理论上,chatgpt不对论文的基础产生影响。
chatgpt最好的一点就是,帮助那些写作与语言功底不佳,但是科研能力与专研精神强的科研工作者,由chatgpt进行润色,人进行草稿与逻辑修正,可以节省大量的非科研时间,提高科研人员的生产效率。在这一点上绝对是一个十分有意义的事情。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

UFO中文网

GMT+8, 2024-11-23 13:41

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表