资深专家也无法准确分辨出 ChatGPT 生成的科学论文，未来 ...

在冰雪中的玫瑰 · 发表于 2023-1-15 19:09:25

IT之家 1 月 14 日消息，美国科普杂志《科学美国人》（Scientific American）今天发布文章，表示由 ChatGPT 撰写的科学论文具备非常高的学术性，以至于资深的科学家也无法分辨。

资深专家也无法准确分辨出 ChatGPT 生成的科学论文，未来 ...162 / 作者:在冰雪中的玫瑰 / 帖子ID:104813

资深专家也无法准确分辨出 ChatGPT 生成的科学论文，未来 ...162 / 作者:在冰雪中的玫瑰 / 帖子ID:104813

图源 Nature
在 12 月下旬发表在 bioRxiv 服务器上的预印论文中写道，人工智能 (AI) 聊天机器人已经具备撰写令人信服的虚假研究论文，以至于科学家们在不仔细甄别的情况下也无法分辨。
英国牛津大学研究技术和监管的 Sandra Wachter 表示：“我对此非常担心。如果连专家都无法甄别论文的真假，那么就会影响我们的研究基石”。
IT之家小课堂：聊天机器人 ChatGPT 会根据用户提示创建逼真且听起来很智能的文本。它是一种“大型语言模型”，一种基于神经网络的系统，通过消化大量现有的人类生成的文本来学习执行任务。位于加利福尼亚州旧金山的软件公司 OpenAI 于 11 月 30 日发布了该工具，并且可以免费使用。
由伊利诺伊州芝加哥市西北大学的 Catherine Gao 领导的小组使用 ChatGPT 生成人工研究论文摘要，以测试科学家是否可以发现它们。研究人员要求聊天机器人根据发表在《美国医学会杂志》（JAMA）、《新英格兰医学杂志》（The New England Journal of Medicine）、《英国医学杂志》（The BMJ）、《柳叶刀》（The Lancet ）和《自然医学》（Nature Medicine）上的选集撰写 50 篇医学研究摘要。
然后，他们通过剽窃检测器和 AI 输出检测器将这些摘要与原始摘要进行比较，并要求一组医学研究人员找出捏造的摘要。
ChatGPT 生成的摘要顺利通过了剽窃检查器（plagiarism checker）：原创得分中位数为 100%，这表明没有检测到剽窃。
AI 输出检测器发现了 66% 的生成摘要，而人工审核仅正确识别了 68% 的生成摘要和 86% 的真实摘要。专家错误地将 32% 的生成摘要识别为真实摘要，将 14% 的真实摘要识别为生成的。

因为我是真真 · 发表于 2023-1-15 19:09:55

问题不大，用魔法对抗魔法即可——你用AI写论文，我就再做一个AI来检验你是否用AI写论文呗。普利斯顿大学已经有研究人员开发出了相应的检测工具：https://gptzero.me/。

资深专家也无法准确分辨出 ChatGPT 生成的科学论文，未来 ...833 / 作者:因为我是真真 / 帖子ID:104813

资深专家也无法准确分辨出 ChatGPT 生成的科学论文，未来 ...833 / 作者:因为我是真真 / 帖子ID:104813

春和景明820 · 发表于 2023-1-15 19:10:16

确实如此，但总体来看，AI对“创新”没有概念，回答也只是对过去所有论文机械性综述
无法对比评判不同文章创新点、实验可行性，也无法排名，确定不了权重，很难指导科研

手机哈哈 · 发表于 2023-1-15 19:10:25

试问ChatGPT可以访问的数据库里什么样的论文最多？当然是灌水论文！
本来论文库中就已经一大半都是这种垃圾，这都不需要ChatGPT加一脚进去了，毕竟好论文哪是那么好写的。
而ChatGPT本就是一个人造的经验系统，它根本不知道什么是好什么是坏，用富含垃圾的样本去训练出来的AI自然也会产出垃圾，这是完全可以预估的。
那么当ChatGPT也开始大量产出灌水论文之后会发生什么？论文库会从一大半垃圾变成几乎全是垃圾，认真地去看论文就显得更彻底地浪费时间。
然而，如果我们把它反过来用的话，情况就会完全不一样了。
我们可以把ChatGPT当作一个灌水论文的筛选器！
用大致一样的题目让它再水一篇论文，如果水出来的看起来像模像样，那么这论文要不写的是常识，要不就是灌水，反正价值都不高。
相反，同样的操作之下，如果ChatGPT搞出来的是一堆狗屁不通，而且多次调参都不能好转，那么这论文要么也是狗屁不通，要么就真的有独到见解，有值得一看的价值。
当然，我们也可以把它看作是一种更先进的查重器，只不过这个查重可能就太严苛了，绝大部分人一辈子可能都写不出一两篇能发的论文。

清一色糊了餐 · 发表于 2023-1-15 19:11:13

我觉着这是科研人员的福音啊。
在科学问题设立好的情况下，科研最终要的是证据，然后是论证过程。
chatgpt无法产生证据，而论证过程由人的逻辑来判断，理论上，chatgpt不对论文的基础产生影响。
chatgpt最好的一点就是，帮助那些写作与语言功底不佳，但是科研能力与专研精神强的科研工作者，由chatgpt进行润色，人进行草稿与逻辑修正，可以节省大量的非科研时间，提高科研人员的生产效率。在这一点上绝对是一个十分有意义的事情。

		自动登录	找回密码
密码			注册会员