发布时间:2022-08-18 18:37
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
自 OpenAI 推出具有 1750 亿参数的 AI 文本生成模型 GPT-3 后,这两年它便开始在各种不同的领域内“大显身手”:写小说、编剧本、敲代码、与人聊天、设计网页……被许多人称作迄今为止最“全能”的 AI 模型。
然而,随着 GPT-3 的应用范围愈发广泛,一位瑞典 AI 研究人员 Almira Osmanovic Thunström (以下简称 Almira)突然意识到:“尽管在 GPT-3 的帮助下,已经有很多关于 GPT-3 的学术论文了,但我找不到任何一篇将 GPT-3 列为第一作者的文章。”
由此 Almira 决定,帮助向来只是“辅助”的 GPT-3 上一次位:让 GPT-3 写一篇关于它自己的学术论文,当一次一作。
其实最初,Almira 不过是随便试试而已,并没有抱什么期待。某天 Almira 登录 OpenAI 账户,向 GPT-3 输入了一条简单指令:写一篇关于 GPT-3 的 500 字学术论文,并在文中添加科学参考文献和引文。
结果,GPT-3 生成的文章令 Almira 感到意外:这是用学术语言编写的新颖内容,在文中合适的地方也准确引用了有充分根据的参考资料。“它看起来就像对一本相当不错的科学出版物的内容介绍,”Almira 感慨道:“而实际上这是算法所写的。”
出于被这篇 GPT-3 生成的文章所惊艳,Almira 开始思考是否可以将 GPT-3 所作的论文提交给同行评审的期刊。她预想到了这可能会引起一系列有关出版的伦理和法律问题以及关于非人类作者身份的哲学争论,但 Almira 认为随着 GPT-3 的应用范围不断扩大,未来学术出版可能不得不适应一些 AI 驱动的稿件。
为此,Almira 与其研究小组的负责人共同决定:让 GPT-3 自己完整地写出一篇学术论文,再尝试以 GPT-3 的名义进行发表。
一般来说,人们在发表有关 GPT-3 生成的文章时,都会测试产生多个版本,然后摘录其中最好也最接近人类写作水平的部分——但 Almira 不。
“我们会给这个程序一些提示,促使它像对待一篇学术论文一样,写出创建介绍、方法、结果和讨论的部分,但也会尽可能地减少干扰。”Almira 补充道:“我们只使用 GPT-3 的第一次(最多第三次)迭代,我们也不会编辑或挑选最好的部分,这样才能更真实地看到它的效果如何。”
关于论文主题,Almira 决定让 GPT-3 写一篇关于它自己的论文,主要原因有两个:
首先,GPT-3 还算是一个比较新的选题,关于它的研究还很少,可以此检测 GPT-3 在资料数据量较少的情况下其写作的准确性如何。
其次,AI 犯错不可避免,本次实验目的不是想将 AI 生成的错误信息进行出版,只是错误将会是写论文的实验命令中的一部分。Almira 他们想证明,GPT-3 犯错与它撰写跟自己相关的论文之间并不矛盾。