背景
2023年2月22日 23:43

ChatGPT完成本科论文?“反ChatGPT”有无对策?

近日,一位B站 up 主分享了仅用 ChatGPT 半小时写成的本科论文,成功通过国内某查重网站检查,查重率不到 9%。然而,这篇论文中的参考文献被发现大多数是“编造”的,实际上并不存在。

据国外 Study.com 网站在今年 1 月向 1000 名 18 岁以上学生发起的调查显示,48% 的学生使用 ChatGPT 完成小测验,53% 的学生使用 ChatGPT 写论文。ChatGPT 在格式论文撰写、通过专业考试等方面表现出色,引起学生们的欢呼和兴奋,但同时也引起了高校和研究机构的担忧和警惕。在学术圈,“反 ChatGPT”正在成为一股新趋势。

近日,香港大学发出内部邮件,禁止在港大的所有课堂、作业和评估中使用ChatGPT或其他AI工具。教师怀疑学生使用ChatGPT或其他AI工具时,可要求学生就其作业进行讨论、进行额外口试及考试等措施。

此外,最近,《暨南学报(哲学社会科学版)》和《天津师范大学学报(基础教育版)》发表声明,暂不接受任何单独或联合署名的使用大型语言模型工具(例如:ChatGPT)的文章。

在美国和欧洲,更多高校和学术期刊等对ChatGPT的封杀通知出现得更早一些。但是,单纯提出“封杀ChatGPT”就能杜绝论文抄袭和剽窃吗?

之前,热门的“AI换脸”应用催生出一批“反AI换脸”的鉴别工具。现在,是否有可行的方法来鉴别ChatGPT生成的论文呢?

针对合成音视频的鉴别技术研发公司瑞莱智慧(RealAI)表示,目前鉴别ChatGPT生成物的难点在于机器与人类撰写的文本差异性特征较少,机器合成文本的结果无论从结构和语义角度都能较好地遵循人类书写的规则。同时,一个真人说话的方式也可能是多变的、结构有误的,因此很难单纯从文本本身就鉴别出是否由ChatGPT生成。目前,RealAI正在开发针对合成文本的鉴别能力,并计划近期推出demo。

数字水印用来“反ChatGPT”是一厢情愿

数字水印技术曾在“反ChatGPT”的技术流中备受热捧,但它真的能用来反制ChatGPT吗?

数字水印是一种用于保护文本、图像、音频和视频等数字内容不受未经授权的复制和分发的技术。通过将一些隐蔽的标识信息嵌入到数字内容中,数字水印可以帮助鉴别数字内容的真实来源和版权信息,而且通常不会对数字内容本身造成影响。

人们提出了两种使用数字水印反制ChatGPT的想法。

一种是将数字水印嵌入到ChatGPT生成的内容中,以标明这些内容是由ChatGPT生成的,从而实现反制。但这需要AI内容生成公司的配合,即他们愿意这么做。Open AI曾表示正在考虑通过对AI系统生成的内容加水印的方法来辅助辨别文本是否出自AI,但目前还没有采取该项行动。即使AI内容生成企业愿意在生成的内容中加入数字水印,但在相关行业专家看来,数字水印只是一种技术手段,不能解决所有的抄袭问题。一些人可能会使用各种方法来删除数字水印,或通过改变单词或句子的顺序来规避数字水印的检测。

AI生成的内容通常基于大量的训练数据和模型参数生成。另一种想法是将数字水印嵌入到内容中,标明版权身份,避免被ChatGPT等AI模型用于训练,从而防止被模仿和抄袭。然而,这种想法多少有些一厢情愿,因为数字水印并不能完全保证内容不会被用于训练模型。一些不法分子可能会使用各种技术手段来尝试删除数字水印,或者通过对文章进行修改来绕过数字水印的检测。此外,一些不道德的人也可能会无视数字水印,盗用版权内容作为训练数据。

“反ChatGPT”这些“神器”或可一用

目前用于检测文章是否由AI生成的工具全球有几款,包括:

OpenAI GPT-3 Playground:由OpenAI开发的一个在线应用程序,用于测试和探索人工智能语言模型GPT-3的功能。在这个应用程序中,可以输入一些文本,并由GPT-3模型自动生成下一句话或者完整的文章。这个应用程序也可以用来测试一篇文章是否是由GPT-3等语言模型生成的。

Grover:由Allen Institute for Artificial Intelligence开发的一个用于检测虚假新闻和伪造的文章的工具。Grover可以分析一篇文章的语言风格和结构,并尝试区分由人类和人工智能生成的文章。这个工具还可以识别一些常见的伪造手段和技巧。

AI21 Writer’s Studio:AI21 Labs开发的一个在线写作工具,可以为用户提供自动建议和编辑服务,帮助他们写出更加流畅和准确的文章。这个工具也可以用于检测一篇文章是否是由人工智能生成的。

Botometer:由Indiana University和University of Southern California联合开发的一个Twitter机器人检测工具。Botometer可以分析一个Twitter账号的活动和行为,判断其是否是由一个真实的用户或者一个自动化机器人管理的。

上述这些工具都可以用于检测一篇文章或论文是否由人工智能生成的,但是需要注意的是,它们都不是百分之百准确的。

因此,在评估一篇文章或论文是否AI所写时,最好结合多种方法和技巧,进行综合分析和判断。

以ChatGPT为例,唐家渝向TechWeb提到,“辩别“ChatGPT”生成物一是利用好查重机制和技术,防止ChatGPT通过改写、总结等方式生成学术文章;二是从内容本身来说,ChatGPT目前还不能完全保证学术文章的逻辑严谨、主题一致,可以从语义层面加以辨别。”

另外,从B站up主分享的ChatGPT写出的本科论文的情况来看,检查文章的来源和背景,如果这篇论文来自一个未知或者不可信的来源,就需要更加谨慎地对它进行评估了。

关于ChatGPT可能引发的论文抄袭现象,前新东方在线 COO潘欣则认为“这种担忧基本不需要。”“没有 ChatGPT 的时候就没有抄论文、抄作业的了吗?可以信一点就行了,能用技术导致出现的问题,一定可以靠技术+行政手段解决掉。”

在学生中普遍存在这样一种看法:使用 ChatGPT 写论文时,其中的数据、论据和引用文献都是乱编的。因此,建议仅让 ChatGPT 提供辅助工作,如论文大纲或大致方向的建议等。

另一些学生则认为需要自律。他们认为:“随着反抄袭软件的陆续上线,算法将会越来越完善。即使现在可以蒙混过关,但被查出来只是时间问题。”