导读:目前,多家机构禁止ChatGPT生成内容,这包括一些国际AI大会、机器学习大会以及教育机构等。
在今年,多个国际机器学习大会将禁止学术界提交包含由大型语言模型和工具(如 ChatGPT)生成的论文。
自 OpenAI 于 2020 年发布第一个商业系统 GPT-3 以来,基于文本的生成语言模型得到了大幅度改进,并得到了人们的欢迎,很快就开始广泛流行。
目前已经有多种类型的产品可供用户选择,并且能够适应不同的写作风格。一些人开使用它来为学校或工作生成代码或者论文,目前已经有 ICML 等组织明令禁止机器编写的文字稿件。
“禁止发表包含从 ChatGPT 等大规模语言模型 (LLM) 生成文字的论文,除非生成的文本作为论文实验分析的一部分呈现,” ICML 主席在一份声明中这样宣布。
然而,仍有学者们使用人工智能来润色自己的作品,他们将自己的文字输入到模型中,并提示它编辑自己的作品,以改进其文字风格或语法。今年 ICML 会议的学者表示,他们决定禁止 AI 生成的论文提交,以防止剽窃等问题,但该政策并非一成不变,未来可能会发生变化。
此外美国纽约州教育机构已明令禁止学生使用公立学校网络访问 ChatGPT。
“因为担心对学生学习的负面影响以及对内容安全性和准确性的担忧,纽约公立学校的网络与设备在访问 ChatGPT 时将受到限制,”该部门发言人 Jenna Lyle 在一份声明中声明道。
她补充说:“虽然 ChatGPT 工具可能能够为问题提供更快速、更简便的答案,但它不会培养批判性思维和解决问题的能力,而这些对于学生的学业与终身成就至关重要。”
即将来临的封禁ChatGPT风暴
ChatGPT 等语言模型从互联网上抓取海量文字进行训练。它们在大量单词中学习,并挑选常见的模式,根据基于文字说明或提示预测接下来要写什么。这些系统是否剽窃了原创作者,还是值得商榷的,目前还没有证据表明它们直接模仿已有的文章生成大块文字,但它们的输出是基于人们的写作需求。如果它们真的只是复制文字,机器编写的文章是否会受到版权问题的影响?
“比如,一个问题是文本和由大规模生成模型生成的图像,这是否被认为是新颖的或仅仅是现有作品的衍生物。”还有一个关于文字片段、图像或任何媒体的所有权的问题,从这些生成模型中抽样产生的几个角色:拥有它,生成模型的用户,训练模型的开发人员,或生成训练示例的内容创建者,”ICML 负责人这样问道。
“因为我们回答这些问题直接影响审查过程,进而影响我们研究社区成员和他们的职业,我们在考虑这项新技术时必须谨慎和保守。但是,我们没有足够的时间来观察,调查并考虑它对审查和出版过程的影响。为此我们决定今年禁止使用大规模语言模型生成 ICML 论文文本”。
学术界是否决定遵守规则取决于他们。没有任何工具可以有效检测 AI 生成的文本,ICML 只能依靠人们在审查过程中标记可疑论文。机器生成的文本经常存在一些事实错误,使用 AI 撰写论文的作者还需要对其输出进行编辑,有的工作量也不太小。
开发者推出ChatGPT鉴别软件
美国普林斯顿大学计算机科学技术专业的学生 Edward Tian 开发了一款称为 GPTZero 的应用程序,它可以“快速有效地”标记一篇文章是个人原创还是由 ChatGPT 编写的。
在最近的一系列推文中,Tian 提供了正在进行中的 “GPTZero ”的相关示例;该应用确定约翰·麦克菲 (John McPhee) 的《纽约客》文章“参考框架”是由人撰写的,而 LinkedIn 上的帖子是由ChatGPT机器人创建的。
在 Twitter 上,Tian 讲述自己是在假期里开发了这个应用,因为看到使用 AI 剽窃或冒充的案例越来越多,他觉得这件事的价值很大,大批的良好反馈也给他越来越多的鼓励。
1 月 上旬,Tian 在Twitter上表示 GPTZero 无法正常工作。大概是由于网络流量超出预期。Tian 在Substack 时事通讯中表示,超过 20,000 人已经在 Steamlit 上测试了 GPTZero 的公开版本。(GPTZero地址为:gptzero.me,目前Streamlit 版本显示错误,可能是由于流量造成)。Tian 同时表示他又更新了 GPTZero 模型,能够“显着降低误报率并改善输出结果”。
GPTZero 使用“困惑(puzzled)”和“突发性(Burstiness)”来确定一段话是否由ChatGPT机器人编写。困惑表示文本在句子中的随机程度,以及句子的构造方式对应用程序来说是不是相同。Burstiness 是将这些句子相互比较,用以确定它们的相似性。而人类写作有更多的突发性——也就是说,人类会倾向于使用更多的句式变化来创作。
目前,Tian 表示正在对 GPTZero 进行大量更新,包括“改进模型功能,并全面扩展应用程序。”
自从 OpenAI 于 2022 年 11 月 30 日推出ChatGPT以来,很多人对内容剽窃的担忧就层出不穷。在ChatGPT推出后的5天内,有超过一百万人使用了它。
Twitter上网友对ChatGPT的赞赏和未来期许
人工智能驱动的软件可以撰写基础样章,并能模仿知名作家的风格。人们还可以指示 ChatGPT 复制莎士比亚的笔体,或者以纽约客散文家的风格进行写作。虽然在执行过程中也会存在障碍,但结果仍是公认的正确风格。如今,让 AI 写一篇高中英语风格的论文并不难,而且发现它输出的结果与学生写的作业几乎没有区别。也就是说它的功能仍然有限。很容易被人类谜语所迷惑,有的也只是编造的事实。
由于答案错误频出,StackOverflow 还禁止了任何 ChatGPT 生成的编程答案(相关阅读:我是这样用 ChatGPT 解决编码问题的)。
2022 年 12 月,OpenAI 表示将为 ChatGPT 的内容输出“添加水印”,以打击论文剽窃等一系列行为。
作者:场长
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。