17611538698
webmaster@21cto.com

Edward Tian:反 ChatGPT 的勇士

技术人生 0 1267 2023-02-01 03:41:17

导读:针对于ChatGPT的反面作用越来越多,一位华裔青年推出一款反Chat GTP工具。


当许多人还在新年中宿醉时,一个年仅 22 岁的学生正在狂热地开发一款新应用程序,用来防止滥用一种名为 ChatGPT 的强大新型人工智能工具。

当机器人开始破坏了他的网站,这个名叫 Edward Tian 的学生还在熟睡中。紧接着,一个个私信和警告信息充满了他的计算机与移动设备。

这位是普林斯顿大学在读 22 岁的大四学生,为华裔加拿大籍人氏,住在加拿大多伦多,据推断中文应该姓田,但具体中文名字尚不得知。

他在本地的一家咖啡和花店中度过了寒假,在这个假期中他创作并完成了第一版本的反ChatGPT工具—— GPTZero。

图片

GPTZero 首页|GPTZero

据他的宣传,这款应用程序能够“快速有效地”判断一篇文章是由人类,还是由 OpenAI 的 ChatGPT 撰写的。

当他将GPTZero上传到应用创建和托管平台 Streamlit 时,他自己也没想到它会受到如此多人的关注。

图片

“我原本以为最多只有几十个人试用这个应用程序,突然之间,用户数量开始疯狂暴长,几个小时内就有超过 2000 人注册了GPTZero的测试版。”

GPTZero 的流量暴涨,用户使用频繁,甚至导致托管它的云平台崩溃。Tian 说道:“我很震惊,它像爆炸了一样,又像病毒一样传播开来。”

连他最初发布在Twitter上的推文,宣传该应用程序可以“快速有效地”检测一篇文章是否由人工智能撰写,也获得了超过 700 万的浏览量以及大量跟贴。

图片

OpenAI 于 2022 年 11 月 30 日发布 ChatGPT ,它向世界释放了一个数字潘多拉魔盒,而搜索引擎的垄断将从此被打破,竞价和搜索排名模式将可能被颠覆。

而现实社会的每个人——从高中教师到大学教授再到记者,都担心强大的人工智能聊天机器人会开启一个由机器人生成的论文和文章的时代,有些人称之为“ AIgiarism ”。

一些学校的教育工作者已经开始举告他们的学生使用 ChatGPT 来创作论文,并完成作业的例子。

ChatGPT 服务被学生们用于从编码到健身的方方面面,甚至在理论考试中用来作弊。

图片

虽然 OpenAI 表示计划实施“水印”以验证某些内容是否由 ChatGPT 创建,但仍然在以“识别文本并非易事”的解决方案延迟,确实,自己制造矛和盾并不容易——而ChatGTP可能会给教育和新闻业带来冲击。

攻读计算机科学与新闻学双学位的Edward Tian 对聊天机器人带来的道德困境以及他所说的大型语言模型(如 ChatGPT)的“黑匣子”性质感到深深地困扰。

ChatGPT模型的不透明性导致人们从本质上产生误解,从而去误用或滥用它。

“当文字不是人类写的时,人类应该有权知道。”

— Edward Tian,普林斯顿大学

由此,尽管Tian 即将大学毕业,面对着论文等紧急重要的事,他决定利用最后一个寒假来开发一个实用工具,帮助人们找出一篇文章是否是由机器人撰写的。

“当文字不是人类写的时候,人类应该有权知道,”Tian说。“最近围绕 ChatGPT 和 AI 生成的炒作信息太多了,人类有必要应该知道真相。”

于是,便有了Tian开发的识别ChatGPT等机器创作文本的GPTZero。


Tian 亦坦言,他在使用免费开源的 GPT-2 来帮助训练他的应用程序,以达到这个指标。


GPTZero 使用两种不同的指标来评估文本是否由机器人编写:困惑性(Perplexity)与突发性(Burstiness),并分别对其打分,根据统计学特征来确定,文本是由人工智能写的还是人类写的。

总体来说,如果这两项参数得分都很低的话,那么该文本很有可能出自 AI 之手。


这里指的困惑性,是指来自人类所写作品的语言的复杂性和随机性。这个指标主要是衡量文本在一个句子中的随机程度,以及一个句子的构造方式是否会让 GPTZero 感到困惑。每当用户在 GPTZero 输入一段测试内容,它就会分别计算出:文字总困惑度、所有句子的平均困惑度、每个句子的困惑度。


这些数值越低,越能说明这个文本对 GPTZero 来说是非常熟悉的,那么它很可能是 AI 生成的;相反,如果这些数值越高,就越能说明文本中句子的构造或用词方式让 GPTZero 感到惊讶,那么它就更可能是出自人类之手。


这是因为,人工智能接受过数据库的训练,生成的文本在一段时间内,表现出的困惑度会更均匀与恒定,选词的可预测性也更高;而人类书写的文本则不会这样,真人的遣词造句一般会比较随机,比机器更容易写比较出乎意料的词句来。


 图片

使用 GPTZero 检测文字是否由 ChatGPT 生成

而突发性,则是指来自人类使用的句子结构的变化。这个参数主要是比较句子复杂性的变化程度,衡量它们的一致性。


因为人类倾向于写高度复杂的文本;而人工智能机器人产出的文本以低复杂度居多;此外,由于人类的思维结构不是线性的,他们的句子结构也遵循类似的模式。


这意味着,人类使用句子结构,会在长而复杂的句子,在短而简单的句子之间摇摆不定,有着更多的句式变化,比如复杂和简单交替并存,一个长难句之后接着出现更简短的句子;而机器生成的句子则倾向于更加统一,很少会有一系列长度相差很大的句子。


简言之,在选词上简单而熟悉,并使用统一整齐的句子,是人工智能生成作品的标志特征,而更复杂和多样的东西,则表明是人类写的。这便是“困惑性”和“突发性”这两项指标可以作为衡量标准的原因。


“计算机永远也不能吸收人类散文式的优美品质,”Tian如此解释道。作为一名新闻专业的学生,他从美国作家约翰·麦克菲 (John McPhee) 的课堂上受到启发,后者教会了他关于人类写作的美好品质。


Tian认为他学习的另一个学科新闻学也是一样,新闻的核心价值观是寻找真相。AI技术很擅长复述它们知道的事情,但它们并不能发现真相,而且也无法做事实核查、报告等事情——收集它们的训练数据中不存在的新信息。

ChatGTP们做不到的事情太多了。因为归根结底,这些通用模型并没有提出任何原创的东西。它们看到了它们所知道的,然后在大量的内容中反省。


Tian 使用 McPhee 在《纽约客》中发表的一篇文章,作为 GPTZero 演示的一部分:

图片

Tian也承认他的机器人GPTZero并非万无一失,正如一些用户在测试时所报告的那样。他说,他仍在努力提高模型的准确性。


尽管开发了GPTZero这个工具,但 Tian 并不反对人工智能。他认为,如果以合乎道德的方式使用并征得用户同意才好。他甚至使用了像 CoPilot 这样的人工智能应用来“支持自己的大部分编码工作”。

“我不反对在有意义的时候使用 AI 写作,”他说。


随着围绕 ChatGPT 的炒作与恐惧,像 Tian 开发的GPTZero工具可能在各个领域都非常有用,从想要查阅学生是否抄袭论文的教育工作者到想要检查求职信是否真的由申请人写的人事专员等。


“计算机可以但永远写不出人类散文的优美品质。

— Edward Tian

“就在这几天,一群风投不断向我的Twitter私信,”Tian 说道。其中包括 A16Z、Menlo Ventures 和 Red Swan 等知名风险投资公司,他们可能了解这里面可以含有的大量价值与利润。

但他觉得还没有完成 GPTZero,想进一步改进和开发该应用程序,他甚至计划通过“解释器和检测方法”扩大其透明度。


归根结底,Edward Tian是一名大学四年级学生。他的期末考试迫在眉睫,需要担心家庭作业和人工作文。现在,这比数字潘多拉魔盒或 VC 投资者更关心。

他说:“我最开始是想支持各地的新人英语教师。我会接所有的电话,”他笑着说,“但现在,我只是一个专注于毕业的大学生。”


据称,Edward Tian 是中国清华大学某资深电气工程师的孙子,距离在普林斯顿大学完成计算机科学和新闻学双学位还有几个月。

评论