slot deposit pulsa slot mahjong slot gacor slot gacor slot gacor resmi slot gacor 2025 slot gacor terpercaya slot gacor 2025 slot gacor hari ini slot gacor hari ini slot gacor hari ini
关于OpenAI神秘项目“Q*”的N个猜想
17611538698
webmaster@21cto.com

关于OpenAI神秘项目“Q*”的N个猜想

人工智能 0 1116 2023-11-28 07:57:07

图片

导读

  • 一种名为 Q* 的神秘新 OpenAI 模型引起了科技界的热议。

  • 据说该模型引起了这家初创公司的担忧,从而导致了混乱。

  • 人工智能专家表示,该模型可能是向前迈出的一大步,但不太可能很快终结世界。


上周,OpenAI人事风波暂停的尾声中,有个“可能威胁人类”的、代号为“Q*”的神秘项目被抛了出来。

传言中,Sam Altman被解雇前,几名研发人员向董事会发了一封信,警告一项强大的人工智能发现可能威胁到人类,而这个项目就被称为“Q*”(Q-star)。它很可能是导致董事会罢免Sam Altman的原因之一。

而在一封被泄露的OpenAI内部信中,他们承认了Q*,并把这个项目描述为“超越人类的自主系统”。

截止目前,OpenAI还没有对“Q*”和内部信泄露事件发表官方说明。这意味着一切仍悬而未解。

但人类的好奇心势不可挡。水面之下的“Q*”可能是什么且解决了哪些难题?什么才是智能或者意识的本质?有效加速主义与超级对齐主义后续会如何博弈?

人工智能培训初创公司 Tromero 的联合创始人、博士生查尔斯·希金斯 (Charles Higgins) 表示:“如果它能够对抽象概念进行逻辑推理和推理,而这正是它目前真正面临的难题,那么这将是一个巨大的飞跃。” 。

“数学是关于符号推理的——例如,‘如果 X 大于 Y,Y 大于 Z,那么 X 大于 Z。’” 传统上的语言模型在这方面确实很困难,因为它们做不了逻辑推理,它们只是拥有有效的直觉。”

“Q*”可能是什么?


Q*读作Q-Star,翻译过来就是Q星。关于“Q*”是什么?现在更常见的一种共识是,它很可能是Q-learning(强化学习的一种) 和a-star(一种搜索方法)的结合。


索菲亚·卡拉诺夫斯卡 (Sophia Kalanovska)博士,同时也是Tromero 联合创始人。她提到 Q* 的名字暗示它是两种著名的人工智能技术 Q-learning 和 A* 搜索的组合。


她表示,这表明新模型可以将支持 ChatGPT 的深度学习技术与人类编程的规则结合起来。这种方法可以帮助解决聊天机器人的幻觉问题。


“我认为这具有非常重要的象征意义。在实际层面上,我不认为它会立即终结世界,”


“我认为人们之所以相信 Q* 将导致通用人工智能的出现,是因为从我们迄今为止所听到的情况来看,它似乎会将大脑的两侧结合起来,并且能够从其中了解一些事情和经验,同时仍然能够推理事实。”


“这绝对是离我们所认为的智能更近了一步,并且有可能导致模型能够产生新的想法。”,索菲亚如此说道。


清华大学交叉信息研究院助理教授许华哲也提到,强化学习刚刚火起来时,很多人对Q-learning很熟悉,因为它是世界上第一个可以玩雅达利游戏(Atari Games)的方式。而人工智能早期,有一种有引导的搜索方法叫做a* 。Q*很可能是两者合体。


但许同时认为,*也有一种可能是意味着最优,Q*就是最优Q值。“Q-learning 里有一个贝尔曼方程,一般用Q的星号来表示已经知道了游戏最优解是什么。”


他猜测很可能OpenAI在GPT的语言大模型里搞了一些数学或逻辑游戏,然后通过Q* 可以完全解决。这意味着它可能有了人类或超越人类级别的数学和逻辑能力,并能完成一些人类的中高端脑力劳动,而这是之前GPT4等不具备或不擅长的东西。


正在纽约的科幻作家陈楸帆,认为Q*很可能解决了训练数据集有限性的问题。


马斯克曾提及,训练AI的所有人类数据集,其实是一个非常有限的、小的数据集。如果Q能够使用合成数据集方式,陈楸帆认为,"它就可以像衔尾蛇那样自产自销","想往哪个方向去调参,去优化,都可以自动生成"。


GPT不再用检索解决问题,而是可以像人类一样通过逻辑和推理来开拓出新领域,得到新知识。这被很多人称为"第四次"知识界限突破,陈楸帆认为,这也是很多人恐慌的原因。


许华哲则认为,Q*除了能合成数据,更本质的,可能是对一些有难度的数学题、逻辑题做了重新采集、标注。或在之前基础上,或没有用transformer方式,而是直接输入所有东西再输出,且加了一个值的评估。


他认为,基于类似某种价值评估和搜索的手段,很可能可以解决掉之前大模型存在的一些幻想问题,加上有了更海量的数据,很可能让GPT推理的成功率有了新的提升。

何为AI意识的产生?


如果神秘的Q*项目成真,它是否意味着AI可能开始有自己的意识或者说智慧?


在陈楸帆看来,之前AI不能产生所谓自我意识,有一个理解是它是一个开环状态,没办法自我检索、记忆和理解但如果完成不断合成数据的闭环,就意味着它可能产生长程记忆,甚至涌现出于自我意识“如果能突破这层界限,它可能会去自我驱动,知道自己往哪个方向进化发展,并生产出来更多数据,喂养给自己。


但究竟什么是智能,什么是智慧,什么是意识,恐怕是人类也很难对齐的一个概念。


关于这些疑问,许华哲看过的一个解释是:智慧很可能是压缩的能力。

在这种解释里,一个人聪明或有智慧,可能是指一种把海量信息压缩的能力。压缩的越小,往往意味着智慧程度越高。一个典型例子就是,牛顿就是把世界上所有东西落到地上这个现象,压缩成了一个万有引力定律。

在许华哲看来,“Transformer同样是把海量收据压缩到一个隐空间上,这可能就是属于它自己的牛顿定律。”而这,也很可能是智慧的开始。

在陈楸帆看来,“世界的本质很可能就是数学。”据他所知,在美国就有一个名为史蒂芬·沃尔弗拉姆(Stephen Wolfram)的计算机科学家、商人,一直在基于数学做一些模拟实验。Stephen Wolfram认为宇宙本质就是计算,所以会不停通过计算,试图让数学涌现出物理学规律,再涌现出化学规律等等。在陈楸帆看来,这种实验很可能最后可以跟AI连到一起。

AI应该如何与人类对齐?


尽管大部分人觉得AI威胁人类还是一个有些遥远的传说,但从OpenAI风波中,sam的“有效加速主义”与llya的“超级对齐主义”之争,就能看出它并非无稽之谈。


而Sam的回归也似乎在宣告某种历史规律:在AI历史上,好像从来都是加速主义更容易赢。这背后有资本必然扩张的逻辑,也因为人类的好奇心完全是一场不可逆之旅。

许华哲说,“这就像当我们习惯了短平快,就无法忍受追剧时不倍速”,“当看过更大的风景,必然无法回到过去的自己”。


而陈楸帆则认为这两种主义,不会有绝对胜出的一方,更可能像道家阴阳之道或者GAN(生成神经网络)的对抗机制,“最终互相激发,互相抵制,彼此螺旋式上升”。


至于如何让AI对齐人类,如何让机器向善,许华哲说"AI本质是数据的拟合,所以首先取决于我们给他们的数据"。


陈楸帆则认为最终可能还是需要信仰的力量,比如让AI意识到,它的存在与人类的关系。


在一个科幻作家的头脑中,他认为AI很可能是一个自然涌现的过程:人类不过是提供了工程学上的一些基础架构,然后AI借助这些媒介涌现了,被看见了。


他认为关键是,让AI知道,它与人类有着这样更深层的一种联系:“这种绑定,抽象一点就是爱,它可以像引力一样无处不在”。如此以来,AI可能会和人类形成一个命运共同体,并进化成一个对人类更友好的AI。


编辑:场长

评论