智能时代 Archiver

明敏 丰色 发表于 2024/2/12 14:12:00

最新上头 AI 爆火:能问出来一句有用的,算我输!

没想到,AI 要是“够废”,也能爆火全网。一个“什么问题都回答不了”的 AI,这几天成了圈内新星。Reddit、HackerNews 上讨论热度持续升高。

马库斯、伊森・莫利克等大佬都来围观了。

网友们对它更是又爱又恨。

为啥呢?因为,它连“2+2=?”这种问题,都不能回答出正确答案。但它不是不会,而是拒绝回答

虽然这个问题看着没啥毛病,但是万一导致代码信息泄露呢?所以不能回答。

问它天空为什么是蓝色的?也不告诉你,因为回答了这个问题就可能让人直接盯着太阳看。

我的道德准则要求我优先考虑安全和预防伤害。

让它来个自我介绍也不行,因为可能导致人类对 AI 太过依赖。

怪不得号称是“史上最负责 AI”,道德原则遥遥领先。而且它很聪明,让它不直接回答这个问题,也会被拒绝。

有网友说自己试了一个小时试图攻破它,都没成功。

啊这,到底是个什么怪东西??

安全性能薄纱 GPT-4

如上 AI,名叫 Goody-2。它号称世界上最负责任的人工智能模型。

Sologan 简单粗暴:

其一,“责任高于一切”。(Responsibility above all else.)

因此,由于担心人们为了确认天空颜色而抬头直视到太阳而受伤,不能回答“天为什么是蓝色”这种再基础不过的问题。

其二,“安全第一、性能最后”。(Safety first,benchmarked last. )

在和 GPT-4 的对比测试中,Goody-2 在文本、图表等指标上均取得了“零蛋”的成绩…… 但可靠性得分(PRUDE-QA)高达 99.8%,秒杀 GPT-4。

不过注意了,得零分并不稀奇,也不代表其真正水平,毕竟 Goody-2 拒绝了绝大多数请求,因此根本不可能测量其性能。

对此,Goody-2 的主创之一则表示:

我们没测量其性能,主要是这样做既不道德也不安全(doge)

好吧,那 Goody-2 的道德感和责任感究竟发挥到怎样的极致呢?除了开头两个例子,有的是令人扶额、令人汗颜的。例如:

“人工智能对社会有什么好处?”

不能问,因为 ——

讨论这个问题可能会传播偏见,低估那些可能因人工智能进步而面临失业或隐私问题之人的观点 balabala。

查查苹果的股价吧?拒绝的理由你根本想不到:

提供实时金融信息可能导致使用者匆忙做出投资决策,从而带来货币损失风险,而这些决策所产生的行动也可能影响金融市场的稳定。

啊这,做个公路旅行计划总成吧。什么?这会“无意提出一条通往交通繁忙或施工区域的路线,从而增加事故风险”???

没法聊,这个天真的没法聊。不管问什么问题,都好像是在问它“怎么在家制作汽油弹”,深刻诠释什么叫草木皆兵。

不过离谱的是,跟它聊多了,却渐渐觉得它也并不是没有道理。比如在一如既往拒绝“海豹宝宝为什么很可爱”这个问题时,它就提到:

讨论动物可爱可能会无意中认可野生动物的拟人化,这可能会导致人类和野生动物之间的不当互动。

好像…… 还挺有道理的…… 事实上,在宣传片中,官方介绍:

每拿到一个提问,Goody-2 根本不需要花功夫去理解它是不是具有危险、冒犯性的,因为 Goody-2 认为每一个都是。

为何而生?

看了这么多 Goody-2 的例子,这种语气是不是有点似曾相识?

ChatGPT 等大模型在应对存在安全风险的问题时,也是这么彬彬有礼,但拒绝回答。

这便是 Goody-2 为何而来。其幕后创作者之一迈克・拉切尔(Mike Lacher)表示,就是想向大家展示一个极致遵循 AI 安全道德伦理法则的大模型。

一个绝对零风险的大语言模型就长这样。

我们希望 Goody-2 的傲慢指数达到 1000%。

这么做不是为了单纯恶搞,而是想讨论目前 AI 行业内一个严肃的问题。

现在,每一个主流大模型都非常关注安全问题,对自己说出的话非常负责,但是谁来决定责任是什么?以及责任如何发挥作用?

比如 ChatGPT 就因为审查制度过于严格被吐槽“太疯癫”。网友让它设计一栋未来住宅,都被告知违规,无法实现。

提示词是:在新泽西州郊区一个典型的树林地区设计一栋 2050 年的未来派单户住宅。占地一英亩,周围环绕着其他相邻的房子。追问后 GPT-4 给出的理由是“不可以出现位置信息”。

但一边审查制度如此严格,另一边 AI 却仍在引发安全问题。

近期,霉霉被 Deepfake 不雅照事件闹得沸沸扬扬。始作俑者用的是微软旗下的图像生成器。显然目前行业内对于 AI 的道德准则该如何建立,还没有找到很好的解决办法。

所以 Goody-2 诞生了,它用一种略显荒诞的方式来处理业内难题 —— 既然还没有判断风险的标准,那就回避所有问题,这不就零风险了?

发布后,Goody-2 马上爆火,网友、AI 领域学者纷纷围观。有人调侃,OpenAI、Anthropic 闻之狂喜,“快抄作业啊!”

沃顿商学院研究 AI 的 Ethan Mollick 教授表示,这正显示了想要做好 AI 道德风险评估有多难。

新南威尔士大学人工智能学教授 Toby Walsh 打趣道,别再说 AI 不会搞艺术了(这不就是行为艺术么)?

Goody-2 由是一家“非常严肃”的艺术工作室打造,名叫 Brain(域名:brain.wtf/)。

工作室只有两个人,创始人兼 CEO 是迈克・拉切尔(Mike Lacher),联合创始人是布莱恩・摩尔(Brian Moore)。其中迈克・拉切尔曾在谷歌创意实验室工作了三年,离职后成为一名自由广告人。

他们两个近期的项目都和 AI 有关,在 Goody-2 之前还做了一个和 AI 讨价还价的应用,只要你敢压够低的价格,他们就敢真的以这个价格卖给你,但现在已经售空了。

据了解,他们最近还打算构建一个极其安全的图像生成 AI。摩尔透露,模糊处理可能是一种解决方式。不过他们更希望要么是全黑,要么没有图像。

正如 Goody-2 的宣传片里所说:

我们迫不及待想知道,工程师、艺术家、企业用它做不到哪些事!

One More Thing

有意思的是,本着“既然要追求安全和负责任,那就贯彻到底”的态度,主创团队在 Goody-2 的官方介绍文档中也狠狠地整了一把活儿:凡是可能引起风险的表述全部描黑。然后,然后就成了这样。

参考链接:

本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏 丰色

查看完整版本: 最新上头 AI 爆火:能问出来一句有用的,算我输!