Sora 无法替代人类，亚马逊工程师断言：实际工作冲突不可能靠 AI 解决

Aeneas 发表于 2024/2/27 12:45:24

Sora 无法替代人类，亚马逊工程师断言：实际工作冲突不可能靠 AI 解决

新智元报道

编辑：Aeneas

【新智元导读】Sora 一出，让很多人心生恐惧：饭碗彻底被砸了！这位亚马逊工程师却告诉我们：真的不必担心生成式 AI 会抢人类的饭碗，顶多担心一下你的人类同行吧。

这一周，OpenAI 视频 AI 工具 Sora 一出现，可谓是炸翻了天。「饭碗保不住了」的恐惧，真实地击中了许多人。

不过，亚马逊的一位工程师 Cameron Gould 则认为，其实并不必对 AI 如此惧怕，它并不会导致我们失去工作。

为什么？原因如下。

Prompt 的自相矛盾

首先，生成式 AI 应用在创意内容时，生成的一般是图像、视频以及一般的非虚构内容。

给一个生成式 AI 模型 prompt，就像照看一个恶毒的孩子，他的唯一目标，就是通过「从字面上理解你所说的一切」来惹恼你。

你必须用词准确，不能在不重要的细节上浪费一个字符，因为这可能就会使结果向完全不同的方向倾斜。但是同时，你又需要提供尽可能多的详细信息，让模型不会误解你。这种自相矛盾的操作，简直太糟糕了！

跟计算机进行单向对话，试图理解它为什么没能产生自己想要的结果，能让人产生一种连续 3 小时撞墙的冲动……

Gould 表示，在自己作为软件工程师的职业生涯中，其实已经习惯了和计算机的这种单向对话，但生成式 AI 给他的体验，绝对更糟。

它不是一种可预测的编程语言，拥有幂等的函数。

它完全是一个黑匣子，几乎每次都可以在相同的输入下，产生完全不同的结果。即使在 prompt 里要求 AI 要保持一致性，它也未必会听你的。

市值数十亿的公司，就曾受到这一现实的困扰。最近，加拿大一家法庭裁定，加拿大航空公司必须向其中一名乘客支付赔偿金，因为聊天机器人提供了误导性建议，导致该乘客为机票支付了近一倍的费用。

速度确实快，但……

当然，尽管在一致性方面存在缺陷，但生成式 AI 可以帮我们快速产出东西来。

比如上面这张图，就是用生成式 AI 创建的，只花了几秒钟就做出来了。所以，AI 可以让我们比艺术家出图的速度更快，这件事是有可能的。

而 Sora 也让普罗大众就可以用比以往快许多倍的方式，生成更复杂的媒体素材。所以，由于现在一个人可以做几个人的工作，我们真的不需要那么多的艺术家、软件工程师、撰稿人了吗？

不，它的细节不对

答案并没有那么简单。使用生成式 AI 创作艺术时，可能你时常会想：「不，这不是我想要的。」这也是在论坛上常常出现的观点。

有人会反驳说：这是因为你的 prompt 缺乏细节，你需要给出更具体的 prompt。这个观点确实有道理。

我们自己的图片和票房收入超过 1 亿美元的专业电影，有何不同？我们自己的个人博客，和专业的全职作家的博客，有何不同？我们自己做的游戏视频标题，和 30 小时的 AAA 视频游戏标题，有何不同？

答案就是细节。

AI 生图

正是细节，将业余爱好者和专业人士区分开。

如果想使用生成式 AI 来创作与专业内容一样令人印象深刻的作品，我们将需要一个包含大量细节的提示。此外，还需要大量的试验和错误，才能让模型产生我们想要的东西。

生成式 AI 只是一种工具，类似于自动完成、编译器、拼写检查器或任何其他辅助工具。它不会为你做任何工作，除非是它自己的苦差事。

AI 生图

让我们回到 Sora 的例子。

它只能生成无声的视频。其中没有音频，没有对话，没有一个对象可以说话，或者发出声音。

但如果我们想用它拍电影，就需要用它 ——

生成脚本？
阅读剧本？
生成视频以配合脚本？

究竟是现代电影的哪些方面，让电影变得有趣呢？突然间，我们就需要集成一堆不同的生成式 AI 工具，才能完成工作。

当然，OpenAI 有一个名为 Jukebox 的音乐生成工具，它可以在视频中添加音乐，但却无法添加对话。

在一段视频中，该如何添加对话呢？这项任务听起来太艰巨了。我们不仅需要生成一个特定场景的视频，还需要让场景中角色的嘴部动作和台词保持一致。此外，视频生成器还需要知道单词是怎样说出的。不仅仅是语气，还有节奏。

想象一下，要解决全部这些细节，需要多大的人力才能解决？

细节，变得相当困难。在每一个步骤的每一个级别上，都有大量会影响实质性后果的细节。

Gould 表示，自己最近读到一篇非常喜欢的博文《现实拥有惊人的细节量》。

现实的细节是无限的，然而 AI 模型的 token 却是有限的。

它只能带你走这么远，之后，我们就需要依靠其他人来完成工作。

目前为止，人类仍然做着最繁重的工作。

殖民宇宙的一些重要细节

更少的细节，更多的变化

专注于细节，听起来实在是太累了。如果让你保持简单，会发生什么呢？如果你只需要提供很短的描述，只用几分钟就可以写出来？

最终，你会得到多样化的结果，大部分与你的想法完全不一致。你需要在成百甚至上千个结果中，才能找到你想要的那一个，因为 prompt 太通用了。你可能永远都找不到一个能用的结果。

如果 prompt 太简单，模型天马行空的想象力，会提供无限的排列供你选择。比如输入这个 prompt——「一个男人」，你会得到各式各样的男人。

但实际上，我想要的是一个蓝头发、棕色眼睛、留着小胡子、穿着一件黑色夹克、戴着兜帽的男人。

如果只输入「一个男人」作为提示，需要多长的时间才能找到确切的输出呢？

深度和广度之间有一个平衡点，你可以最大限度地减少你的努力。这就需要对细节进行大量批判性思考，并进行大量搜索。

AI 不会取代我们

所以，为什么说 AI 不会取代我们？因为，企业并不是为了解决生成图像、视频剪辑这类小问题而存在的。企业是为利益相关者解决更大型、更复杂的问题。

解决这些问题最困难的部分，就是后勤工作。解决大型、复杂的问题需要一大群问题解决者的时间和精力，而所有这些问题解决者又需要由其他问题解决者组织起来，以保持事情的进展。

如果随机抓来两个人，让他们自我管理、自我组织工作，很可能他们的标准和时间表会不一致。如果你要让他们一起工作，你就得设立标准，让他们在同样的时间工作，并且产生相同质量的结果。

凝聚力是一种力量，你需要做一些工作，让独立的单位保持一致。一个团队单独运行，可以顺利完成任务；但是当我们把多个团队引入单个环境中时，就会出现很多冲突。

多个相互依赖的团队朝着一个目标努力时，需要一定的凝聚力，才能完成有意义的事。

这项「凝聚力」工作其实很复杂，经常需要解决人际冲突，而这些冲突通常是不合逻辑的、情绪化的。

显然，AI 无法解决这种类型的冲突。

总结来说就是 ——

企业通过为很多人 / 企业解决大问题来赚钱
大问题很难解决，因为涉及很多团队
我们需要精心策划如何统筹这些团队，来解决人际冲突，并保持凝聚力
在解决人际冲突方面，人是最可靠的资源

很显然，机器人根本无法胜任这些工作，它们的表现会很糟糕。

AI 不会抢走你的工作

当我们仔细看一下目前生成式 AI 的现状，这个事实是显而易见的 —— 目前没有任何方法，可以让工作自动化。

提示界面和模型缺乏自主性和批判性思维，导致了关键的局限性。没错，生成式 AI 的确可以让我们提高工作效率，但也就仅此而已。

这句话已经被越来越多人所赞同：AI 不会抢走你的工作。真正会对你造成威胁的，是会比你更熟练地使用 AI 工具的人。

生成式 AI 是帮助你加快速度的绝佳资源，但它不会完全自动化你的工作。你要做的，就是把它们添加到你的工具箱，熟练地掌握它们。

参考资料：

https://www.camggould.com/posts/The-AI-Endgame/

本文来自微信公众号：新智元（ID：AI_era）

智能时代 Archiver