作画AI召唤出数字恶魔，怎么迭代都存在？研究者：没那么玄-我的快乐小窝

——“我想，我从数字领域里召唤出了一个恶魔。”

推特网友Supercomposite为了好玩，利用AI作画工具创造出了一个女人图像，然而之后，不管与多少张图片相结合，如何更改关键词，这个女人总会反复出现，并且越来越血腥可怖。

Supercomposite由此发出了如上感叹。而整件事在社区里越传越广，现在已俨然成了一桩赛博都市传说，无数网友将这个女人称之为“计算机恶魔”、“AI女巫”，甚至纷纷表示要看以她为主角的电影。

而在这一传说的最初缔造者，Supercomposite的记录中，这一“真实的恐怖故事”的全流程又是怎样的呢？

···

“取反义词”诞生的“AI恶魔”

故事开始于今年4月份，国外音乐制作人Supercomposite玩起了AI作画，出于好玩，他在AI作画模型所需的关键词描述部分输入了“Brando::-1”。“Brando”指的是美国电影演员Marlon Brando（马龙·白兰度），而“::-1”在编程语言Python中代表以相反的顺序迭代一个列表，通俗的理解就是取反义词。

在Supercomposite的解释中，这就是反向关键词加权（negative prompt weights）技术，AI会让图像“看起来尽可能不同于关键词”。所以在输入“Brando::-1”之后，AI得到的要求就相当于：创作一副与演员马龙·白兰度相反的图像。

然后，AI吐出了这样一副图像，背景是类似城市剪影的图像，而中心的“GIGITA PNTIGS”字样则是完全无意义的英文字母拼凑。

“如果这个LOGO是马龙·白兰度的‘反义词’，那么再对其取反，是否就能得到演员马龙·白兰度的照片呢？”

Supercomposite这样想，于是他再次输入"DIGITA PNTICS skyline logo::-1" （skyline指城市在天空映衬下的轮廓线，也就是上述图像中的背景，logo则是“DIGITA PNTICS”字样），但得到的却是4张拥有红色高颧骨、酒糟三角鼻，且面容憔悴的中年妇人。

而由于其中生成的一张酷似“专辑封面”的照片上写有“LOAB RSSBOW”的字样，Supercomposite就将这个女人成为“Loab”。

这时的Supercomposite还没有太过在意，他向朋友要来了一张同样由AI创作，但风格较为祥和的图像，关键词描述是“满是天使的超压缩玻璃隧道”。然后将其与LOAB的原始图片结合了起来，并没有给出任何文字描述。

“然后，噩梦来临了。”Supercomposite说。

出于无法解释的原因，AI将Loab与网络世界中的那些血腥恐怖的事物联系了起来，并且几乎所有的迭代图像中都包含一个可识别的女人Loab。

Supercomposite继续将Loab与其他图像“杂交”后得到的二代图像与其他完全不相干的图像杂交，但不管经历过多少代，用多少关键词，Supercomposite都感觉AI吐出的图像里包含着浓浓的“Loab感”：

她可以出现在像是文物油画中的图像中，与星之卡比相结合，在输入阿凡达相关的文本时，那个拥有着标志性酒糟鼻（只是变成了蓝色）的Loab也挥之不去。

实验还在继续，Supercomposite现在已经有了数百张Loab图，并开始同时将之与其他三四张照片结合起来。他发现Loab开始展现出来一些“繁殖”的特性，一些恐怖图像虽然是Loab的后代，但会展现出更抽象的形象，而Loab偶尔也会在迭代中消失，又在几轮结合后再次出现。

“到这里，我已经快疯了。”Supercomposite在推特上写道。

他猜测，Loab是网络空间中的一个“新生岛屿”，人类或许不知道如何用文本去定义或者查询它，但对于AI来说，这是一个非常强有力的语言概念。

···

玄学Or技术？

全流程发布之后，社区一片哗然。

无数网友怀着质疑、兴奋、恐惧等各种心情一拥而上，有人开始实验用AI生成自己的Loab图、有人开始试图解读Loab的人格、有人甚至为她建立了维基百科......

而最初的缔造者Supercomposite目前仍然没有披露自己用的是哪款AI，以及具体的关键词合集，而是不断po出最新的Loab生成图，高强度转发各路相关信息，并扬言“Loab现在还不够真实，但她应该具有人格。”

那么AI到底是如何想的，难道真的以一种人类无法理解的思维方式，对Loab图产生了偏爱吗？

“我认为从技术的角度来说，这一类事情是比较常见的。”

当被问到这个问题时，一位国内AI公司的CEO这样回答，他从两个方向解释：

第一，这位开发者用到的关键技术：反向关键词本质是无序的。因为“马龙·白兰度”是一个人名词语而非形容词，所以并没有反义词，那么AI就只能根据词语周边的相应标签去找反义标签，例如从“影帝”的标签找到其反义词“影后”。所以关键的第一步其实是让计算机去强行解读一个本该没有反义词的词语，最终产生了一个无序状态的随机图像。

第二，让很多人觉得诡异或“无法解释”的情况其实就是一种结果反复出现，而人工智能对此有一个专门的描述 “局部最优解”，就是说在一定范围内是最优解，但是在全局情况下却不是最优解。

而最初随机生成的图像中又有人类主体，又是比较恐怖的画面，给人的情绪刺激最高，因此AI就会赋予它较高的权重，优先保留它的特征值。此后不管是几次迭代，AI肯定会优先提取权重最高的部分。因此一个反复出现的结果，对于AI来说最有可能的情况，就是局部最优解的反复出现。

“可能正好这个局部最优解在大家情绪难以接受的一个点上，类似于机器人的恐怖谷效应，所以大家会觉得恐怖。但实际上局部最优对于AI开发者来说就是一件需要想尽办法去避免的情况，因为实在是太常出现了。”他最后说。

而且，在生成过程中展现出来的“不管迭代几次都出现相同特征”的情况，看似与人类直觉的“经过多轮稀释特征会越来越淡”推断相违背，但实际上对于AI来说，“每次都用相同特征的图去合成”，就是会强化对其的记忆。

“模型时有记忆的，你要把它想象成一个小孩子，你在教他描述事物，”另一位国内安全领域的技术专家表示，“有些模型本来就不擅长绘画人，比如我之前也试过用谷歌的midjourney模型生成画作，也出现了一些奇形怪状的效果。”

图示：也反复出现了“同一结果”

其实，外网也有研究者对此进行了解析，Matthew Skala曾在高维几何学界工作过，他表示：

虽然这些图片是怪异的，但实际上整个事件并不像看起来那么令人惊讶。当用高维几何来考虑时，有一些图像就会倾向于“吸收”那些反向关键词。

而根据Supercomposite自己披露出的关键词以及写法，可以查找到他在midjourney社区中的主页，其中分享的大多数照片，都有与Loab相似的诡异惊悚的风格。

有技术专家对此表示，模型可以看成一颗不断生长的树，算法工程师可以不断剪掉不需要的树枝，保留需要的树枝，从而达到自己需要，或者“想要展现”的效果。

“其实，现在的AI不管用的什么模型，神经网络的大小容量离人脑、婴儿大脑，甚至是黑猩猩都还差得远，至少得有几百万倍，”那位AI公司CEO在最后表示，“所以我认为在量子计算机能够成熟应用之前，AI基本不太可能拥有自己的思维。”

采写：南都见习记者杨博雯

Loab,恶魔,技术,关键词,图像,数字,Brando,女人,prompt,马龙·,原创新闻

相关文章