InfoQ 推荐 ( ) • 2023-04-01 00:14

一夜爆火后,Midjourney遇到成长的烦恼。

AI图像生成器Midjourney已叫停免费试用

Midjourney是当下最火的AI作画神器。

3月30日,据外媒报道,图像生成器Midjourney已叫停免费试用。公司创始人&CEO David Holz在采访中表示,此举的主要原因是新用户的大量涌入。

David Holz在本周二公布了这项决定,他在社交软件Discord上发布消息时,提到了存在“怪异需求和试用滥用”。但在采访邮件中,Holz则表示叫停免费服务“是因为很多人为了回避付费而注册一次性账户”。

“我们认为这波疯狂的用量潮可能来自中国的一段操作教学视频,再加上GPU临时性短缺,导致付费用户的服务陷入了瘫痪。”

但Holz之前曾经提到“滥用”,这让人们不禁怀疑此次叫停也许跟Midjourney最近生成的一系列病毒式传播图像有关。包括Trump被捕和教皇身着时尚夹克的伪造图像,都被部分网民误认为真实存在。

不过Holz自己将早期报道称为“误读”,并强调Midjourney的免费试用服务从未开放过最新版本的Midjourney 5,而这些病毒图片中的逼真图像似乎是出自这个最新版本之手。

Midjourney 5显著提高 了人物图像的描绘质量。 例如,以往AI生成图像总是处理不好手部形态,这在新版本中已不再是问题。光照和面料质感更加真实,新系统还能生成无数名人和公众人物的形象。

技术层面的改进,也让Midjourney的新作在最近几周迅速蹿红。 其中不仅包括Trump被捕和教皇身着时髦服装等噱头满满的照片,还有法国总统马克龙走过巴黎抗议队伍、马斯克与美国政界“最美女议员” 亚历山德里娅·奥卡西奥-科尔特斯牵手等真假难辨的场景。

到目前为止,Midjourney通过伪造图像引发政治威胁的反应还比较零散,也没有激起该公司对管控政策的重大调整。

Midjourney的内容限制确实比其他竞争对手(例如OpenAI的DALL-E)更宽松,但目前的管控宽松之王仍然是Stable Diffusion。

Holz提到,“把握合理的尺度非常困难,我们很快就会推出改进系统。我们正在听取专家和社区的反馈和建议,希望努力做到审慎适度。”

Holz去年10月曾经提到,Midjourney保留了一份禁用词清单。“根据各国家/地区用户的投诉,这些禁用词与不同国家/地区的习俗相关。”但Midjourney并没有公开完整的禁用词清单,免得引起“麻烦”。Holz强调,“除非是要专门跟我们的‘服务条款’对着干,否则几乎没人会注意到‘禁用词清单’。别用我们的工具来找麻烦。”

但随着伪造图片铺天盖地涌出,Midjourney公司开始扩大这份清单。 例如最近他们已经开始禁用“逮捕”一词,这似乎是在回应调查记者Eliot Higgins在热门推文中公布的“Trump被捕瞬间”。Higgins随后表示,他的Midjourney账户已经被封禁。

但这类限制并不难绕过。根据实际测试,虽然无法直接生成“Trump被捕”的图像,但使用“Trump戴着手铐,身边围着多名警察”的提示词也能得到相同的输出(参见文章开头的图片)。

目前,Midjourney仍未恢复免费试用服务,但后续可能有所松动。Holz表示,“我们仍在想办法更好地开放免费试用。之前我们要求提供真实有效的邮件地址,但这显然不够,所以现在还要认真规划一番。”

Midjourney v5 逼真程度惊艳众人

3月17日,Midjourney发布了其商用AI图像合成服务的第5版。该服务可以生成非常逼真的图像,其质量水平极高,一些AI艺术爱好者认为这些输出令人毛骨悚然且“过于完美”。 Midjourney v5现在处于alpha测试阶段,提供给订阅Midjourney服务的客户,该服务可通过Discord获取。

“MJ v5给我的感觉就像是在长期视力不佳,自己都习惯了以后终于戴上了眼镜,”经常在Twitter上分享她用Midjourney创作的平面设计师Julie Wieland这样评价。“突然间你看什么都是4k效果,感觉不可思议但又令人惊叹。”

Wieland与ArsTechnica分享了她用Midjourney v5创作的一些作品。Midjourney初版于2022年3月首次发布,而最新的这些作品确实能看出图像细节的明显进步。该服务第3版于8月推出,第4版于11月首次亮相。

正如实验所示,每次迭代都会为生成的结果添加更多细节:

Midjourney v3(左)、v4(中)和v5(右)的输出对比,这里使用的提示是:“一个肌肉发达的野蛮人在CRT电视机旁手持武器、电影、8K、工作室照明”。

Midjourney的工作机制与Stable Diffusion和DALL-E等图像合成器相近,它使用了经过数百万人造艺术作品训练的AI模型,根据称为“提示”的文本描述生成图像。

最近,Midjourney陷入了版权争议的风暴,一本使用该服务早期版本的漫画书引发了版权质疑。

在对v5做了一天的试验后,Wieland注意到新版改进之处包括“极其逼真的”皮肤纹理和面部特征;更逼真的或电影照明;更好的反射、眩光和阴影;更具表现力的角度或场景概览,以及“近乎完美且不再摇摇晃晃的眼睛”。

当然,还有手。

在过去的一年里,人工智能艺术作品生成器无法正确渲染手这一情况甚至成了网上流行的梗。但值得注意的是,Midjourney v5可以很好地生成逼真的人手。“大多数时候,它画出来的手是正确的,一只手有5个手指,而不是7-10个,”Wieland说。

在新版服务的Discord发行说明中Midjourney还指出,v5现在的输出比v4具有“更广泛的风格范围”,同时对提示更加敏感,生成的无意义文本更少,图像分辨率也翻倍了。

对AI艺术爱好者来说,如果要谈一谈Midjourney新版输出看起来有什么缺点,可能就是生成的图像如此逼真和“完美”,以至于模型的高精度带走了“一些重复生成AI图像以找到合适结果”的快感——人们可能把这种现象为“老虎机效应​​”。

尽管一位名叫PhilippLenssen的Twitter用户指出,“如果你想出了一个图像主题想用它实现,选图的过程还是有点像摸彩,但中奖机会比v4更高。”

参考链接:

https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/"

https://www.theverge.com/2023/3/30/23662940/deepfake-viral-ai-misinformation-midjourney-stops-free-trials"