资讯-虎嗅网 ( ) • 2024-05-04 15:20

本文来自微信公众号:极客公园 (ID:geekpark),作者:Moonshot,编辑:靖宇,题图来自:视觉中国

本文介绍了一款名为诗歌相机的AI硬件设备,能够通过拍照生成诗歌的创新产品。

• 💡 诗歌相机内核搭载了树莓派和GPT-4 API,实现了拍照生成诗歌的功能

• 🌟 用户可以DIY制作诗歌相机,开发者提供了详细的制作教程和开源代码

• 🎨 诗歌相机提供了一种新颖的艺术表达方式,突破了人工智能和现实交互的可能

2016 年,由人工智能撰写《电脑写小说的那一天》小说成功通过了日本“星新一文学奖”的初选;Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让他们以为这就是巴赫本人的创作。

如今,人工智能已经能生成真假难辨的视频,极具艺术感的图像。

人工智能正在挑战着文学、音乐、绘画、影视等等这些原本属于艺术创作的领域。当艺术难以成为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被攻克的堡垒

诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以口语的形式流传在文明里。它在形式上考验节奏和韵律,在表达上考验想象和凝练,它需要表达者把经验、观察、意识结合,毕竟诗歌的创作依托于人类特有的通感,因此我们可以让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而无法和人类在当时当刻,设身处地看到独一无二的月亮。

但是,如果 ChatGPT 有了能“看到”月亮的能力,给思考赋予观察呢

基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和开发者鼓捣出了一台设备:让摄影机去“所见”,让人工智能去“所感”,用技术的手段去实现文学里最难以量化的表达。

这就是诗歌相机(Poetry Camera)

一、相机与诗

诗歌相机内核搭载了树莓派,一个只有信用卡大小的微型电脑,得以成像和调取 GPT-4 的 API,这就打通了设备的“眼睛”和“大脑”。

举起诗歌相机,随便拍下一张照片,计算机视觉算法会开始分析视觉数据,人工智能模型开始解释图像,识别图像里关键元素、颜色、环境、影调情绪等信息,生成诗,并且以类似超市收银条的方式打印出来,就好像拍立得“洗”出照片一样。

拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。不看宣传看效果,它能生成怎样的诗歌呢?

有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是:

镜头后面,一人调整视线,

在正方范围里的像素空间。

……

日光透过褪色的薄纱,

他手上,温热的咖啡流转。

对话传出,跨过虚拟的边界,

他的倒影镜像,在屏幕上出现。

书架上,书本倾斜,无声的喋喋不休,

茂盛的植物,是唯一的生命。

戴着眼镜,家成了他平静的面糊,

在这堵墙里,他的世界四散开来。

在 2024 年 4 月的一个清晨,

一种新的常态,悄悄地磨损。

@poetry.camera

不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的“意象感”。诗歌相机的原文更显用词文法上“刻意地精妙”,比如每一段都在押韵脚,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用词上也会采用诗歌用词,比如把 morning 写成 morn,就像中文里把“早上”写成“晨”一样。

另一演示则是对着纽约公共图书馆的天花板拍张照,它会解读并创作出:

“天花板的影子之舞,

如同金镶木,

用春日天空欺骗了眼睛

石碑和木梁下

伫足”

两位开发者表示,由于诗歌相机的开源属性,用户其实可以根据个人喜好更改源代码,重新编程和选择不同的诗歌形式,不局限于现代自由诗,也可以是日本俳句或七言绝句,后续可能会给用户不同大模型去选择,比如从 GPT-4 换到更擅长理解文字和语义的 Claude,或者更擅长写故事的 Dragonfly。

两位开发者表示“只想享受科技的乐趣”|图源:Poetry Camera

而且诗歌相机不会以任何数字方式保存,用户既看不到相机拍到了什么,也不能直接复制粘贴文本,如果想留存一份,只能拿起手机拍下来这一张诗条。因为两位开发者认为,除了技术问题(需要服务器和云平台)、隐私问题之外,诗歌的瞬时性给它增添了额外的意义,打印出来的“诗条”是瞬时捕捉,随机生成,独一无二的实体存在。

在屏幕主宰我们日常生活的当下,诗歌相机这种设计把视觉以诗意用物理的方式呈现,让它在数字之外,增添了一丝模拟化的浪漫气息。

二、你我都能做

“拍下所看到的景观,让相机生成诗歌”这一想法不仅富有创意,似乎看着还挺难实现的?但实际上,你我都可以做出一台诗歌相机。

诗歌相机到现在也还停留在一个“艺术项目”的阶段,两位开发者也暂未有大规模商业化的计划。他们只是产生诗歌相机的想法,鼓捣出了一台能实现想法的硬件,他们所用到的软硬件都是开源的,因此两位开发者选择在网站上把详细的制作过程公开,鼓励更多的用户 DIY 自己的诗歌相机。

诗歌相机的内核是微型卡片计算机树莓派,再附以一些常见配件,再加上树莓派的相机模块、一台迷你热敏打印机、六个电池、一个按钮就够了。

官方把详细的 DIY 教程发到了 GitHub|图源:Poetry Camera GitHub

而诗歌的生成则要对接到 ChatGPT-4 的 API 密钥,在按下快门时,会触发脚本,把采集到的图片发送到 GPT-4 上创建一首诗,最后在热敏收据打印机上打印出来。

两位开发者已经写好了全流程脚本,只要按照他们给的详细步骤逐步设置,不需要会编程和 3D 打印,纸壳里也能造出一台诗歌相机。

如果说乔布斯所信奉的“技术和人文的十字路口”让他造出了极具美感的数码产品,那诗歌相机则是用一种互动形式上的创新,给予我们另一种技术和现实交互的可能,突破界限,创造新的表达形式,甚至进一步反向激发人类的观察和想象。

这也是两位开发者秉持的理念:技术应该融入生活,让我们能更好地欣赏日常,而不是挤压人类的生存空间

联合创始人 Kelin Carolyn Zhan 坦言道诗歌相机的意义所在:“对我来说,这仍然是艺术,它是关于表达的。诗歌相机是一台塑造我们想要看到的世界的工具,这也是一个人们可以把玩新技术的世界:人工智能并不全是厄运和悲观,也不仅仅是用更深、更快、更糟糕的方式模仿人类,而是用新技术创造全新的工具,再让工具再次带出人类内心的孩子。对于这个项目来说,这不是为了赚钱——而是为了让那些天真的奇迹再次成为可能。”

但在创意之外,我们又不得不产生疑惑:GPT-4 生成的诗已经有模有样,那在诗的创作上,超越人类是否只是时间问题?

三、人工智能写的诗,能和人比吗?

当我们站在赏鉴的角度再看诗歌相机的成诗,可以感受到人工智能和诗人作诗上的差异所在,人工智能写的诗有更明显地“描述”和“顺序”,用词上更连贯,比如“日光透过褪色的薄纱”“天花板的影子之舞,”,更像是用文雅的词描述一个场景,其中缺少了诗歌难以描述的抽象感和意象美。

就像诗刊社在《GPT时代,诗歌的意义和价值所在?》里提到的,“GPT 的出现是对文本顺序的改变,它省略了世界与作者的概念,中间加入的是标准化、数字算法,却没法模仿诗歌的意象。

诗人夏宇所写的现代诗|图源:夏宇

诗人欧阳江河也曾在采访里说到“写作背后的广阔性是人的生命、人的世界观。这些包括了生命的感动、生命的升华、生命的伤痛、生命的恐惧、生命的黑暗、生命的爱、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聪明了,它没有疼痛,没有生命的脆弱感和恐惧,而诗歌正是这些的产物。如果没有这样的来源,只剩下漂亮的句子是没有意义的。”

诗不像围棋或公式,诗没有确定的答案,当我们质疑人工智能写诗的能力,我们更多是在质疑它诗的由来

就像在 1982 年的科幻电影《银翼杀手》里,人造人罗伊·巴蒂在死前留下了全片最富有诗歌气息的台词,这意味着人类,至少《银翼杀手》的创作团队相信,在共同经历了对生命的感受之后,人工智能体也能创作出优美且富有人性的诗歌。

回到诗歌相机上,在我们了解这个设备后,并没有感受到一种“被人工智能挑战”的紧迫感,反而是新奇更甚,毕竟当我们触手可及的设备能进行一种艺术的表达时,它也随之解锁了我们看待周遭的一种独特的方式。

就像诗人夏宇在 2023 年与 ChatGPT 合作完成了一册诗集《验证您是人类》,她和 ChatGPT 探讨诗、评论、语言、机器、笑话……最终她在采访里说道“人类至上的人类又在搞机器人,处处代入人的语法人的意图动机人的情感……与ChatGPT的沟通,透过它习得的人类语言,它也学得很快,我还是希望它保留它的机械性不要轻易进入人性。”

与其去较真人工智能和人类在写诗上还有多少差距,甚至产生精神危机感。我们更应该关注,用算法和数据喂饱的人工智能是怎样观察被我们忽视的周遭,它又能否激发出人类的诗性。

本文来自微信公众号:极客公园 (ID:geekpark),作者:Moonshot,编辑:靖宇