先说下我的猜测和期待吧:
语音助手
可能性:★★★★★ 期待值:★★
目前最主流的猜测就是「语音助手/实时通话」,设定类似于电影 Her 中的 Samantha。
证据1:OpenAI 部署 WebRTC 服务器
证据2:Sam Altman 点赞 Her 推特:
Jim Fan 也做了详细的分析:
但说实话,如果只是语音助手,对我来说很鸡肋,吸引力不够。语音只是一种交互上的体现形式,我想要的还是智能和工具。
更何况,很多人在说 AI Girlfriend 啥的,但 Samantha 这样能提供情感和情绪价值的 AI Girlfriend OpenAI 之前不是在用户协议里明确表示过反对吗?
难道是用户不可以自定义,官方自己来做?反正感觉很奇怪,总觉得和 OpenAI 的风格不一致。
模型能力和 AI 搜索引擎
可能性:★★★ 期待值:★★★★★
虽然 Sam 已经明确说了不是 GPT-5 也不是搜索引擎,但我最期待的还是这俩。
道理很简单,GPT-5 也好,GPT-4.5 也好,只是个版本号,叫不叫那个名字无所谓,只要模型能力足够强就行了。现在的 GPT-4 已经很难和一线模型拉开代际差距了。我还是希望 OpenAI 拿出点真东西了。另一方面就是,之前网传的 gpt-4l 和 gpt2,可能会是 lite 或者新的微调模型。所以我感觉,OpenAI 大概率还是会拿出一个更强的模型来做 benchmark,来巩固自己对 Gemini/Claude 的领先地位。
至于 AI 搜索引擎,之前已经传的有鼻子有眼了,一些人甚至灰度到了新版本的 UI,感觉已经能拿出来了。
AI Agent
可能性:★★ 期待值:★★★★★
前面说我不是太期待语音助手,但我非常期待 AI Agent 的进展。网传 OpenAI 要和苹果合作把 ChatGPT 放进 iPhone 里,那么问题来了,Siri 其实是有很多控制操作系统的权限的,如果 ChatGPT 真的进入 iOS,那么 ChatGPT 会和手机系统嵌入多深?有多少自主运行的权限?
AI Agent 去年火了一段时间,最近的热度感觉还不如 RAG,毕竟 RAG 是真的能落地。但思路和理念肯定是没毛病的,决策、内存、工具、运行,有足够的智能,给予合适的工具和权限,AI Agent 能创造很多想象力,个人非常期待 OpenAI 聊点 Agent 的进展。
放宽内容限制
可能性:★ 期待值:★
现在有一些传言,说 OpenAI 可能会允许 AI 生成色情内容。这个传言其实来自于 OpenAI 新推出的 Model Spec 模型规范[1]。在模型规范中,OpenAI 虽然要求模型不可以输出 NSFW 内容,但同时也明确[2]:
只要遵守我们的使用政策,开发者和用户就应该能够灵活地使用他们认为合适的服务。我们正在探索是否可以通过 API 和 ChatGPT 负责任地提供在适合年龄的环境中生成 NSFW 内容的能力。我们期待更好地了解用户和社会对该领域模型行为的期望。
对此,Sam Altman 在 Reddit 上作了类似的回应:只要不拿去做 DeepFake,他希望能够在合适的情况下提供一些 NSFW 内容。
在进一步的讨论中,也有人建议 OpenAI 加入类似 Google 的 Safe Search,来给予用户是否生成 NSFW 内容的控制权。
不过…这也不可能拿来做一次发布会吧?而且对我来说其实没啥吸引力…
总的来说,我的期待值还是比较高的,毕竟 GPT-4 已经发布整整 14 个月了,在这一年多的时间里,我个人的确感觉 GPT-4 出道即巅峰,Plugin Store 弄了半年就下线了,GPTs Store 说难听点就是个 Prompt Template,Sora 又用不到。
这么说可能有些矛盾,显得当初大吹特吹的技术现在一文不值,但从 GPT-4 断崖式领先,到现在谁都想在 benchmark 上踩一脚 GPT-4,如果 OpenAI 再不拿出点真东西,就说不过去了。
就连 Sam 自己前两天也在 Reddit 上说:ChatGPT 更新时可能会“变蠢”,但他们做出了很多努力,在 lmsys 上,GPT-4-0314(初版 GPT-4)排名第 10,而 GPT-4-Turbo-0409 排名第一;另一个原因就是,我们会很快地适应新技术,进而有更高的期待值。
更何况如果只是些功能性的修修补补,发个推特打个补丁也就过去了。而这次的发布会卡在 Google I/O 开发者大会前一天,我感觉也是故意的,要是没点真东西岂不是自取其辱了。
当然,这些只是我的个人猜测和期待,无可靠信源,一切等六小时后 OpenAI 揭晓。
以上。