热帖 - 雪球 ( ) • 2024-05-08 18:55

$特斯拉(TSLA)$ 的算力解决后,其实FSD的更新速度没有加快太多。小版本十天,中版本二十天,但之前也是如此。我之前曾分析,大概率因为瓶颈在于验证,而验证流程不可避免,没想到被马斯克确认了。

最开始我以为验证就是纯现实验证,后来Ashok在电话会议解惑了:先做闭环模拟验证,后做开环现实验证;闭环验证主要是对过去数年积累的“关键事件”做重放,或者可以生成视频来模拟类似情况来做验证(两者都可以加速),而开环验证包括“QA-员工-用户”三个环节需要递进式推送(现实无法加速)。

重要的是,现实验证这个部分非常重要不可省略。我们并不能用模拟来替代现实,因为完美的模拟前提条件是对现实的完美预测,可如果能完美预测现实,最终目标就实现了也就不需要模拟了。因此,我们推导出现实验证是不可省略的。事实上,如今也正式被马斯克确认成了FSD新的瓶颈。

这里有几个关键点很多人可能不知道:

1. 驾驶大多数时间都是“垃圾时间”,就是一些无聊的车道保持之类的。所以辅助驾驶门槛很低,友商谁都能做。随便弄弄,好像也能做出来一个看起来还算能用的产品。

2. 驾驶的难度上限却非常高,最复杂的情况可能人类都无法处理,只能期待传说中的AGI来解决。而这些复杂的罕见情况,分布非常稀疏,普通人可能几天都碰不到一次。

3. 在后期的训练中,只有高难度的、罕见的接管数据才有显著价值,才能够提高模型的能力上限。但随着模型越来越安全,罕见情况的出现频率也将越来越低。

4. 目前虽然FSD自己并不成熟,但“FSD+人类”的数据早就在安全性上超越人类。所以,FSD接管数据的收集效率其实并不高,当前更安全的v12.3.X某种程度上可能雪上加霜,进一步提高了收集难度。而可以预期的是,未来v12.4.X,v12.5.X等版本的收集难度还会进一步加大。

5. 这些“关键事件”的收集、训练、验证,本质上只能靠大规模车队力大砖飞。指数级的能力提升理想情况下会带来车队规模的扩大,从而导致数据量指数级提升,并显著提高“新接管”出现的频率。持续出现的“新接管”数据,才能持续的将FSD的能力带到新的层次。

基于以上5点,因为收集罕见情况的难度太高,我推测解决“验证瓶颈”的成本也过分的高。短期内我们可能很难看见这个问题从根本上解决:只能随着能力一次次的增强,车队也跟着一次次的扩容,从而弥补变得更低的收集效率。

然而,在我看来,这种“高难度”恰恰是FSD、未来的无人车,以及所有现实世界AI产品最重要、最本质的护城河:完美的FSD,可能需要全人类大部分人都加入车队才能实现。 一旦训练出来,人类社会大概率不会想要训练第二个,那将是巨大的资源浪费。即使出于“战略角度”想要训练第二个,难度将比第一个高出数倍。因为用户一旦有了便宜好用的完美FSD,就不会有那么多的耐心陪跑创业公司。他们不会愿意花钱、牺牲安全性来买一个半成品,更不会愿意免费帮企业测试、验证、提升他们的产品。