优享资讯 | 为什么马斯克说现在的瓶颈在于“验证”？

热帖 - 雪球 ( ) • 2024-05-08 18:55

$特斯拉(TSLA)$ 的算力解决后，其实FSD的更新速度没有加快太多。小版本十天，中版本二十天，但之前也是如此。我之前曾分析，大概率因为瓶颈在于验证，而验证流程不可避免，没想到被马斯克确认了。

最开始我以为验证就是纯现实验证，后来Ashok在电话会议解惑了：先做闭环模拟验证，后做开环现实验证；闭环验证主要是对过去数年积累的“关键事件”做重放，或者可以生成视频来模拟类似情况来做验证（两者都可以加速），而开环验证包括“QA-员工-用户”三个环节需要递进式推送（现实无法加速）。

重要的是，现实验证这个部分非常重要不可省略。我们并不能用模拟来替代现实，因为完美的模拟前提条件是对现实的完美预测，可如果能完美预测现实，最终目标就实现了也就不需要模拟了。因此，我们推导出现实验证是不可省略的。事实上，如今也正式被马斯克确认成了FSD新的瓶颈。

这里有几个关键点很多人可能不知道：

1. 驾驶大多数时间都是“垃圾时间”，就是一些无聊的车道保持之类的。所以辅助驾驶门槛很低，友商谁都能做。随便弄弄，好像也能做出来一个看起来还算能用的产品。

2. 驾驶的难度上限却非常高，最复杂的情况可能人类都无法处理，只能期待传说中的AGI来解决。而这些复杂的罕见情况，分布非常稀疏，普通人可能几天都碰不到一次。

3. 在后期的训练中，只有高难度的、罕见的接管数据才有显著价值，才能够提高模型的能力上限。但随着模型越来越安全，罕见情况的出现频率也将越来越低。

4. 目前虽然FSD自己并不成熟，但“FSD+人类”的数据早就在安全性上超越人类。所以，FSD接管数据的收集效率其实并不高，当前更安全的v12.3.X某种程度上可能雪上加霜，进一步提高了收集难度。而可以预期的是，未来v12.4.X，v12.5.X等版本的收集难度还会进一步加大。

5. 这些“关键事件”的收集、训练、验证，本质上只能靠大规模车队力大砖飞。指数级的能力提升理想情况下会带来车队规模的扩大，从而导致数据量指数级提升，并显著提高“新接管”出现的频率。持续出现的“新接管”数据，才能持续的将FSD的能力带到新的层次。

基于以上5点，因为收集罕见情况的难度太高，我推测解决“验证瓶颈”的成本也过分的高。短期内我们可能很难看见这个问题从根本上解决：只能随着能力一次次的增强，车队也跟着一次次的扩容，从而弥补变得更低的收集效率。

然而，在我看来，这种“高难度”恰恰是FSD、未来的无人车，以及所有现实世界AI产品最重要、最本质的护城河：完美的FSD，可能需要全人类大部分人都加入车队才能实现。一旦训练出来，人类社会大概率不会想要训练第二个，那将是巨大的资源浪费。即使出于“战略角度”想要训练第二个，难度将比第一个高出数倍。因为用户一旦有了便宜好用的完美FSD，就不会有那么多的耐心陪跑创业公司。他们不会愿意花钱、牺牲安全性来买一个半成品，更不会愿意免费帮企业测试、验证、提升他们的产品。