About this episode
今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨,他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即:仿真与合成数据。 今天的具身智能尚且没有找到scaling law的有效配方,其中,数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅1%,合成数据挑起大梁。 今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。 02:00 开始的快问快答 02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real的gap、合成数据 04:31 从Cruise到英伟达到蔚来,怎么做合成数据和仿真? 14:11 制作合成数据的具体流程?合成数据与真实数据的配比? 16:17 在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键) 32:41 物理的Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点? 46:18 Physical Intelligence(π)对仿真与合成数据的两难态度 48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang 53:57 合成数据目前面临的瓶颈 55:25 全球具身智能产业链Mapping: 硬件公司(宇树) 基座模型公司(π、Skild、英伟达和DeepMind) 在垂域落地的软硬结合公司(Figure,特斯拉Optimas、The Bot Company) 以仿真为中心做端到端落地的公司(光轮) (“特斯拉Optimas的管理文化和π完全不一样”) 01:09:22 美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做“大脑” 01:15:33 老黄在内部说:NV is a simulation company 01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性) 01:23:28 具身智能的产业还在GPT-1阶段,还没找到scaling law的配方 01:28:21 我创业刚开始,从具身的本科开始学起 01:37:37 最后的快问快答 【机器人专场】 逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA” 和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象