About this episode
2026年,人形机器人将迎来规模化量产的元年。最清晰的信号来自特斯拉,“金色擎天柱”Optimus Gen 3预计在2026年第一季度亮相,并计划在年底前建成产能高达100万台的生产线。马斯克曾多次表示,特斯拉未来约80%的价值来自这里,而非汽车。而“擎天柱”的攻关关键,正在于它的“手与前臂”。 本期是我们 机器人特辑 之灵巧手,我们邀请了灵巧手模型算法方面和硬件方面的两位专家,一起聊聊灵巧手不同技术路线的特点,以及它在数据和算法上面临的挑战。 嘉宾们认为,对灵巧手头部公司来说,短期内针对单项任务打造成功一个的Demo并不难,真正的突破在于通用性与可扩展性。当算法能让机器人在短时间内学会开可乐、开门、拧螺丝等多样化的灵巧操作,才意味着灵巧手到达了类似ChatGPT的泛化突破阶段。 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 齐浩之,亚马逊&前Meta机器人研究科学家,芝加哥大学助理教授 陶一伟,TetherIA 创始人兼CEO,前Tesla Optimus高级机器人机械工程师 【本期口播由腾讯广告算法大赛赞助播出】 我们播客7月份做过腾讯广告算法大赛的招募,这场比赛在11月27日刚收尾,吸引了全球8400名技术人才、2800多支队伍参加。在这次比赛中,年轻人在用各种新方法解决多模态痛点:比如冠军团队用行为条件化建模,让算法更能“感觉”用户需求;有人去验证scaling law在生成式广告推荐模型里是否适用;也有人在数据安全前提下把性能继续往上推。可以说这个比赛是把全球顶尖技术人才聚集到一起,也反过来在推动广告算法的进步与系统性能,在AI时代,这类比赛可以让自己的能力被看见、也是让企业找到顶尖人才的最佳场景。 【你将听到】 Demo背后的虚与实 02:37 评估灵巧手能力的关键:精细运动、泛化能力与可靠性 05:58 “开可乐”Demo背后:演示效果与实际能力的差距 08:23 硬件厂商追求单项突破,算法团队更重泛化能力 15:32 灵巧手面临的瓶颈和独有的技术挑战是什么? 三大技术路线 19:26 连杆驱动:常见6自由度,也有高自由度方案(ILDA) 21:26 直驱方案:关节与电机一一对应,灵活度高(Sharpa) 24:59 绳驱方案:双向拉绳(Shadow Hand、ORCA)与单向拉绳(Tesla) 29:57 仿真研究为何更偏爱直驱方案? 33:13 天价灵巧手:不为盈利,只为筛选顶尖客户 36:21 Evan亲述:在特斯拉研发Optimus灵巧手的经历 40:33 从解剖学到外科观摩:马斯克坚持的仿生路线启发了“电机前臂迁移” 42:52 绳驱vs直驱:装配难度与量产前景对比 算法、数据、触觉 44:32 揭秘Meta机器人项目 48:25 受GPT与特斯拉FSD启发,机器人研究重心已转变 50:08 灵巧手数据采集为何难上加难? 52:01 机器人顶尖团队盘点:学术派与产品派 53:33 触觉如何提升灵巧手的操作能力? 58:11 灵巧手数据金字塔:遥操、仿真、视频 01:01:27 Genie3视频模型能用于训练机器人吗? 01:03:17 在伯克利做机器人研究是种什么体验? 01:07:09 灵巧手的“GPT时刻”还有多远? 【延伸阅读】 《机器人的“最后一公里”:深聊灵巧手的“不可能三角”与六大技术门派》 本期播客中提到的公司: 1X ILDA Shadow Hand ORCA Hand Sharpa Figure AI Tesla Optimus Physical Intelligence(PI) Sunday Robotics Generalist Covariant TetherIA 源升智能 【监制】 泓君 【后期】 AMEI 【运营】 朱婕 【BGM】 The Light from Within - Howard Harper-Barnes Floating in Space - Eva Hummingbird All Parts Equal - Airae The Secret Spring - Helmut Schenker 【在这里找到我们】 公众号:硅谷101 收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐 其他平台:YouTube|Bilibili 搜索「硅谷101播客」 联系我们: podcast@sv101.net Special Guests: 陶一伟 and 齐浩之.