自动驾驶是一场马拉松,不是百米冲刺。时至今日,Waymo的成败难以定义,但它是当之无愧的自动驾驶之王。
作者 | 李雨晨
编辑 | 林觉民
“Waymo是公认的无人驾驶行业先驱者,如果你有异议,那我们暂时求同存异并保持微笑。”这是前Waymo员工夏飞在自己知乎专栏里写下的一句话。
从最早期的Waymo华人第一人朱佳俊、小马智行北美负责人张一萌到轻舟系的于骞、侯聪、大方、汪堃、李栋,再到90后创业者高继扬和赵行,2009年成立至今,Waymo涌现出了几百位华人面孔。这群聪明、勤奋、嗅觉敏锐的人,成为十多年来中国智能驾驶以及具身智能的见证者与参与者。
岁月如梭,斗转星移。当初与Waymo一同引领风骚的创业明星Cruise、Argo AI、Motional等等,或黯然下线、或委身他处,但Waymo仍在续写L4的江湖故事。
01
分拆独立,走上正轨
在2016年更名为Waymo之前,谷歌无人车内部一直用的是“chauffeur”这一名字(法语“司机”的意思)。
Waymo由谷歌X实验室孵化,跟总部不在一栋楼里。谷歌X最大的特点是,里面有很多造型奇特的硬件如机械臂、热气球、太阳能板。这栋楼的保密级别很高,谷歌的人无法进入。现在,这栋楼是Deepmind的人在办公,机器人团队也在其中。
朱佳俊是Waymo最早期的五位创始人之一,本科毕业于复旦大学计算机系。
在弗吉尼亚大学上学时,朱佳俊利用暑假来到Google Street View(街景)团队实习。到了第三周,他就独立完成了一个新的基于计算机视觉的改进,并因此收获了自己在谷歌的第一份专利。
此前,用户想接近一个特定街景,只能通过数次点击图中一个既定箭头,费时又费力;朱佳俊做出的“click-to-go”让图中任意点都能成为旅程起点。
后来,朱佳俊在国际会议SIGGGRAPH上遇到了当时Google Street View团队的核心成员Luc,朱佳俊与谷歌就此结缘。
作为团队里的第一位华人,朱佳俊有着超乎年龄的成熟与老练。他写下了Waymo的第一版感知系统,在内部有着很高的地位。
在2016年的架构融合前,感知和视觉是两个组。朱佳俊只负责感知,不负责视觉。除了感知,朱佳俊还领导仿真团队,仿真团队的名字叫“Crystal ball”(水晶球)。
还有一个组名为Magic,做的是视觉、预测和场景理解。这三部分任务都是要用机器学习去做,所以最早的机器学习不是应用在感知组,而是在Magic组。Magic组的负责人是Dave Ferguson,后来和朱佳俊一起创办了Nuro。
朱佳俊和Dave Ferguson
2014年,朱佳俊帮小组招募成员,他找到了谷歌搜索组的张一萌。
硕士期间,张一萌在卡内基梅隆大学(CMU)的语言技术研究所。当时,计算机视觉(CV)比自然语言处理(NLP)更火,张一萌就找到了视觉领域专家陈祖翰教授,跟着他直到博士。陈祖翰教授现在是新加坡国立大学的常务副校长。
张一萌
2012年,张一萌获得计算机视觉和机器学习方向的博士学位,并加入谷歌。这一年,是人工智能的标志性年份,2024年诺奖得主Hinton和其他两位作者发布的AlexNet在ImageNet挑战赛上一战成名,极大地推动了卷积神经网络(CNN)的发展。
不过,此时的深度学习并没有在产业界引起大的波澜。张一萌回忆到,“我还在康奈尔的时候,AlexNet还没有引起足够的讨论,效果远没有让人觉得可以应用在工业界。”
张一萌当时所在团队的产品形态类似于Zoom。当时,谷歌内部有很多这样创业性质的团队。遗憾的是,这个组的产品不太成功被高层取消,张一萌需要在公司里找其他项目。
朱佳俊听到消息后主动找到了她,问:“要不要来了解一下无人车?”
谷歌的无人车项目虽然从2009年就开始试水,但此时仍然是一个“Research Team”,离真正的产品比较远,算不上人人都想进的明星团队。
但既然朱佳俊发出邀请,张一萌决定还是聊一聊。她问了朱佳俊一个问题:项目什么时候落地?
朱佳俊回答:“两年,两年就可以对公众开放。”
加入之后,张一萌才发现自己被“忽悠”了:无人车的办公室还没有原先的组规模大。感知团队只有10人左右,华人不多,早于张一萌加入的还有贾兆寅。
贾兆寅是张一萌在康奈尔大学的师弟,后来在2017年加入滴滴任前沿业务技术负责人。贾兆寅是感知组的第一个Manager,带了4-5个人的小团队,被朱佳俊委以重任。贾兆寅走的时候,他的师妹江韵也一起离职。
谷歌的精英文化,让这家巨头吸纳了诸多天才,包括AI大神——AlexNet作者之一的Alex Krizhevsky。当时,Alex是从Google Brain被借调到无人车小组。
Alex Krizhevsky(中)
Alex是一个很特别的人。为了训练模型,他手写了一套深度学习框架——Cuda-Convnet。后来,贾扬清在美国加州大学伯克利分校读博士,看到了Cuda-Convnet爱不释手并且还找到了Alex。虽然没有从Alex手上拿到代码,但这也促使贾扬清写出了日后大名鼎鼎的框架——Caffe。
Alex对于Waymo的贡献在于,帮助调试出了很多模型,最早的点云检测模型就是出自他手。
2015年8月,谷歌进行组织架构大调整,成立母公司Alphabet,以广告为商业模式/盈利基础的成熟业务,包括Search、Android、YouTube、Apps、Maps和Ads被保留在谷歌旗下,诸多探索型业务则被划分到不同的实体继续推进,谷歌X实验室也就此成为Alphabet旗下的独立公司。
站在高层角度来看,分拆Waymo是一个正确且必要的决定,既可以避免“追逐广告收入”的心态蔓延到Waymo优势项目,又可以寻求外部融资,给初创团队更多的股票和期权激励。
不过,让谷歌高层没想到的是,早年间设立的一项激励计划却砸到了自己的脚。
故事的起因是:为了留住技术人才,Waymo曾经制定了一个薪资包,将薪酬分成四份。第一份在某一时间点发,如果能待到2016年年底、完成一些里程碑,就可以拿到剩下钱里的一大半。
当时,Waymo的项目估值85亿美元,谷歌拿出45亿美元当作奖金。谷歌的这一场造富运动,让很多人拿到数百万到数千万美元不等的回报,并且没有竞业协议的限制,这些钱成了Waymo元老们外出创业的底气。
2016年1月,时任谷歌无人车团队技术负责人的工程师 Anthony Levandowski 、谷歌地图原负责人Lior Ron、硬件研发主管Bryan Salesky、Dave Ferguson和朱佳俊等人离职,这也让waymo有了持续半年左右的离职潮。
8月,谷歌无人车项目的灵魂人物——CTO Chris Urmson离职。
Chris Urmson
Chris Urmson于2009年加入谷歌,当时谷歌尚未启动无人驾驶汽车项目,在他的带领下,谷歌确立了不要方向盘、不要刹车,开发完全自动驾驶的技术路线。Urmson虽是CTO的头衔,却更多是以CEO的身份带领团队。
但是,John Krafcik(原现代美国公司CEO)的空降让Urmson不满,最终演变为2016年初Urmson和Larry Page大吵一架。在员工看来,作为接任者的Krafcik在内部的口碑并不差。Krafcik有一头银发,非常有个人魅力。他永远都是站着办公,脚底下踩着一个平衡球。
Urmson走后,Dmitri Dolgov接管了技术团队,成为了这支团队新的CTO。轻舟联合创始人、前CTO,现总裁侯聪回忆,Waymo为了留住Urmson,在一次全员会上专门给他过了一次生日。
2016年底拆分独立临近时,Waymo在组织上做了一次大整合。
被整合的有ML(machine learning)组,这个组里分为Reserach team、Infra team。后来,Reserach team和视觉、感合并成了一个大的感知部门,从谷歌请了一个法国人做负责人;Onboard Infra、仿真、Offboard Infra,还有地图定位组成一个部门;决策、规划、控制、预测等划归在一个部门。
三个部门直接向CTO Dmitri Dolgov汇报,而Waymo的技术风格、商业思维也越来越像一支正规军。
侯聪2013年加入谷歌,2016年加入Waymo后与张一萌做起了搭档,侯聪负责感知的系统开发。对于Waymo硬件能力的更新换代,他的感触最深。
侯聪
他回忆,从2016年起,Waymo已经开始做第四代硬件,搭载了四个GPU,算力得到大幅突破,很多模型(视觉、预测等)也开始跑起来。
Waymo沿袭了谷歌的做事风格,从软件到硬件力图全栈自研,雷达、激光雷达、相机、车载电脑这些都是由Waymo设计,交给台湾超恩、广达来代工。其中,广达和其他代工厂不一样的特点在于,不是使用车规级的相机,而是选择像素高的相机来保证整体效果。
在具体数量上,第三代无人车的硬件约有4个摄像头,第四代增加到了19个摄像头,第五代硬件又猛涨到30个摄像头,被人称之为“武装到牙齿”。这些摄像头分布在车顶和车身的各个地方,通过红外线的方式检测盲区是否有行人。
Waymo和谷歌一直被外界贴以单打独斗、大包大揽、不计成本的标签,但其实很多操作都是为了更好的工程化效果。
第一个例子是,无人车有一个容易被忽视的问题——相机的去污。Waymo的第四代车顶上有一个圆形的罩子,里面包括了一个主雷达、16个相机。但是由于是圆形,很多虫子、鸟粪、雨水沾在罩子上后,雨刮器无法去污,因此第五代硬件又回归了早期的平面形态。
还有红绿灯的识别问题。目前很多交通灯都使用LED技术,会有频闪。如果曝光时间和频闪不一致,相机拍到的灯就会有亮暗相间的条纹。另外,由于与周围物体的亮度相差大,相机拍摄晚上的红绿灯容易过曝,尤其是左转或者右转的箭头,识别不清。Waymo想了一个办法:给相机装上一个灰镜,强制延长曝光时间,以此解决红绿灯的识别问题。
侯聪透露,“为什么Waymo一圈有16个相机,其中有8个都是为了看LED灯。不仅看红绿灯,还有警灯和消防车灯,以及一些牌子上面的文字。”
第二个例子是激光雷达。
在很长一段时间里,市面上没什么好的激光雷达可用,唯一可用的就是Velodyne,但是Velodyne的要价太高,导致Waymo的成本居高不下。另一方面,Velodyne的产能非常低且经常出问题,Waymo曾试着找Velodyne沟通,但对方明确表示暂时没有改进计划,这让谷歌感觉受制于人。这也是Waymo在硬件上大搞自研的核心原因。
侯聪表示,Waymo几乎所有零部件都不是车规级的,比如相机用的是索尼消费级的传感器。当时的硬件条件下,车规级的相机只能达到800万像素水平,但是Waymo需要的是一个4000万像素、能有优秀夜间成像效果的相机,这就只能自研。
降本,也是谷歌自研思路的一个考虑。Waymo早期采用英特尔的芯片作为计算平台,主要是基于服务器CPU至强和FPGA加速卡。FPGA具有非常高的带宽,但价格较高。为此,Waymo甚至还计划自主研发芯片,但后来发现芯片研发的难度太大,技术迭代太快,难以实现固化而放弃。
2017年,侯聪日后的创业搭档于骞加入了感知组。
于骞2001年从清华计算机本科毕业,杨士强教授是他的系主任,于骞和美团创始人王兴是同学(清华电子工程系无线电专业)。
于骞读博时,计算机视觉(CV)还是个冷门学科,图形学比较热,因为可以用在电影制作方面,容易变现。但于骞选择CV是因为他在清华人工智能国家重点实验室,跟随张钹院士。于骞一直坚定地认为,“在人工智能领域,计算机视觉才是最接近智能的技术。”
于骞
当时,于骞做的是基于双目视觉的无人车项目也使用单线激光雷达。在清华校园和周边的开放道路上,于骞和他的同学们做了各种实验。
2013年底,于骞加入了谷歌地图。一直到2017年2月,于骞做到了谷歌地图的街景组关键项目技术负责人,谷歌内部叫商业发现项目,目的是让地图不仅仅是给导航用,更要将大量的本地商业信息(类似餐馆、加油站、商店等)增加到地图元素中,尤其是通过谷歌大规模的街景数据高度自动化的完成本地商业信息的发现、定位、分类和匹配工作。
当时很少有人相信可以通过街景信息高度自动化的产生最新的本地商业信息,这部分工作帮助谷歌地图完成面向本地化的转变,保持了谷歌地图的竞争力。
在他看来,谷歌的工程师基础非常扎实。Waymo团队中的大多数工程水平甚至比谷歌还要高,筛选过程非常严苛。
于骞回忆,创始人Larry Page和Sergey Brin都对Waymo很重视。Waymo内部创新和技术氛围很浓,特别是Sergey, 有时会和大家一起开会。Sergey穿着随意,会穿着短裤进来加入讨论。还有一次,于骞邀请了发明GAN网络的人Ian Goodfellow来做讲座,于骞是那次讲座的主持人。Sergey特别感兴趣,陪着一起听完了整个研讨会,中午和大家一起吃午饭。
“Sergey对技术非常关注,所以谷歌的demo能烧这么多钱往前走,源自创始人的支持。”
朱佳俊曾说到,“Google的两个创始人Larry Page和Sergey Brin都很开放、也很有使命感,他们乐意为这些长线项目买单。”
前Waymo感知组成员、美团无人车感知负责人夏飞也直言,“别的不说,Waymo一次版本更新迭代就要花100到200万美元,还不算研发费用,国内很难有公司愿意花200万美元做评估。”
在谷歌高层的支持下,Waymo的商业化有了明显起色。2018年12月,Waymo自动驾驶打车服务的产品Waymo One正式上线。摩根斯坦利给出Waymo1750亿美元的估值,而前一年这个数字仅为700亿美元。
02
投身创业大潮:智能驾驶与具身智能
估值膨胀的背后,是Waymo正在一步步扩张与增员的事实。
2018年,Waymo的感知组有将近200人,张一萌在内部的职级是L6(Tech Lead),这个职级不低。然而,感知组的L6还有3、4个。张一萌只能分到一部分项目,她坦言,“感觉自己能做更多的事情,但只发挥了40%的能力”。
另一方面,组织架构的精细与流程化,意味着一个决策会牵动各方利益。
2019年1月,The Information梳理了一份Waymo的组织架构。这时候的Waymo有950名员工,在内部被称为“Waymonauts”,还有至少几百名外包人员。工程部是规模最大的团队,占了员工总数的三分之二,其他部门的规模相对较小。在这950名员工中,有350人属于软件工程团队,260人属于硬件工程团队。
张一萌表示,“在Waymo,想做出改变需要得到各个组的同意。真正实施的时候又要跟很多人沟通。发展到后期,Waymo就已经是一个不可轻易调整的庞大‘系统’。”
小马智行是张一萌接触比较早的公司。
当时,张一萌和创始人彭军在一家咖啡馆见面,两人感觉不错。但张一萌还想看看其他机会,彭军对她说:“我们肯定不怕(你去其他家),这个自信还是有的,去聊吧。”
后来,张一萌花了4、5个月的时间广约面试,最终的选项只留下百度和小马,她在百度的最后一轮面试官是李彦宏。但最终在2018年9月,张一萌选择了小马。和她同一天入职的,还有现在小马副总裁、广州研发中心负责人莫璐怡。
小马员工评价,张一萌早期给公司做出的最大贡献在于完善了小马的感知闭环。
入职后,张一萌发现小马的短板在于,研发没有形成数据驱动的方式。在0-1的创业初期,验证代码的最直接方式就是把代码部署到车上跑一圈。但从1-10的阶段,各个版本之间的差异不大,路测无法作出准确的评价。这个时候,团队之间就会为了“上不上新的算法”而争论,拖累研发节奏。
张一萌在内部提的概念是“Development Circle”,让数据不仅仅在训练过程中发挥价值,而是进一步在评价体系和仿真系统中进行流转。数据驱动的思维,也成为小马研发体系的关键基础,并一直延续至今。2024年11月,小马正式在美股上市,市值超45亿美元。
张一萌走后不久,于骞的本科同学、IDG资本合伙人牛奎光找到了他。牛奎光告诉了他中国自动驾驶领域的创业机会。后续,于骞邀请侯聪一起组创业局。
那时已是2018年底,侯聪觉得创业时间太晚,就考虑了半个月。
一个小插曲是,早在2017年,侯聪就曾差点加入小马智行。当时,楼天城先联系了侯聪,后来彭军又找了侯聪三次,甚至带上自己的夫人和侯聪夫妇共进晚餐,但是最终因为各种原因,侯聪没有加入小马。
在侯聪看来,彭军是一个很称职的CEO,为了招人尽心尽力。后来,张一萌要去小马时,侯聪顺势推了一把说“这是一个很好的团队,是一个很好的机会。”
后来,半个月时间一到,于骞再找过来时,侯聪就答应加入。最终,于骞、侯聪、大方、汪堃走到了一起,在硅谷一个深圳市政府做的名为“Shenzhen Lab”的孵化器里租了几个工位,在孵化器门口找来一个集装箱,买了一台林肯进行改装,轻舟的创业故事就此开始。
轻舟分为L2量产和L4(无人驾驶小巴)两条发展路线。在L2量产领域站稳脚跟,离不开地平线与理想的支持,一个是给投资,一个是给定点。
最早的时候,于骞在USC的师弟黄畅(地平线联创兼CTO)都在硅谷的NEC Lab,地平线创始人余凯是当时NEC Lab的主任,于骞和徐健(地平线首席生态官)的关系也很密切。
有意思的是,在进行智驾方案的芯片选型时,于骞最早见的人是黑芝麻智能的创始人单记章。当时,黑芝麻的华山芯片还在设计阶段,单记章问过于骞关于自动驾驶芯片的需求。不过,轻舟最终加入了地平线阵营。余凯给轻舟投了一笔钱,帮助轻舟度过关键的早期阶段。在此后的时间里,余凯经常会给轻舟站台,哪怕是轻舟自己的发布会。
于骞对雷峰网说,“我们非常感激地平线和余凯,同时地平线也感激我们。因为在基于J5的中阶方案上,我们承载了他们最大的出货量。”
轻舟和地平线更应该共同感谢的,其实是理想汽车。
2020年9月,地平线发布了J3芯片。8个月后,J3量产上车理想ONE。为了响应理想的需求,余凯动用了地平线的全部精锐,组建了一支300人的团队派驻理想。在当时经历了大瘦身的地平线里,这几乎占据了总兵力的四分之一。理想ONE上市后一炮而红,地平线迎来了大规模放量。
次年,地平线的“J5”系列产品也用了不到7个月在理想L系列上实现了量产。
2023年3月,轻舟开始与理想谈合作,直到9月份才正式确定合作,这中间有着漫长的考察过程。当时,理想正在考虑要把智驾芯片从J5换成英伟达的Orin,但最终没有成行。由于联创的Waymo背景,轻舟开发了很多底层工具。与理想合作时,轻舟发现理想的工具质量还有很大的提升空间,帮着它一起优化。
2024年8月底,于骞向雷峰网表示,“有40万辆车装载了我们的智能驾驶软件。真正在车辆上应用的软件规模,我们还是最大的,这说明我们的稳定性可靠性得到真正市场的考验。”到了12月,轻舟官宣中高阶智驾解决方案量产交付上车正式突破50万套。
2019年从Waymo离职创业之前,于骞面试了一个人——星海图的创始人高继扬。
两人见面是在2018年底,于骞是高继扬在USC(南加州大学)的学长。高继扬在Ram(Ram Nevatia,南加州大学计算机科学系计算机视觉领域的研究专家)教授组里,跟他同组的还有地平线的黄畅。当时黄畅正在念博士后,算得上是高继扬的大师兄。
大四这一年,高继扬去商汤实习开始接触AI。在商汤的时候,他认识了Momenta的创始人曹旭东。这个时候,高继扬已经感受到了AI的潜力,读博的时候切换了方向。在导师Ram教授的指导下,他仅用了3年半的时间就完成学业,成为USC IRIS计算机视觉实验室最快毕业的博士。
因为用了很短的时间读完博,所以高继扬自认为没有特别引以为傲的论文。但好处在于,高继扬赶在了好的时间点进入自动驾驶行业。
在Waymo,高继扬作为高级软件工程师,参与了基于机器学习的行为预测项目,并和赵行、孙晨联合发表了著名的VectorNet模型。(孙晨是高继扬的学长,当初也是孙晨将高继扬引荐给Ram教授)
从左往右为赵行、孙晨、高继扬
VectorNet是一个基于神经网络的预测和规划算法。相比广泛使用的ResNet ,VectorNet在预测的精准度上提高了18%。更重要的是,它在进行行为预测时占用的内存仅为ResNet的29%,计算量也仅为后者的20%。论文发表之后,不少公司开始用图神经网络的方式去做预测规划。
2021年1月,高继扬加入Momenta。
Momenta是业内知名的“卷王”,去车企驻厂是一件非常平常的事情。高继扬向雷峰网表示,“在服务客户这件事上,我们就是服务员,保质、保量、保时间。做技术的觉得技术过硬就可以,但没有给客户创造价值就等于零。”
高继扬对Momenta的日子心存感激,高继扬进去之后向联创孙刚汇报。孙刚的管理风格是“无为而治”,但是他很会充分放权、捏合团队。在Momenta,从感知、定位、规控、泊车、行车、AI Infra,所有的事情高继扬都经历了一遍。Momenta的第一个自动驾驶量产项目——车位检测算法,就是由高继扬负责给博世交付。
博世的研发中心在苏州。高继扬带领团队几乎把苏州一半的停车场跑了一遍。每个停车场采数据、训练,训完之后随机找停车场泊车。为了建立客户信心,高继扬向客户承诺:一周一发版,版版有提升,在这样的经历下,Momenta慢慢建立起了交付方法论。
2022年4月份,Momenta给上汽做第一次交付,交付的第一个功能是泊车和车道保持。但在2022年春节前,Momenta的泊车成功率大概只有60%,高继扬被指派来负责泊车。由于出入不便,高继扬楼上睡觉楼下调车,把泊车成功率从60%提升到了95%。
2022年6月,高继扬正式开始负责NOA领航辅助系统系统,接手了规控、NOA系统研发团队。等2023年4月份交付完成后,已经成为NOA负责人的高继扬在5月份提出了离职,正式投身创业大潮。
而他的创业伙伴,正是他在Waymo前同事、VectorNet网络的合作者——赵行。
赵行本科在浙大,后在MIT取得了博士学位,师从MIT AI&D (人工智能与决策)系主任Antonio Torralba教授——多模态深度学习的开创者之一。
后来,赵行加入谷歌Waymo担任研究科学家,负责算法方面的工作,是Research组的研究员。2020年底,赵行离开了供职一年半的Waymo。当时,已经创业的于骞曾经向他伸出了橄榄枝。但赵行最终选择去清华大学交叉信息院担任助理教授。
2024年3月,在英伟达GTC 2024上,理想发布了智能驾驶方案——“端到端 +VLM(视觉语言大模型)快慢双系统”,其中VLM正是理想和赵行所在的清华MARS Lab的合作成果。VLM的能力在于,即使遇到从未见过(训练过)的场景,也能像人类一样通过理解、分析、推理,最终安全应对。
按照李想的话说,“不再需要养几千人的团队去搞corner case,而且团队越多corner case越多了。”也正是从这篇文章之后,理想的智驾进度被大大提速,在2024年取得了肉眼可见的成果。
赵行和图森未来的前CEO侯晓迪也是朋友。有一年CVPR上,侯晓迪找他喝酒,正好当时一位MIT的老师也在。侯晓迪口才出色,这位老师听后直接邀请侯晓迪去MIT讲课。
高继扬也认识侯晓迪。刚毕业的时候,高继扬曾面试过图森未来,聊技术问题时侯晓迪的压迫感十足,这给高继扬的心理造成了“巨大压力”。他对于侯晓迪的印象是:“很犀利、很sharp的人,他是传统视觉出身,深度学习也很懂,两者结合非常好。”
2023年5月,赵行和星海图的另一位联创许华哲一起去非洲参加学术会议,当时许华哲还在清华,他听说赵行有具身智能方面的创业规划,就找赵行了解。赵行表示,“不如来聊聊?星海图现在也在筹建期。”
于是,赵行就拉着许华哲跟高继扬一起吃饭,三人聊的非常投机。
2023年9月5日,星海图正式成立。十一假期的第一天,许华哲带组里的PhD去郊游,郊游那天他决定加入星海图。2024年11月,星海图宣布完成超2亿元Pre-A轮融资。
03
Waymo的故事仍在续写
Waymo系出身的自动驾驶创业者,和“清华系”、“百度系”一样,是自动驾驶领域绕不开的存在。于骞向雷峰网说过,“Waymo有一个中国人微信群,我在的时只有20多人,现在群成员已经增加到500人了。”
这些在Waymo来来往往的华人,成为未来中国自动驾驶乃至具身智能领域的探路者。但是并不是所有人的离别,都是为了投身创业。Waymo本身的一些问题,也是他们离开的重要原因。
“架构比较复杂。”
这是前Waymo感知组成员、美团无人车感知负责人夏飞谈及离开的主要原因。“Waymo不得不处理大量的长尾场景。Waymo需要下定决心简化现有系统,但这个取决于老板的认知。”
与他持有类似观点是高继扬。在高继扬看来,Waymo在2021年后走下坡路,人才密度有所降低,这是因为Waymo的大方向有问题,与AI行业技术的发展规律相悖。
AI有两个衡量维度:失效成本,泛化性要求。L4级自动驾驶的失效成本高,泛化性要求高。大语言模型对泛化性的要求高,但失效成本很低;具身智能失效成本高于大语言模型,但是显著低于自动驾驶,同时对泛化性的要求也较低,因为具身智能的商业化过程是一个以岗位替代为核心逻辑的过程。
高继扬表示,Waymo开城思路是从区域L4起步,这就决定了需要围绕各个目标城市来拆解任务,系统里就产生了几十个模型,每个模型背后都是一个小团队支持,在“人比事多”之后,大家会出现抢项目或者相互掣肘的现象;其次,Waymo是Google的子公司,CEO、CTO是职业经理人,这对于一个没有稳定业务的创业公司不利,因为出错之后无人负责,也没有人可以强力纠偏。
也有人不太认同高继扬的观点。
张一萌认为,谷歌整体的文化是bottom up(自下而上)不是top down(自上而下)。
2014年,张一萌加入时,是Chris Urmson和Dmitri Dolgov在管理方向。但当时Waymo是走在最前端的公司,没有任何的参照可言。作为技术引领者,不像追随者一样有清晰的方向。在探索新东西的时候,自下而上会有更多创新的灵感。
张一萌认为,以现在的眼光去审视过去Waymo的做法有失妥当。从2016年到2020年的这段时间里,最可用的方法就是将任务分成一个个小模型。当时有很多学术论文确实是从研究大模型开始,但那个时候的GPU条件受限,不足以去支撑大模型。
“Waymo这样的公司包袱会重一些,但是也在改变。小马当年也是多个模型,前两年才慢慢换成一个大模型的方式。如果小马在2021年成立,肯定直接走大模型的路线。”
对于特斯拉与Waymo的不同开城思路,张一萌仍然认为,L4必须一个个城市去开,特斯拉的方式更适合L2。即使今天特斯拉去做L4,也一定是如此操作。
有Waymo前员工赞同这一说法:“AI背景的人,或许对Waymo开城思路有所质疑。可以很明确的感觉到,大部分人都是盲人摸象,只能看到自己领域里的东西。无人系统很复杂,虽然代码都是公开的,但是很少有人能够全部知道其他人在做什么。核心在于Waymo卖服务,特斯拉卖车,不是Waymo傻或者笨,而是两者的目标不一样。”
两种不同的观点对应的是在不同历史阶段的技术路线选择。对于Waymo来说,能走到今天已经殊为不易。
2023年,智能驾驶行业进入低谷期,Waymo裁员137人且裁员范围大部分集中在技术岗位。加上1月份的首轮裁员,Waymo共裁员209人,占到其员工总数的8%。
不久前,通用宣布由于开发成本过高,将停止Cruise自动驾驶出租车业务。同时,其合作伙伴日本本田汽车也宣布将停止向Cruise提供资金。Waymo的同行者少了一位,当初引领行业热潮的Cruise匆匆下线。
只有Waymo还在一直坚持。
2024年10月,Waymo完成一轮56亿美元的融资,这是Waymo迄今为止筹集的最大一轮融资。根据规划,新的投资将用于加速与Uber的合作,并宣布将于2025年在美国奥斯汀和亚特兰大推出Robotaxi服务。
自动驾驶是一场马拉松,不是百米冲刺。时至今日,Waymo的成败难以定义,但它是当之无愧的自动驾驶之王。
“Waymo有一帮特别聪明的人,做事非常认真、专业,代码质量非常高。在全世界,你想找到第二个这样的团队是不容易的。”
从Waymo离开的这些人,正在继续书写智能驾驶和具身智能的江湖故事。
英伟达8年自动驾驶之路:拖沓的奔驰项目,救火的吴新宙
小鹏「真搞」自动驾驶的第六年:不吆喝、不溢价、不变心
自动驾驶不相信黑马