AI 科技评论独家获悉:字节跳动向知名 AI 青年科学家、深度学习框架 MXNet 作者李沐发出邀请,希望请他加入字节参与大模型研发,开出千万年薪。尽管条件丰厚,但综合考虑后,李沐选择了婉拒。
日前,AI科技评论报道了前亚马逊机器学习部门首席科学家 Alex Smola 和李沐师徒离职、宣布在大模型赛道创业的消息。李沐与博士导师 Alex Smola 创立了一家公司,叫 Boson.ai,受到行业热烈关注。
大模型的门槛高,据统计,全球能训练大模型的 AI 科学家不超过 500 人,华人科学家则更少,抢人成为近日国内大厂的重头戏。雷峰网得到消息,字节跳动的创始人张一鸣曾亲自邀请李沐,不过李沐婉拒了这个年薪千万的工作机会,最终选择在硅谷创业。
李沐的选择出乎当前行业主流观点的意料之外。大家的共识是:国内能做成大模型的互联网科技大厂最终不会超过5家,BATH+字节;按照以往的规律,创业公司在大厂的挤兑下没有生存的空间。但李沐对张一鸣说不的这一举动,却给了大模型的小创业团队一个新的启示:
尽管大厂有几万人,但最终主导大模型研发的团队不过几十人。一方面,大厂有太多来自架构、业务、资源分配等方面的不确定性因素,最终能做成什么样还是未知数;另一方面,在一个新的、需要抢跑的赛道中,一个有能力、有决心 all in 的平台,或许更能把握节奏,抢占先机。
最终,大模型做成,技术平台积淀,再以数亿的金额卖给大厂,也不失为一个好的选择。进可攻,退可守,创业成为明星科学家眼中更「香」的选择。
(AI科技评论将持续关注大模型创业动态,欢迎添加本文作者微信ExperienceMachine交流爆料、互通有无)
—— 1 ——李沐的「选择」
这不是李沐第一次创业。
在上一波深度学习落地潮中,AI人才大规模流向工业界,彼时快要博士毕业的李沐也抓住机遇,选择与他的两位导师Alex Smola和Dave Andersen一起创业,成立了一家公司Marianas Labs,李沐出任CTO。起初,公司的项目进展很顺利,还被一家上市公司看中,就将公司卖给了对方,但后来还是终止了合作。最后,由于团队核心人员离开,Alex和Dave分别去了亚马逊和谷歌,李沐的这次创业便就此终止。
紧接着,又一次重要的选择来到李沐面前。谷歌的AI掌门人Jeff Dean向李沐发来一封邮件邀请他去谷歌工作。当时Jeff Dean主导的深度学习框架Tensorflow问世,实力非常强,这对李沐而言当然是一个很好的机会。
但李沐还有自家的MXNet要发展,他认为“自己挖的坑,总是要自己填的”。当时李沐也考虑了一些技术性强的小创业公司,但从MXNet的发展来看,还是要找家巨头来依靠更好,所以去亚马逊是更优选择。
于是李沐就先以兼职的身份去了亚马逊,带着一些人做MXNet开发和AWS上深度学习的应用。之后李沐于2016年7月正式入职亚马逊AWS,直接向担任副总裁级别科学家的Alex汇报。
如今,六年多过去,在新一轮AI大模型热潮下,李沐面临着更大的机遇和更多的选择。如同许多下场创业的AI科学家一样,李沐也已经瞄准大模型,准备开启新事业。
顶级科学家选择创业 更能 All in 大模型
字节跳动已经入场语言生成大模型,挖人才进来正是头等大事。字节现已经揽入一名大将,原达摩院大模型M6带头人杨红霞。而据知情人士称,张一鸣亲自给在国外巨头工作的华人科学家打电话,邀请他们回国加入字节大模型事业。
像李沐这样的顶级科学家,选择自己创业,而对大厂的招揽有所保留,这并不是个别现象,亦有其合理性。大厂固然体量大、资源多,但真要论内部专门投入做大模型的人才密度,恐怕并不高,再加上资源分配等方面可能存在诸多束缚,大厂最终能否做好自己的ChatGPT是一个问号。因此,在顶级科学家眼里,大厂并非是唯一的、最好的去处。
语言生成大模型本身也有很高的技术壁垒,所以,相比去一家声量大但大模型并非主要方向的公司,建立一支更重视AI、能够all in大模型的团队,或许是更聪明的选择。
这是经过许多历史验证的,比如当年的百度少帅之一、曾任字节跳动AI Lab总监的李磊,曾考虑去百度新闻做推荐系统,当时刚离开百度、创立地平线的余凯劝说他,最好去一个推荐系统是核心业务、受重视的地方,哪怕是家小公司。最后李磊便加入了当时规模还不大的今日头条。
而且,创业如果成功,卖给大厂如亚马逊后带来的收益,也并非现在加入大厂拿千万美元年薪所能相比的。
(预告:2012年后,以余凯为代表的一群华人科学家从硅谷NEC Lab离开回国,直接推动了中国AI产业变革,也影响了包括李沐、李磊在内的一大批AI大牛。雷峰网后续将推出相关文章《硅谷NEC Lab往事》,欢迎添加作者微信ExperienceMachine交流)
另外,从亚马逊在这一波AI大模型竞争中的位置来看,尽管亚马逊也已经布局,且内部已经开始测试类GPT工具,但目前在美国战场占据制高点的,无疑还是微软与谷歌两大巨头。像李沐和其导师Alex Smola这样的科学家们,有技术、有影响力,也不会缺投资,所以他们要参与这一波竞争,创业的确是一个不错的选择。
而在技术优势方面,ChatGPT目前主要是堆数据、堆参数的方式,其模型效果具有一定的偶然性,在工程优化、降低成本方面还有很大的空间。而李沐正是做系统出身,非常擅长工程优化这一块,所以他的机会很大。
(公众号:雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。