在中国互联网领域,百度公司一直以技术见长,腾讯公司以产品见长,阿里巴巴以运营见长,但令人意外的是,在大模型技术的角逐中,一直被外界认为缺乏“技术基因”的阿里巴巴竟然成为了最大的“黑马”。无论是其旗下的千问大模型,还是面向C端消费者的AI助理产品千问App,都在过去一年表现惊人。
外界长期认为阿里巴巴集团缺乏“技术基因”,这其实是一种偏见。导致这种偏见的根源是因为百度创始人李彦宏与腾讯创始人马化腾都是计算机专业出身,精通互联网前沿技术,因此被公众认为更具有技术基因与产品基因。而阿里巴巴集团创始人马云是英语老师出身,从来没有写过任何一行代码,因此被外界认为缺乏“技术基因”。
阿里巴巴创始人马云确实不是技术天才,但却有着罕见的战略天分与领导力天分。战略天分,让他总是能够更前瞻地看到一些新技术在商业领域的应用前景,以及能够更加坚定地实施执行。例如,在互联网产业尚未发展起来的1995年,马云便打造了中国第一个商业型网站中国黄页。
领导力天分,则让马云总是能够吸引并充分发挥一些顶尖技术人才的潜力,这让阿里巴巴集团内部永远不缺乏一群具有技术天分的员工,并总是能够人尽其用。例如,阿里巴巴集团CEO吴泳铭、阿里云创始人王坚、阿里达摩院负责人张建锋、阿里巴巴集团CTO吴泽明与阿里云CTO周靖人等都是阿里体系持续涌现的能够独当一面的技术型领导者。
上述技术领导者都名副其实,他们在阿里巴巴集团成长为亚洲最大的电商企业、云计算企业与金融科技企业的发展过程中均做出了巨大的贡献。在这些最核心的技术领导者之外,阿里巴巴各个子业务也都分布着大量杰出的技术骨干,例如,最近舆论热议的,从阿里巴巴集团离职的千问大模型负责人林俊旸便是其一。
不过,林俊旸并非阿里巴巴集团千问大模型成功的唯一关键人物,而只是阿里大的技术土壤、体系下的产物。千问大模型的起点,最早开始于2017年的阿里达摩院。当时在马云、蔡崇信、张勇与王坚等阿里核心决策层的力推下,阿里开创性地投入重资成立了达摩院,并在全球范围广招人才,将人工智能作为最核心的研究方向之一。当时,林俊旸还只是一名未毕业的在校生。
从2020年起,阿里达摩院便开始启动了超大规模多模态模型M6的研发。该模型参数量从万亿级跃迁至10万亿级,成为全球首个10万亿参数模型,实现了文本、图像等多模态的融合。当时,林俊旸还只是一名入职达摩院不久的新人。
2022年,依托M6的技术积累,阿里巴巴正式成立通义实验室,整合达摩院的语言、视觉等AI团队,标志着大模型研发进入一体化阶段。随着2023年年初ChatGPT在全球范围的大火,阿里巴巴集团才开始将大模型提升至集团战略高度,并迅速整合内部力量,成立了通义实验室,由阿里云CTO周靖人领导。
由于在ChatGPT大火之前,阿里巴巴集团便已经在大模型领域深耕多年,这使得其在2023年4月便正式对外发布了“通义千问”大模型系列,成为中国在大模型领域最具先发优势的企业之一。
在上述阶段,林俊旸还一直都不是千问大模型研发的主导人物。在集团高层方面,一直有张建锋、周靖人的领导,在具体业务方面,有杨红霞、周畅等直接负责人掌舵。杨红霞是阿里大模型早期技术路线的关键人物,她在担任达摩院智能计算实验室负责人期间,领导了通义千问前身M6模型的研发,为阿里在大模型领域的早期探索奠定了基础。其于2023年3月从阿里离职,后加入香港理工大学担任教授。
周畅是杨红霞之后在阿里大模型发展历程中至关重要的另外一位技术负责人,曾在M6和通义千问的研发中扮演了核心角色。其于2024年8月离开阿里巴巴,后加入字节跳动。
林俊旸是在周畅离开之后,接任成为千问大模型技术负责人的,当时千问大模型已经在国内奠定了一定程度的先发优势与技术优势。从上述历程我们能够看出,千问大模型的发展并非一人之功,而是阿里长期深耕与集体智慧的结果。
另外,熟悉大模型领域的读者会了解,大模型研发具有非常高的资金门槛,其是一个典型的巨头生意,没有千亿级的资金投入很难实现领先。这是为什么一些早期的知名大模型创业公司逐渐掉队,而以阿里、腾讯与字节跳动为代表的三家中国最具资金实力的科技巨头开始展现出越来越强的领先优势。即使在人工智能技术上起步较早,但因为资金实力稍逊一筹,投入力度小于上述三家科技巨头的百度公司也开始慢慢掉队。
而阿里巴巴集团不仅具有资金实力,其还有着相较其它企业更高的战略决心。2023年9月,阿里巴巴集团新任CEO吴泳铭便明确将“AI驱动”作为阿里巴巴集团两大核心战略之一,举集团之力推动AI技术发展,并承诺三年投资3800亿人民币。
在技术人才领域,阿里巴巴集团也有着行业最高的人才密度。目前,多家国内大模型企业的核心技术骨干都是来自阿里巴巴集团。这些员工的离开也都属正常流动,一方面大多数员工在面对外界数倍薪酬的挖角诱惑时都难以抵御,另一方面阿里巴巴内部人才济济,这些员工也并非最顶尖的人才,很难在短时间内脱颖而出,而去到其它公司获得更关键的职位也具有较大吸引力。虽然阿里巴巴持续有技术人才流失,但同时其也有源源不断的新人涌现,并在行业中始终稳居技术领导者的位置,这充分说明了阿里公司作为一个体系的巨大力量。
从目前较为公开的信息我们能够看到,此次林俊旸的离开,最直接的原因是阿里巴巴集团致力于从组织、人才上对千问大模型团队进行加强。目前,虽然千问大模型在国内的大模型中处于领先位置,但与全球公认的最顶尖的三个大模型尚有着不小差距,它们分别是OpenAI的GPT系列、Google的Gemini系列与Anthropic的Claude系列大模型。
对于吴泳铭、周靖人等为核心的阿里巴巴高层,其绝不会满足于千问大模型的现状,势必会从战略上去思考千问大模型的进一步发展。而集团高层给出的答案有两个,一个是从组织架构上改变过去千问大模型“端到端协作”的垂直整合研发模式,拆分为预训练、后训练与多模态等多个相互平行、独立的专业团队。另外一个是引入前Google DeepMind研究员周浩为代表的新的全球顶尖AI人才,出任千问大模型核心技术板块的负责人。
从企业进化的正常逻辑来看,这两个变化都是有利于促进千问大模型新一轮跃迁的必然之举,但会带来千问大模型负责人林俊旸原有管理权限和决策范围的大幅度稀释,这直接导致了林俊旸的不满。面对新的组织调整,林俊旸心有不满可以理解,但其处理方式颇不成熟,在没有做好内部沟通的情况下便在社交媒体发布离职意向,公开暴露组织矛盾。林俊旸的这种不成熟表现,可能也正是阿里巴巴集团高层难以将大模型这个公司重中之重放心交到他手里的根源。
针对林俊旸公开宣称离职造成的舆论风波,以吴泳铭为核心的阿里巴巴集团高层也表现得较为成熟冷静,他们连夜紧急讨论,迅速达成共识并做出反应,一方面召开全员会,对千问大模型的核心团队进行答疑安抚,另一方面发布全员邮件,果断批准了林俊旸的离职,将林俊旸离职带来的负面影响降到最低。
虽然林俊旸的离职风波已经告一段落,但网络上关于该风波的讨论还有很多,大量观点认为这将对阿里未来的大模型发展造成巨大损失。笔者认为,这些观点大大高估了一个个体对于一个体系成功的重要性,也大大低估了阿里作为中国最杰出的企业所具备的组织力与体系力。
类似阿里巴巴、腾讯与华为这种级别的优秀企业,离开任何一个个体其实都不会产生太大影响,三者历史发展过程中的大量员工离职案例已经充分证明了这一点。如果因为一个个体的离开,便影响到公司战略业务的发展,那么阿里巴巴就不会成为阿里巴巴,腾讯就不会成为腾讯,华为也就不会成为华为了。
即使这些企业在发展过程中涌现出了一些极为突出的个人,一方面离不开这些个人的天赋与才华,但更离不开的是企业所构建的文化、土壤与体系。一个林俊旸离开了,未来还会有无数个新的林俊旸在阿里涌现。


