年初爆火的《狂飙》,剧名正暗合了AI大模型的这一年。
郭晨凯 制图
2月ChatGPT“带火”OpenAI时,行业还预测国内追赶尚需时日;但转眼的5月,一场声势浩大的“百模大战”便拉开帷幕。头部公司争先恐后,中小厂商一路追赶,生怕错过时代的列车。
有人说这是人类“科技革命的前夜”,也有人在质疑其商业落地仍遥不可及。
这是一个注定不会寂寞的行业。“卧薪尝胆”的谷歌“一声长啸”,推出匹敌GPT的新模型Gemini,也将“原生多模态”定格在了这新旧交替的节点上。
这也是一个注定不会一帆风顺的行业。OpenAI高层“宫斗”祸起,让这家900亿美元市值的“独角兽”秒变“草台班子”。这让外界得窥狂飙之下,行业内部深层的分歧与矛盾的激化。
2024年,将是属于大模型的一场歧路之旅。
分歧
在最近的一场论坛上,昆仑万维CEO方汉提出了一个颇为有趣的观点——大模型行业里,小厂才有颠覆性创新。用他的话来说,本来就没有用户,没有市场,不如放手一搏。
持同样观点的人还有百川智能创始人王小川,他相信,小厂更拥有颠覆传统模式的能力。而这无疑与此前行业的预判有着明显分歧。
直到今天,市场上对于大模型的普遍认知依然是——只有巨头能够参与的赛道。一家上海创投机构的负责人就算了一笔简单的账:“别的不说,光腾讯、字节跳动和百度储备的GPU芯片,就是上百亿的资产。”
但历史一再证明,科技的突破有时并不遵循行业的“普遍认知”。就以大模型为例,早在年初方汉就对记者预言,大模型的技术架构可能没有想象中那么复杂。“如果仅仅是做出大模型的话,中国可能不需要三五年。”
事实证明也是如此。一年来,大模型如雨后春笋,百度、阿里、华为、京东等互联网大厂重金押注,无一缺席。截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个。
随着行业的快速发展,分歧与争议也日益增多。通用模型好还是垂类模型好?是否商业化?如何商业化?何时商业化?谁能率先商业化?以至于在如今一场接一场的各类论坛中,大模型成为“逢会必谈”却也“空泛无物”的热门话题。
11月底,在OpenAI董事会内部上演的一场“权力游戏”,或许可以视为窥探如今行业深层分歧的一个契机。一方面是首席科学家对于AI安全性的高度担忧,另一方面是CEO阿尔特曼对于AI激进的商业化策略。
有科学家直言,人类处于前所未有的AI威胁当中。但与此同时,大众对大模型的感知依然停留在“聊天机器人”层面。似乎除了自动生成广告图和永远看起来不怎么聪明的AI客服外,大模型眼下并没有更好的用武之地。
“大模型行业最终99%都会死去。”相较于许多人的乐观赞美,王小川的话在此刻显得颇为残酷。
关口
总体来看,国内头部大模型的水平大致相当于OpenAI的GPT-3.5,距离GPT-4依然有差距。而要想实现技术上的突破,方汉认为需要突破三大关口:算力、算法、数据。
最引人注目的莫过于算力之争。事实上,大模型崛起的最先获益者并非AI公司,而是芯片厂商英伟达。今年二季度,英伟达数据中心业务占比首次全面超越游戏板块。
今年以来,“算力紧张”已经成为行业常态,一张英伟达高性能显卡价格更是“一天一价”。一位英伟达代理商告诉记者,目前国内所有英伟达系GPU配置的算力中心都处于“满租”状态。“只要有显卡服务器来,根本不愁大厂签约。”
也有业内人士感慨:过去一年见了100多家客户,只有一家自己拥有算力,其他人都没有。大模型所需的算力紧俏程度由此可见一斑。
中原证券电子行业分析师邹臣认为,AI大模型预训练数据量呈指数级增长,算力已成为推动数字经济飞速发展的新引擎。而据AMD预计,2023年AI芯片市场的规模将达到450亿美元左右,至2027年将飙升至4000亿美元,2023年至2027年复合增速超过70%。
算力硬件上的短板,短期内可以通过算法优化加以解决,而这恰恰构成行业发展的另一关口。
据脉脉高聘人才智库发布的《2023泛人工智能人才洞察》显示,今年1月到8月,新发AI岗位平均月薪超4.6万元,人才供需比仅为0.39,相当于5个岗位争夺2个人才。
vivo副总裁周围接受媒体采访时曾表示:“vivo大模型现在每年20亿至30亿元的投入成本,总投入成本已经超过200亿元,人才和数据算力各占一半,人才成本平均每人税后100万元。”
而具体到部分领域,这种人才短缺就更为明显。商汤科技医疗板块的相关负责人此前就告诉记者,如今跨专业复合学科背景的人才对于行业至关重要。
数据如今更是行业发展难以突破的“险关”。且不论数据训练的方法是各家秘而不宣的核心机密,单数据筛选就已是巨大的挑战。
高质量的数据对大模型训练至关重要,天娱数科副总经理贺晗就曾对记者表示,国内各领域数据“多而不精”“壁垒森严”等问题都阻碍行业发展。网易伏羲工程机械产品负责人杨新伟也直言:“工业领域高质量数据太少。”
落地
今年年初OpenAI真正引爆市场的关键,在于ChatGPT成为史上用户数破亿最快的应用。这让资本看到了商业落地的可能性。经过一年发展,如今全球头部的大模型都开始进入商业化落地的环节。
今年下半年,国内大模型的商业布局落地速度也显著加快。12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,百度、腾讯、阿里的大模型首批通过大模型标准符合性测试,标志着在商业落地上,国产大模型又迈出重要一步。
据百度负责人介绍,今年以来,文心大模型保持快速迭代,5月升级至3.5版本,10月再次迭代至4.0版本,其理解、生成、逻辑、记忆四大能力显著提升。同时,通过飞桨与文心的协同优化,模型周均训练有效率超过98%,训练算法效率提升3.6倍。
在商业方面,百度文心一言负责人王海峰日前透露,文心一言用户规模现已达到7000万,场景4300个。不过王海峰并未具体介绍如今文心一言具体的营收情况。
面向商业化场景的华为盘古大模型,在年末也有新动作。在12月的活动上,华为方面透露,目前有7家创业公司与华为云签署合作协议。未来华为云将与签约企业继续基于昇腾AI云服务和盘古大模型进行联合创新,一派生态图景已然徐徐展开。
不过记者也注意到,除了百度之外,目前其他大模型厂商大都未向外界披露具体用户的情况,且很多大模型均为垂类模型,仅对特定的用户开放。
投融资活跃度是检验市场对于商业化落地情绪的最好指标。数据显示,今年中国AI领域融资214亿元,百川智能、Minimax和智谱AI三家公司在资本市场尤为受欢迎,融资额占比超过30%。
但除了三家头部企业,其他初创公司的融资情况可能并非那么乐观。
据第三方数据机构企名片数据显示,今年国内共有26家大模型初创公司拿到融资,基本是种子轮或天使轮。相比于“雷声滚滚”的论坛会场,市场上真金白银的“雨点”就略显稀少。
有创业者发现,如今市场对于大模型项目的市场需求、技术实力、商业模式以及团队能力等方面的情况会有更多考量。换言之,能否在短期内商业化赚到钱成为重要的指标。显然,在如今的大环境下,投资市场也变得异常谨慎。
“目前大家需要承认的是,大模型说了半天,但落地并不是很理想。”澜舟科技创始人兼CEO周明说道,“我认为过去一年大家在酝酿情绪,找对接口,明年可能是爆发点。”也有许多投资者认为,尽管大模型市场曾有不少奇迹,但明年这个市场最大的可能性,依然属于头部厂商。