商汤“三位一体”战略:大装置、大模型与应用协同开启AI赋能千行百业新时代

财经网 2024/11/22
导语

在人工智能领域,技术迭代和商业化推进始终是一个巨大的挑战。面对这一变革,商汤科技董事长兼CEO徐立在公司成立十周年之际,提出了“大装置-大模型-应用”的三位一体核心战略,无缝集成。这种集成并非简单的拼凑,而是一种有机的融合。以应用为驱动,意味着从千行百业的实际需求出发,旨在通过数量级级别的优化,提升算力资源的使用效率,推动AI赋能千行百业。

徐立认为,生成式AI或者AI 2.0时代除了模型的通用性之外,最大的特点是成本结构由“研发人员密集型”转化为“算力资源密集型”。伴随商汤科技商业化进程的深入,要做通用的模型变成商汤思考的主要方向。2019年,商汤对外提出做通用视觉大模型。“如果你每个场景都用一个不同的模型去做,最后可能你要做1000个模型,这很难实现,人手都不够,模型的价格也降不下来。”徐立说。

所以,通用模型的打造成了2019年商汤的重中之重,商汤是国内最早一批投入通用大模型研发的厂商,这也成为其构建AI价值商业闭环的先发优势,而这背后的大规模AI基础设施建设投入也随之提上日程。徐立原计划用租赁算力完成通用模型研发,但当时市场上没有成熟的大规模算力基础设施,只能自己去建不说,此前甚至都没有前人经验完整搭建过一套大规模智算系统。商汤成了第一个吃螃蟹的人,投建了自己的算力大装置,组建了大装置团队完成超大规模的算力训推软件平台的搭建。取名算力大装置,徐立是将其对于AI的作用类比于粒子对撞机之于高能物理学。如今商汤所持有的5.4万块GPU和超过20,000petaFLOPS算力,已经成为行业公认的稀缺资源。

因此,商汤的AI大装置在整个战略中扮演着基石的角色。它能够为市场提供强大的算力服务,这是大模型训练和运行的动力源泉,同时加速推动其应用商业化落地。

现在看来,商汤在AI基础设施方面的投入和通用大模型的路线选择,与OpenAI等国际巨头十分吻合。要搞好算力基础设施软件能力,需要深入理解大模型。2023年4月,商汤在国内率先发布了“日日新SenseNova”大模型体系,发布时,徐立提到,通用模型的能力比单纯的规模更重要,商汤在过去积累了不少客户,解决了很多行业问题,因此积累了大量真实数据,能够让模型在通用的基础上,在垂直领域更好用。在此后一年3个月的时间内,“日日新”迭代至5.5版本,交互效果和多项核心指标实现对标GPT-4o,也是国内对标GPT-4 Turbo领先的国产大模型之一。

目前,商汤日日新大模型体系已有超过3000家企业用户,广泛覆盖互联网、医疗、金融、编程等众多垂直行业。根据IDC近期发布的市场份额报告,商汤大模型平台及应用以16%市场份额排名行业第二,AIDC服务以15.4%市场份额跻身行业前三。

商汤“大装置-大模型-应用”三位一体战略为AI大模型商业化提供了创新可行模式,应对行业挑战的同时带来新机遇,有望在未来科技竞争中占据重要地位,推动AI在各行业广泛深入应用。

 

 

免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。文章不构成投资建议,仅供读者参考,并请自行核实相关内容。

编辑: 郭峰
关键字: 商汤 AI

专栏