商汤“三位一体”战略：大装置、大模型与应用协同开启AI赋能千行百业新时代_港股_资本市场_财经网

在人工智能领域，技术迭代和商业化推进始终是一个巨大的挑战。面对这一变革，商汤科技董事长兼CEO徐立在公司成立十周年之际，提出了“大装置-大模型-应用”的三位一体核心战略，无缝集成。这种集成并非简单的拼凑，而是一种有机的融合。以应用为驱动，意味着从千行百业的实际需求出发，旨在通过数量级级别的优化，提升算力资源的使用效率，推动AI赋能千行百业。

徐立认为，生成式AI或者AI 2.0时代除了模型的通用性之外，最大的特点是成本结构由“研发人员密集型”转化为“算力资源密集型”。伴随商汤科技商业化进程的深入，要做通用的模型变成商汤思考的主要方向。2019年，商汤对外提出做通用视觉大模型。“如果你每个场景都用一个不同的模型去做，最后可能你要做1000个模型，这很难实现，人手都不够，模型的价格也降不下来。”徐立说。

所以，通用模型的打造成了2019年商汤的重中之重，商汤是国内最早一批投入通用大模型研发的厂商，这也成为其构建AI价值商业闭环的先发优势，而这背后的大规模AI基础设施建设投入也随之提上日程。徐立原计划用租赁算力完成通用模型研发，但当时市场上没有成熟的大规模算力基础设施，只能自己去建不说，此前甚至都没有前人经验完整搭建过一套大规模智算系统。商汤成了第一个吃螃蟹的人，投建了自己的算力大装置，组建了大装置团队完成超大规模的算力训推软件平台的搭建。取名算力大装置，徐立是将其对于AI的作用类比于粒子对撞机之于高能物理学。如今商汤所持有的5.4万块GPU和超过20,000petaFLOPS算力，已经成为行业公认的稀缺资源。

因此，商汤的AI大装置在整个战略中扮演着基石的角色。它能够为市场提供强大的算力服务，这是大模型训练和运行的动力源泉，同时加速推动其应用商业化落地。

现在看来，商汤在AI基础设施方面的投入和通用大模型的路线选择，与OpenAI等国际巨头十分吻合。要搞好算力基础设施软件能力，需要深入理解大模型。2023年4月，商汤在国内率先发布了“日日新SenseNova”大模型体系，发布时，徐立提到，通用模型的能力比单纯的规模更重要，商汤在过去积累了不少客户，解决了很多行业问题，因此积累了大量真实数据，能够让模型在通用的基础上，在垂直领域更好用。在此后一年3个月的时间内，“日日新”迭代至5.5版本，交互效果和多项核心指标实现对标GPT-4o，也是国内对标GPT-4 Turbo领先的国产大模型之一。

目前，商汤日日新大模型体系已有超过3000家企业用户，广泛覆盖互联网、医疗、金融、编程等众多垂直行业。根据IDC近期发布的市场份额报告，商汤大模型平台及应用以16%市场份额排名行业第二，AIDC服务以15.4%市场份额跻身行业前三。

商汤“大装置-大模型-应用”三位一体战略为AI大模型商业化提供了创新可行模式，应对行业挑战的同时带来新机遇，有望在未来科技竞争中占据重要地位，推动AI在各行业广泛深入应用。

免责声明：此文内容为本网站刊发或转载企业宣传资讯，仅代表作者个人观点，与本网无关。文章不构成投资建议，仅供读者参考，并请自行核实相关内容。

商汤“三位一体”战略：大装置、大模型与应用协同开启AI赋能千行百业新时代

相关新闻

滚动要闻

专题报道

专栏

热门阅读