企业新动作频频 加速竞跑AI大模型赛道

经济参考报 2025/02/14
导语

连日来,随着深度求索公司(DeepSeek)发布其最新开源模型DeepSeek-R1在国内外引发热烈关注,百度、腾讯、阿里巴巴、字节跳动等企业纷纷宣布旗下AI大模型、AI应用新动作,包括全面免费使用、接入DeepSeek模型以及拓展国际合作等,进一步竞速AI大模型赛道。

2月13日,百度官方宣布,随着文心大模型的迭代升级和成本不断下降,文心一言将于4月1日零时起全面免费,所有PC端和App端用户均可体验文心系列最新模型。文心一言官网还同步透露即日起上线深度搜索功能,具备更强大的思考规划和工具调用能力,并处理多场景任务,实现多模态输入与输出。此外,百度计划在今年下半年发布下一代人工智能模型Ernie 5.0,将在模型多模态能力方面有重大增强。

就在同一天,腾讯AI助手“腾讯元宝”迎来重大更新,同时支持混元和DeepSeek两大模型。据悉,“腾讯元宝”提供的DeepSeek支持联网搜索,并整合了微信公众号、视频号等腾讯生态信息源,能为用户提供更稳定、实时、全面、准确的回答。此外,阿里巴巴联合创始人、董事局主席蔡崇信确认了阿里巴巴将与苹果公司就AI展开合作,苹果公司在中国销售的iPhone手机将采用阿里巴巴的人工智能技术。

2月12日,字节跳动豆包大模型团队宣布提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2至6倍,推理成本最高可降低83%。

业内人士认为,DeepSeek有望开启全球大模型开发和应用的新阶段,重塑人工智能行业和市场竞争格局。“未来的大模型竞争将从单纯的算力竞赛转向算法效率和推理能力的提升,深度优化算法成为新的焦点。”赛智产业研究院人工智能研究所副所长安赟表示,这有望激发一波创新浪潮,推动各大模型厂商探索具有成本效益的AI开发和部署方法。

国产大模型加快创新步伐的同时,也有望加速AI行业的渗透速度和商业化应用,引发AI算力快速发展。

例如,2025年春节期间,三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。与此同时,近期百度智能云、华为云、阿里云、60数字安全集团等多个平台宣布上线DeepSeek旗下大模型。

国际数据公司IDC联合浪潮信息2月13日发布的《2025年中国人工智能计算力发展评估报告》认为,DeepSeek带来的算法效率的提升并未抑制算力需求,反而因更多的用户和场景的加入,推动大模型普及与应用落地,重构产业创新范式,带动数据中心、边缘及端侧算力建设。该报告研究显示,2024年中国人工智能算力市场规模达到190亿美元,同比增长86.9%,预计2025年将达到259亿美元,同比增长为36.2%。

“人工智能应用落地不仅需要算力基础设施,还需要算法、数据以及运维等全方位就绪。”浪潮信息高级副总裁刘军说,大模型企业加速创新脚步,通过先进的算法优化和高效的模型性能,有望激发新的应用场景的需求,拉动数据中心、端侧及边缘计算的应用发展。同时,针对高性能算力供不应求及算力利用率低问题的挑战,需要进一步推动算力“扩容”和“提效”,实现充足的多元算力供给,提高算力利用率。

编辑: 郭峰
关键字: AI

专栏