多模态AI概念持续发酵 应用落地有望加速

上海证券报 2024/02/02
导语

2月1日,A股人工智能产业链再度反弹,Choice人工智能概念板块整体上涨2.37%。其中,多模态AI概念股盘中异动拉升,科大讯飞涨超6%,大华股份、昆仑万维涨逾4%,中文在线、三六零、拓尔思等纷纷跟涨。

所谓多模态大模型,是指能够处理图像、文本、声音等多种类型数据的深度学习模型。过去半年来,OpenAI、谷歌等争相推出多模态大模型,国内阿里云也发布了多模态大模型Qwen-VL。

2023年,AI“狂飙突进”了一整年。在产业层面,国内外科技巨头围绕AI大模型打响了“百模大战”;在资本市场,AI概念成为市场主线之一。展望2024年,机构人士认为,大模型领域的竞争将进一步白热化,多模态大模型将成为生成式AI的重点发展方向,并有望推动本轮AI行情进一步扩散。

一方面,多模态大模型的算力需求远高于纯文本模态,有望推动算力需求的持续爆发。中信证券表示,在传统的纯文字语言模型中,24MB的存储空间可以处理约4000至6000个单词。如果假设使用500个单词来描述图片中的全部信息,那么处理图片所需的算力大约是处理文字的8至12倍。基于此,AI多模态对算力、存储的需求暴增,将为这两大产业链带来更大的想象空间。

东吴证券同样认为,多模态大模型需要处理的数据量更大,比如谷歌的多模态模型Gemini有万亿参数,训练所需的算力是GPT-4的5倍。随着算力需求的进一步提升,芯片制造、提供云服务及模型微调的企业有望迎来更多的发展机会。

另一方面,相比单一模态的大模型,多模态大模型拥有更大的应用想象力。东吴证券表示,多模态是AI商业宏图的起点,有望真正为企业降本增效,且企业可将节省下来的成本用于提高产品、服务质量或者技术创新,推动生产力进一步提升;同时,也可能出现新的、空间更大的用户生成内容平台。

具体而言,长城证券认为,多模态能力的突破有助于拓展AI应用场景,传媒行业中游戏、影视、广告营销、数字媒体等板块均有望受益于AI多模态能力的提升。

在国盛证券看来,AI文生视频是多模态应用的下一站。文生视频即根据给定的文字提示直接生成视频。随着文生视频技术的日趋成熟和广泛应用,或将为当下热门的短剧市场带来变数。该技术有望极大降低短剧制作的综合成本,为解决“重制作而轻创作”的共性问题提供解决方案,短剧制作的重心有望回归高质量剧本创作。

此外,中信证券表示,多模态大模型算法的突破将带来自动驾驶、机器人等技术的革命性进步,持续看好本轮生成式AI浪潮对科技产业的长周期影响和改变,继续关注算力、算法、数据、应用等环节的领先厂商。

编辑: 郭峰
关键字: AI

专栏