从狂热到理性务实,大模型行业应用走向深水区
证券时报记者周春媚
“今天的人工智能(AI)大模型与一年半前相比没有那么波澜壮阔了,似乎有点平静。”9月8日,在第五届深圳国际人工智能展开幕式上,华为云marketing部总裁董理斌说道。他认为,大模型现在正处于静水流深的状态,海面平静,但海面下的各行各业对AI的研究更加深入,都在考虑如何真正让AI在企业核心场景发挥价值和作用。
一个行业共识是,大模型在走向行业应用时已变得更理性和务实。证券时报记者实探第五届深圳国际人工智能展发现,相比于过往在技术层面“秀肌肉”“耍花拳”,投入、产出、效益如今成为企业更关心的话题。总体来看,大模型目前在很多行业中的应用渗透率依然不足,企业面临着部署成本高昂、需求难以匹配、效益无法评估等问题。在前期的狂热劲头过去后,应用落地的“深水区”也随之而来。
应用行业更广泛
场景更聚焦
相比于去年大家更关注AI的能力有多强,普华永道AI解决方案咨询服务团队高级经理曹磊发现,如今大家更关心业务能否跟AI结合起来。“一方面,国内的大模型厂商都在和企业合作,开发应用类的工具和服务;另一方面,我们接触的客户在部署大模型时已经延伸到各个具体的场景,比如营销、财务、合规等领域。”曹磊在接受证券时报记者采访时表示。
从不同方向上看,大模型在横向上拓展的行业更加广泛,从狂热到理性务实,大模型行业应用走向深水区纵向上延伸的场景更加聚焦。记者在华为展区看到,自去年7月发布盘古大模型3.0版后,华为盘古大模型已迭代至5.0版。除了3.0版包含的矿山、政务、气象、金融、医学等行业大模型以外,5.0版还新增了钢铁、高铁、具身智能、工业设计大模型、安全及媒体等行业。场景方面,传送带异物检测、卷宗提审、商品销量预测、偏光片质检、财务异常检测等多个模型,则聚焦行业内的细分任务。
从“通用”朝着“有用”发展,垂直化、专业化是一个必然趋势。通用大模型以参数量大为特征,模型参数量往往决定着模型能力上限。但是,规模参数越高,消耗的资源和成本也越多,对企业而言,在综合考虑成本与需求后,部署参数规模小一些、专业性更强的场景模型便成为一个更务实的选择。
以物流行业为例,顺丰科技在活动现场发布了物流行业垂域大模型“丰语”大语言模型。顺丰科技AIoT领域副总裁宋翔强调,低成本、高可靠地解决行业的问题,是大模型技术产生价值的关键所在。例如,在退货这一场景中,丰语大模型对真实的退货可以自动截取下单信息,实现一张图下单,还能实时拦截和预防虚假截图;在来电提问环节,丰语大模型可以对所有客服信息进行自动摘要,节省人工摘要的时间。
场景渗透率的
“微笑曲线”
腾讯研究院近期发布的行业大模型调研报告指出,行业大模型应用场景的快慢呈现“微笑曲线”的特征:位于产业链高附加值两端的研发/设计和营销/服务,拥有更高的行业大模型渗透率;而位于中间的、低附加值的生产制造领域则应用得比较慢。
活动现场展出的各类行业应用场景,也印证了这条“微笑曲线”。在AI绘图及视频公司来画的展区,来画打造的可控AI视频生成和可视化平台,只需要将一段口播视频、文案、图片素材导入,并将视频想要仿照的内容链接放到平台中让大模型“学习”,平台就能自动生成一段连贯的视频。无论是亚马逊还是小红书,都能与其风格相匹配。
营销服务是行业大模型应用的先行领域,无论是电商行业的数字人,还是广告行业的文案与图片素材生成,都形成了较成功的应用案例。这些场景的特点是跨行业的通用性强,且数字化基础较好,已积累了大量的行业数据,能够基于通用大模型的底座优化自身性能。
但在生产和制造环节,情况则要复杂许多。在智能机器人厂商云码通展区,一款由机械臂和仿生灵巧手组合而成的具身机器人系统颇受关注。启动任务后,该机器人能够自动识别树上的苹果,并移动至相应位置将其摘下。展区工作人员告诉记者,这一产品目前只是小批量生产,未大幅应用。“机器人应用还有很多痛点,比如摘果子,不同树高低有所不同,一台机器无法满足所有需求。”除此以外,农业机器人往往只能部署在标准化的大棚中,在山地等复杂的场景,尤其是遇到道路崎岖、倾斜路面等情况就无法作业。
企业顾虑多
投入产出比难题待解
经不经济、可不可靠、实不实用,这决定着企业部署大模型的意愿。曹磊告诉记者,大模型无论是在模型部署、算力服务、人才招募等方面的成本都很高,企业如果没有看到盈利或者对实际业务赋能,在投入上会比较谨慎。
在成本侧,记者采访了解到,算力是企业部署大模型时首先会遇到的“拦路虎”。中国联通展区的工作人员告诉记者,企业在部署大模型,光租服务器就需要几十万元甚至上百万元,目前全球算力市场被海外巨头垄断,企业在获取可靠算力上存在颇多掣肘。
围绕算力瓶颈,国内算力厂商正在加快布局,构建大模型计算所需的AI算力基石。本届展会上,多家算力公司展出了为AI大模型打造的算力方案。在专注于AI芯片研发的中昊芯英展区,一幢幢搭载着服务器的机柜模型十分亮眼。据展区现场工作人员介绍,公司历时近5年,自研了高性能的TPU架构芯片,已实现量产,可用于大模型计算场景,单位算力成本是海外领先GPU芯片的近一半水平。
曹磊认为,企业除了顾虑成本,还面临大模型应用需求匹配难的问题。“AI到底如何赋能自身的业务,挖掘AI适用的场景,这需要AI和业务两类专家协同配合。”除此以外,当前,虽然许多通用大模型厂商也研发了行业及场景大模型,但受限于高质量行业数据的缺失,适配度依然有限,准确率不足,企业往往还要在其基础上进行二次训练。但是企业要部署大模型,前提是要有良好的数字化系统,并且已有一定数据治理基础,否则就会面临数据庞杂、质量参差不齐等问题,而且还需要对海量数据(维权)进行清洗和预处理工作。
曹磊认为,未来无论大模型厂商还是软件运营类的第三方服务厂商,需要进一步在具体的业务场景中做好AI能力集成,形成企业能够直接采用的AI工具,解决好企业“从0到1”的投入问题。