本报记者 曲忠芳 李正豪 北京报道
“华为的盘古大模型不作诗,只做事。”近日,华为常务董事、华为云CEO张平安如是公开表示。据不完全统计,最近3个多月,已有近80个国产大模型公开发布,其中约30个大模型在WAIC大会期间展示。《中国经营报》记者观察到,受制于大数据、大算力的高门槛,大部分的国产厂商并没有选择面向C端的通用人工智能,而是与华为类似,更多地强调“做事”——落地行业或场景,做行业垂直的大模型。
“目前许多国产厂商都在往To B或者To B向To C里‘钻’,这是一种明智,也是取巧的策略。”谦询智库合伙人龚斌指出,因B端场景相对复杂一些,很多场景对精度、时延、数据隐私安全性要求高,还不太需要大语言模型的通用、泛化能力,使用比以往稍大的模型就能解决现有的业务问题,做行业大模型或细分场景大模型,可以慢慢做,逐步改变AI开发范式,而不用一步到位。
在龚斌看来,上半年创业及产业市场的大模型热潮,已折射到资本市场的AI行情,率先受益的是AI供给侧的算力、模型、数据等基础设施产业链,而今年下半年将有望迎来AI从供给侧转向需求侧的拐点,逐步迈入类似上一轮移动互联网周期中各类物联网终端变革与需求的新阶段。
行业领域大模型的“打法”
成立于2017年的维智科技在WAIC期间推出“时空AI”城市级大模型,在城市治理、社区治理及商业决策等领域实现了行业突破与应用落地。维智科技创始人兼董事长陶闯在现场介绍了做时空AI大模型的背景及其落地价值,由此可以一窥国产AI大模型的“打法”逻辑。
陶闯坦言,“数据要素谈了很多年,涵盖许多问题,今年因大模型的诞生,大家才知道如何真正地把数据的价值挖掘出来。当数据没有价值的时候,谈数据流通、安全等都是在谈表面的事情。”维智科技深耕智能城市领域多年,用数字化方式管理城市成为主流趋势。在陶闯看来,评价任何一个组织、企业、行业甚至国家的发展,核心就是数据资产的丰富度与完善度。当下无论是政府还是企业,都开始进行数据要素化或资产化。
陶闯表示,维智科技基于自身的框架解决的是城市数字孪生的大模型体系,完全使用AI的方式来思考城市如何被数字化。概括来说,第一是时空化,即把中国分成5亿个格网,每个格网打1万个维度标签;第二做知识图谱化,因为城市是动态变化的,每个空间之间会产生很多关联性,即所谓的时空动态,以图谱的方式表示动态性和关联性,才会真正产生价值,目前已建立了千亿级以上的图谱;第三,在前两步的基础上搭建城市级大模型。数字城市发展的本质之一是融合,将分散的数据资源、信息感知、运行系统相融合。维智科技历时5年打造的“时空AI”技术体系,逐步完成了对城市大规模复杂数据和业务决策体系的融合与链接,即“城市大模型”,由此再去拆解领域大模型真正实现价值闭环,从政务、商业、零售等行业及领域再划分。基于汇聚亿万标签和图谱,借力AI的能力和思维方式去解决决策难题。
同济大学教授童小华表示,新型城镇化建设管理应用时空信息、时空AI等多方技术,为数据供给、服务供给、业务供给提供了数据的精准获取、动态监测以及共享平台协同的业务管理和服务定制,其应用包括对空间资源规划、人居环境、历史文化等等。随着AI大模型的出现和应用,这些模型具备针对新型时空要素的生产解译能力,并拥有处理海量复杂数据的智能分析和决策能力。
“百模大战”或将出现分化
浦银国际在最新研报中指出,行业大模型或成为衍变趋势。未来大模型会进一步分化为通用、专用和特定场景。市场普遍认为,从行业特征来看,通用大模型未来只可能是少数巨头最后胜出,主要考虑巨大的资金投入,基础大模型并不适用于数量众多的中小企业。通用大模型并不能解决很多企业的具体问题,而模型的大小,主要还是取决于企业用户的自身需求,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。垂直行业的模型未来或成为大模型加速普及的关键,通用公域数据叠加行业数据,共同构成了产业大模型的训练数据来源。行业大模型的未来趋势特点还包括:场景集成化,AI原生化以及部署工业化等方面。
同样在WAIC期间一口气推出三款大模型的天壤智能,避开了“类”路线,打造基于大模型产品中形成的,面向开发者提供全栈式的支持体系。天壤智能创始人、CEO薛贵荣表示,大模型的出现革新了人机交互的方式,所有的应用和平台都要基于大模型重新进行开发,大模型不仅激发了个人创新力,也给政企软件等带来了诸如应用效率提升、交互变革等新的机会。
薛贵荣指出,面对竞争日益激烈的语言大模型酣战,AI应用落地才是重中之重。仅靠有限的底层大模型提供商,以及语言大模型国产化面临的困难,很难发挥出语言大模型真正的威力。天壤智能认为,大模型目前还面临几个较大的挑战,包括大模型“幻觉”——“一本正经地胡说八道”、政企私有数据的保密性要求、企业级中文大模型、大模型存在封闭性等。基于此,天壤小白通用语言模型创建了一个规避体系,通过精准的语义搜索引擎增强了大模型基于准确事实的生成能力,在生成文本前后检索相关事实信息,对输入和输出进行验证,以确保内容是正确合理、完整一致的。
商汤智慧城市公共业务销售网络解决方案总监孙杨认为,人工智能发展的新范式包括大模型的应用,如端到端解决复杂任务,以及以大模型推理训练为核心的基础算力设施。商汤科技在大模型方面的探索与创新以及应用广泛,涵盖自动驾驶、医疗、政务和城市治理等多个领域。商汤已在20多个行业完成了落地,500多家企业申请了商汤的“商量”语言大模型。
就在7月7日,由腾讯研究院、同济大学等共同编制发布的《人机共生——大模型时代的AI十大趋势观察》报告显示,垂直领域应用是大模型的主战场。随着生成式AI技术的飞速发展,它已在多个领域催生出全新的商业价值。尽管这些模型处于扩展的早期阶段,但第一批跨功能的应用程序,在金融、零售、政府、制造、物流、地产、教育等多个行业,以及财务、HR、客服等应用场景展现出色的能力。各行各业都将迅速整合大模型的能力,创造全新的商业价值。与其他颠覆性技术一样,这种变革一开始会缓慢发展,然后迅速加速。