相比于在消费端的热闹,企业级市场的商战已经打响。国内各行业都动起来了,很可能趟出一条大模型toB路线。
文|游勇 石兆
编|赵艳秋
《狂飙》里的高启强说,风浪越大,鱼越贵。现在,这正在类大模型市场发生。相比于在消费端的热闹,企业级市场的商战也已经打响。
数智前线获悉,微软已带着旗下等服务,开始拜访国内行业企业。而一家央企相关负责人告诉数智前线,百度创始人李彦宏不久前刚带队拜访了他们,讨论大模型与其核心场景的结合及应用。此前,百度宣布将于3月份推出新一代大语言模型“文心一言”,这将是国内第一家正式推出对标的产品。百度智能云也已官宣,将对外提供“文心一言”的调用服务。
2月22日李彦宏在财报发布后给员工的内部信中说,AI技术已经发展到一个临界点,各行各业都不可避免地被改变。中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。
各行业客户也开始了行动,有的已与有大模型能力的企业开始了初步接洽,有的甚至参与了大模型的内测。“类的应用看似先在消费端展开,但估计最后变现主要靠toB,现在在的刺激下,国内各行业都动起来了,很可能趟出一条大模型toB路线。”一位行业人士对数智前线称。
01
引发商业暗战
国内互联网大厂们都感受到了来自的冲击和机遇。
一位百度人士告诉数智前线,百度上下都在紧锣密鼓地做准备,公司内的工作强度很高,来公司咨询的企业和机构也非常多。这些日子,百度也密集官宣了与行业企业、机构以及合作伙伴的合作。据悉,已有互联网、媒体、金融、汽车、企业软件等近300家头部企业加入“文心一言”生态,其中甚至包括了少林寺,而一些客户已开始内测。
阿里、字节跳动、华为也都在推进生成式大模型。阿里达摩院正在研发该类产品,并计划与钉钉等生产力工具深度结合。字节在去年底已在内部几次开会讨论。一位金融行业人士告诉数智前线,字节旗下火山引擎不久前向他们推销了内容生成式模型的服务,“但都是写文案,做素材,觉得有用,但不是质变”。华为也在跟进,这件事对华为相关方面有很大触动,公司相关专家第一时间坦承所带来的启发。
相比于业内的狂热,腾讯系显得比较谨慎。数智前线获悉,微信张小龙在不久前的年会上发言说,对这种热点要保持警惕,不能一窝蜂去追。事实上,腾讯目前也未在此事上过多宣传,只是说有技术储备。据悉,企业微信也预留了接口,具备可接入这类模型的能力。
值得关注的是,这次并不是“剃头挑子一头热”,除了大模型企业和云计算公司感到兴奋外,几乎引发了所有行业的思考,它所代表的通用大模型正变成一个生产力工具,往行业场景里深入,行业接受度之广,令人难以想象。
电力行业某技术专家告诉数智前线,的热潮在央国企里引起关注,他所在的企业已开始打算投入部分资源,期望联合平台企业的大模型,来训练电力调度场景的小模型,他们认为就像云一样,大模型未来也会是一种基础设施。
柳州钢铁冷轧厂上个月开始,尝试用类产品来处理技术文档。厂长陆兆刚有一个很痛的需求,他每天需要看各种文案以及为了解决各类故障的技术文档。他希望用把需要的技术文档,从海量数据中准确地找出来,提高工作效率。
当然,相比于浅层的寻找技术文档的需求,工业领域的应用还有更大的想象空间。一位百度智能云人士告诉数智前线,电影《流浪地球》里有一个情节,大家在月球上制造地球发动机,其实就是人工智能推进下的3D打印。未来,通用大模型可进行工业设计,推动智能制造。此外,工业互联网当下有一个巨大的痛点,是有太多的接口协议,如何去实现互联和对接。未来,通过通用大模型带来的智能,它如果能自动去识别硬件的协议并进行匹配,这将是件影响行业的大事。
在家装行业,一位家装平台负责人告诉数智前线,他们正在和大模型厂商洽谈合作,希望将人工智能大模型的模块内置到设计师的设计工具里。以前设计师做出了效果图,跟客户确认,对方通常会提出新的需求,而设计师更新一版效果图需要两三天时间。现在如果能直接在设计工具里接入大模型的能力,设计出效果图之后,可以直接跟用户在场景里面聊,然后快速修改出效果图,对设计师的签单和用户的体验上都会有很好的提升。
这位负责人补充道,未来在家装设计上,“大模型可能会超过50%的一般设计师水平”。他们也已经尝试了一段时间,“现在还是有一些挑战”,主要是这些生成式人工智能对素材和数据的要求比较高,不是简单输入就能得到很好的效果。
金融业一向是利用技术红利的先锋军,对大模型也表现出浓厚兴趣。“金融保险领域本来都是NLP(自然语言处理)的大用户,不过很多用的是传统或上一代的NLP,经常达不到业务部门的要求。用GPT可以大幅提高产品能力。”一位金融业人工智能资深人士告诉数智前线,“而且,GPT会逐步进入核心环节。”
另一位资深人士说,金融业有大量数据分析工作,大模型如果可以按照数据分析师的思路和方式,实现大部分数据分析和处理的工作,将会提高业务的效率。“当然,这要看未来人工智能是否能成长出一种能力,能识别金融数据和渠道信息的真实性。”一位曾在国有银行从事大数据业务的资深人士告诉数智前线。
在生物科技领域,天壤此前将人工智能模型用于蛋白质的研究,比如大分子药、酶的改造。以前的通用做法是,拿一个长度一两百的天然蛋白质,对某些地方进行局部改造,变成一个新的蛋白质,不仅耗时耗力,且未必成功。因为有非常多的可能,它需要人工不停地去试,花大量时间去验证。现在在大模型的帮助下,能够非常快速、准确地认识一个蛋白质,需要哪一块核心结构就保留下来,然后通过生成式大模型生成一个新的蛋白质。
不仅如此,通过生成式AI技术,甚至可以生成自然界中不存在的蛋白质。据估计,人类目前已知的天然蛋白质数量为10^15,而未知空间中还有很多可能解决医疗健康、能源环保等挑战的功能蛋白质没有被触及。这些工作都需要更大的模型、更多的算力和海量数据支持才能得以实现。
在教育领域,一位从业者告诉数智前线,他们在畅想包括真正的人机对话语言学习;给定关键词,让AI写故事和画绘本;出考题试卷等应用场景。虽然人机对话之前就运用多年,包括智能音箱和各类语音助手,但普遍表现得不太智能。如果能用大模型优化体验,能带来很大的想象空间。
02
“等待国内大模型”
尽管的在消费端得到了热情追捧,但在国内的行业商业落地上表现得不尽如人意。
一家企业称,上周微软的人到他们公司推广的服务,是toB类的。但这项服务存在一些比较突出的问题:一是不允许私有化部署,只能使用微软提供的API接口。中美在应用部署上的习惯不尽相同,比如美国的很多客户,包括政府机构都习惯使用公有云,但中国很多大中客户出于安全等考虑,会要求私有化部署。
二是成本较高,不算运行训练成本,相关服务的平均价格大约为每次调用2美分。智能客服企业云蝠智能创始人魏佳星也告诉数智前线,上个月他们试运行了,感觉“一般场景很难负担得起”。他分析说,智能客服业务,每一通电话对客户的收费才0.12元,利润在2分钱左右,当这项产品的调用成本降到1分钱人民币时,行业里才可能会像用水用电一样使用起来。
上述家装平台负责人也表达了类似的看法,“用在家装设计环节,节省设计师两三天时间,花这个钱还是很合算。但如果是客服就不太划算,调用成本太高。”
三是提供的API接口目前还比较单一,只能提供几个功能,更无法与企业业务流深度绑定,更像一个大外挂。
鉴于上述原因,多家行业企业人士告诉数智前线,“真正应用需要等国内的大模型起来了”。毕竟大多数公司都不会自己做训练大模型这样的烧钱规划,只有等待国内类似的大模型出来后,看推广深度,有没有私有化部署和改造的机会。
无论是从商业模式还是成本上,行业企业都希望国内能出现比较能打的类GPT大模型。期望他们提供更切合中国企业习惯的服务,也能够在价格上更符合国情。
“再过一年,大模型的成本肯定会降下来,GPU的算力在往上涨,推理的速度会更快。而且模型本身还有很多地方可以优化,工程上做得也更加紧缩。”国内做通用人工智能的创业公司天壤创始人薛贵荣告诉数智前线。
除了上述之外,市场调研公司IDC高级分析师卢言霞对数智前线分析,大语言模型的商业化落地还面临两方面的挑战:安全和技术。安全方面在于生成的内容产生的版权问题,内容造成的虚假宣传问题如何管控,以及伦理问题。目前有些厂商在发力数字水印,向数据多媒体添加数字信息来达到文件的版权保护,人机内容生成的辨别等。
在技术方面,主要是目前问题回答的准确度仍然不够,模型数据无法实时更新,造成的答案内容不及时,中文语料库不足,导致在回答中”水土不服”等技术问题。不过,随着预训练大模型的广泛应用和升级,准确度和效率会有所改善。
而一家制造型企业的数字化资深人士告诉数智前线,实体企业最关心的还是业务层面的问题,包括供应链、产能、良率、交付时间,“新技术如果能在这些要素上取得收益才会去考虑,否则都是炒作概念,无法落地。”
让AI大模型跑出来,需要与真实场景方方面面匹配,让客户可以更低门槛、更有效率、更低成本地应用AI大模型,如何让AI大模型从巨头的参数游戏,成为产业的普惠技术,也是巨头必须要做的事情。
03
中国企业路在何方
走红之后,国内大企业的热情彻底被点燃,百度、阿里、腾讯、字节、华为、快手、小米等纷纷表态,自家有类的技术或即将推出相关产品。
由于中文比英文难理解太多,这涉及技术、汉字信息熵比英文字母高很多、互联网中文信息质量等问题,初心资本李可佳对数智前线说,国内第一版出来后,遭遇的挑战会更多,但好处是知道这里面的差距在哪里,再慢慢地跟上。“而每一次价值链的重构,都是一次巨大的商业机会。”
不过,一些人士认为,中外企业在大模型上的差距正在拉大,对中国企业能不能在技术商业上迎头赶上,有一定疑虑。但以目前聚焦最多、外界给予压力最大的百度来分析,客观来讲,中国企业已具备必要条件。
给用户带来惊艳的背后是大语言模型的功劳,而训练大模型主要是三大要素——算法、数据和算力。百度、阿里、华为、浪潮都有超大模型的训练和实战经验。比如,2021年底,百度已发布文心ERNIE,参数规模为2600亿,与海外大模型处于同等数量级上。它还可实现文字生图,具备了多模态的技能。这也是人们猜测随时可能发布的GPT-4,极有可能做的一件事。
不过,百度技术委员会主席吴华此前表示,虽然在百度文心大模型中,涉及各种理解和生成的能力都有,但是在展现方式上使用户能更加容易、以自然语言的方式去实现交互,是一个革新性的认识,对自己有很大启发。而根据用户反馈,也会快速优化大模型。
高质量的数据投喂是训练大模型的另一个关键要素。虽然未公布训练数据集,但根据GPT-3的描述,大约有31亿个网页内容、书籍、维基百科,之后还添加了代码托管平台的各种代码。此外,英语约占46%, 德、日、中文等则各占大概5%,总体为3000亿单词的语料。
业界人士告诉数智前线,中文的处理方式不能照搬。国内企业在中文数据处理上有更多经验,在中文语料上更丰富,也可借助英文语料进行优化补充。而关键的是,融入对中国文化理解的本土化AI模型,对市场和用户是最好的。国研新经济研究院创始院长朱克力告诉数智前线:据他了解,百度“文心一言”GPT模型目前在版本更新上已有较大进步,针对中文语料上做了大量调整,在快速迭代和语义准确方面能够发挥得更优。
除了上述行业因素,百度已形成了全栈布局,从底层的人工智能通用芯片昆仑芯,到人工智能框架飞桨,到大模型文心,最后是上层应用如搜索、小度、智舱系列产品等,都在“文心一言”生态圈,这四层能实现端到端优化,形成更高效的大模型 。而大模型训练有非常高的成本,全栈能力也意味着,任何一层的改进,都可能会优化和降低成本。
而大模型的发展,也会反过来推动企业的业务晋级。比如,在GPT模型上导入了至少1万个英伟达GPU,大模型应用意味着需要更多的算力。百度自研的通用人工智能芯片昆仑芯已更新了两代产品。昆仑芯科技告诉数智前线,大模型对计算的要求主要体现在算力、互联和成本三方面,而算力的核心就是人工智能芯片。就大模型而言,他们已做了布局优化,也有切实落地,在研的下一代产品会有进一步提升。
云业务也是这个逻辑。的是通过微软云对外提供服务,“文心一言”则将通过百度智能云对外提供服务,行业可以通过API和基础设施,搭建AI模型和应用。
随着企业进入深度用云阶段,智能服务已成为行业的必选项。百度集团执行副总裁、百度智能云事业群总裁沈抖曾介绍,之前企业选择云厂商更多是看算力、存储等基础云服务,以后企业对云的需求会更加聚焦智能服务,会更多看框架好不好、模型好不好,以及芯片-框架-模型-应用这四层架构之间的协同是否高效。
某种程度上,大模型等AI产品将改变云行业的格局。这一趋势已在美国云厂商中显现。2022年,美国云厂商实现高增长,以微软Azure云分析,自动驾驶、医疗制药、智能制造等需求增长,使其AI算力营收增速超过100%。AI计算正成为美国云厂商的竞争焦点。在国内,各家云厂商去年投入汽车云,也是看重自动驾驶等AI计算带来的高增长。随着AI计算、AI算法和软件、AI大模型等爆发式增长,云服务将从数字时代跃迁到智能时代,这将为云打开发展空间。这对百度智能云是有利的。此前,它已连续四年稳居AI云服务市场第一,让制造、交通、能源等传统行业受益。根据财报,2022年,百度智能云全年总营收177亿,同比增长23%。
而未来比拼的关键是,谁能降低大模型的应用门槛,谁能以更低成本提供AI产品,将大模型进行行业普惠。百度此前在文心大模型推出时,针对开发者发布了一系列开发套件、API和开发平台,同时为增加人们对大模型的认知,也实践建立文心·旸谷社区。而百度智能云也在推进AI基础设施和大量通用AI产品。这些实践对接下来文心一言的行业普惠都很关键。
这些天,一些中国创业团队也宣布将加入通用大模型的竞争中来,这为市场带来更多活力。但大模型动辄千万美金起步的基础设施建设投入和海量的训练数据需求,注定了它极高的研发门槛。有业内人士称,未来3年是巨头之间的竞争。
除了具有先发优势的百度,中国具有大模型能力的大企业随后也将有可能官宣进入该市场,而人工智能和大模型在行业市场上的开发、落地和普惠,将会是科技界下一个阶段的竞争焦点。
©本文为数智前线()原创内容
图片来自文心一格