大厂赶超ChatGPT谁能笑到最后

AI资讯3年前 (2023)发布 fengdao

171 0 0

吴甜副总裁身穿黑色内搭，外穿白色西服外套，短发干净利落，出现在AI大模型技术能力评估报告大会上。前一天晚上，她还在修改议题，但在会上，她自信满满地宣布：“新版本文心一言能力已经超出ChatGPT 3.5，这也是在我们国内开展相关技术工作是重要的里程碑。”

这是继科大讯飞刘庆峰提到星火大模型即将赶超ChatGPT后，又一家大厂正式确认大模型超过ChatGPT。文心一言3.5赶超ChatGPT3.5，很大可能是在功能方面新增了插件机制，文心大模型3.5通过插件方式扩增了大模型的能力边界。

大模型强调大模型技术实力和底座能力。今年5月份，百度上线的新底座大模型正是文心大模型3.5，该模型是文心一言系统的基础模型，给了文心大模型扎实的底座基础，也让文心一言3.5成功赶超ChatGPT。

值得一提的是，在基础模型训练中，3.5版本还采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略，这大大加快了模型的迭代速度。

百度一直在深耕全栈式人工智能技术研发，共四层：芯片层、框架层、模型层和应用层。芯片层有昆仑芯；框架层有深度学习平台飞桨，有力支撑了大模型的高效训练和推理；模型层有文心大模型；在应用层，目前有15万家企业申请接入文心一言测试。

其中，飞桨平台已经有750万开发者，对比中国软件从业人员800万—1000万，尽管软件从业人员和深度学习开发人员不完全一致，但在人才数量上的优势也为文心3.5赶超ChatGPT提供了大容量智库，类似超脑的存在。

中国企业在获得中文语料和对中国文化的理解方面，相较于外国企业本来就有着天然的优势，中国制造业门类最全，具有面向实体产业训练产业AIGC的有利条件。

众多因素合力助推，文心大模型3.0为基座的文心一言发布一百多天后，在飞桨与文心的协同优化下，文心大模型3.5成长飞速，最新模型效果提升50%，训练速度提升2倍，推理速度提升30倍，成功赶超ChatGPT。

在基础技术之上，百度额外开展了三大增强技术：知识增强、检索增强和对话增强。将大模型类比成人类，人如果用知识结构，知识体系的方式进行学习的话，学习效率更高。再学会使用工具进行搜索，实现端对端的极简化检索，又可以提升时效性。大模型自己学习完之后，还得学会反馈式强化训练，对话增强很像是不断让大模型在做题，在对话中告诉大模型哪里对，哪里不对，通过提示的方式，让大模型能够增强记忆机制，有效的让他按照我们希望的方式来回答问题，教会这个孩子怎么样回答的更好。

除了技术实力，大模型需要落地。在行业应用方面，百度文心大模型源于产业实践，服务于产业实践，已经摸索出大模型产业落地的关键路径，还发布了涵盖众多行业和领域的大模型，加速对行业智能化转型。目前，国家电网、浦发、泰康、吉利、哈尔滨市、深圳燃气、TCL等企业单位，百度文心大模型均有合作。

此外，百度十年来研发投入超1000亿，2021年核心研发投入占比超23%，人工智能专业申请量和授权量连续5年排名国内第一，深度学习专利申请量全球第一。百度能在AI大模型领域有突破，与百度在要素资源上的大力投入也息息相关。可以看出，大厂大模式，拼研发的时刻到了。