钉钉聊天机器人接入chatgpt 拆解ChatGPT成本，太烧钱！中国科技巨头面临一场硬仗

AI资讯3年前 (2023)发布 fengdao

150 0 0

【前言】

的全球火爆掀起了新一轮人工智能竞赛，在谷歌和微软两大巨头激烈追赶的同时，国内的互联网和科技企业也迅速跟进布局。南都记者梳理发现，过去一周，表明已有相关技术布局的国内企业有十多家，如百度、腾讯、阿里、京东、科大讯飞等大型互联网企业，此外来自游戏、教育、医疗、汽车等板块的企业纷纷宣布在自身业务中接入类的技术和服务。

在此背景下，南方都市报推出了“上岗了！AI”系列专题，以线上沙龙、人物访谈、案例解读、智库报告等形式展开报道，聚焦于人工智能技术在经济和社会领域的创新应用。本期沙龙探讨由引发的人工智能角逐赛（观看沙龙回放）。

2月10日，一张美团联合创始人王慧文豪掷五千万美元求“组队”做人工智能的朋友圈截图刷屏，“我的人工智能宣言，5000万美元，带资进组，不在意岗位、薪资和，求组队。”王慧文的这条朋友圈下众多投资人点赞并表示愿意组队加入。2月13日，王慧文再发“AI英雄榜”称，“组队拥抱新时代，打造中国。设立北京光年之外科技有限公司，我出资5千万美元，估值2亿美元。我当前不懂AI技术，正在努力学习，所以个人肉身不占股份，资金占股25%，75%的股份用于邀请顶级研发人才，下轮融资已有顶级 VC认购 2.3亿美金。”

但该帖子引发了一场关于AI大模型投入成本的讨论。海通证券研究所科技产业链负责人郑宏达对王慧文的“英雄帖”发表质疑称“5000万美元够干什么的？大模型训练一次就花500万美元，训练10次？互联网的人啥都不懂，就只会营销，一点都不踏实。”的研发成本究竟如何？这么烧钱的大模型，谁有资本做？

【本期嘉宾】

李志飞：“出门问问”创始人兼CEO，美国约翰霍普金斯大学计算机系博士，前总部科学家

彭煦潭：英国谢菲尔德大学博士

金小刚：浙江大学计算机科学与技术学院教授

AI大模型究竟有多烧钱？

“可能对行业外的人来说，以5000万美元来做启动资金绰绰有余。但我们来算一笔账，以的上一代GPT3.0为标准，需要千张GPU卡级别的设备，训练三个月时间，王慧文的5000万美元仅支持购入250台训练人工智能所需机器，相当于两千张卡，所以只在硬件上的开销便使5000万美元归于尘烟，更不要说价格高昂的人工成本、电力成本、运营成本、购买数据的成本等等。”彭煦潭在沙龙中表示。

国盛证券同样对GPT技术的训练成本进行了估算。据国盛证券报告《需要多少算力》估算，GPT-3 训练一次的成本约为 140 万美元，对于一些更大的 LLM（大型语言模型），训练成本介于 200 万美元至 1200 万美元之间。以在 1 月的独立访客平均数 1300 万计算，其对应芯片需求为 3 万多片英伟达 A100 GPU，初始投入成本约为 8 亿美元，每日电费在 5 万美元左右。如果将当前的部署到谷歌进行的每次搜索中，需要 .51 台 A100 HGX 服务器和总共个 A100 GPU，这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。

国盛证券认为，在公有云上，对于谷歌等全球科技大企业而言，百万至千万美元级别的训练成本并不便宜，但尚在可接受范围内、并非昂贵。

“目前训练一次的成本就高达1千万美元，‘算力’也就是芯片的开销，就是一笔巨额成本。”李志飞同样表示，“尽管如此烧钱，大模型的参赛选手不止巨头，也不是只有一两个幸存者的‘生存游戏’。在美国，可能会是一个，不管自己做，还是收购，微软和会有一个，算一个，创业公司还会有一两个。”

钉钉聊天机器人接入chatgpt_钉钉聊天机器人开发_对接钉钉机器人

“出门问问”创始人兼CEO李志飞。图片受访者提供

中国科技巨头“面临一场硬仗”

回顾国内市场，目前已有百度宣布将推出类产品“文心一言”，百度方面表示，“相关技术，百度都具备。百度在人工智能四层架构中，有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言，位于模型层。”

阿里版聊天机器人同样正在研发中，目前处于内测阶段。钉钉方面也表示，阿里版本的的对话机器人将和钉钉深度结合。此前，曾有钉钉用户尝试在钉钉机器人中接入Open AI公司的，测试发现，钉钉机器人不仅可以接入Open AI的，开放的API接口还可以接入更多机器人，甚至是用户自己开发的机器人。

不过，目前尚不清楚，阿里内部研发的聊天机器人与钉钉将以怎样的方式结合。

腾讯方面则表示，“目前在相关方向上已有布局，专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发，基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备，将进一步开展前沿研究及应用探索。”

此外，科大讯飞回应称，主要涉及自然语言处理相关技术，属于认知智能领域的应用之一，该公司在该方向技术和应用具备长期深厚的积累。科大讯飞表示，他们已经在当前核心技术、产业场景、行业数据等深厚积累的基础上，于2022年12月份进一步启动生成式预训练大模型任务攻关，科大讯飞AI学习机将成为该项技术率先落地的产品，将于2023年5月6日进行产品级发布。

360公司2月7日在互动平台上回答投资者提问时表示，该公司的人工智能研究院从2020年开始一直在包括类技术在内的AIGC技术上有持续性的投入，但截至目前，仅作为内部业务自用的生产力工具在使用，且投资规模及技术水平与当前的 3相比还有较大差距，各项技术指标只能做到略强于 2。该公司也计划尽快推出类技术的demo版产品。

“通过布局大模型来解决中国人工智能应用入口的问题，这是中国企业必须要面临的一场硬仗，因为过去那种‘拿来主义’的方式会导致中国企业在未来的竞争中非常被动，比如在芯片和操作系统领域，中国企业是缺位的”，金小刚强调，在人工智能时代无疑是一个入口级的产品，希望阿里、华为、腾讯、百度等头部企业能够积极布局，期待接下来能有中国的大型语言模型诞生。

入局门槛：技术、资金还是决心？

国内互联网企业入局类的聊天机器人，打造自有大模型是无法跨越的一道门槛，这场竞赛中比拼的远远不止于金钱，更需要人才、决心和规划。

“打造中文版的的工程量是非常大的，在这样庞大的工程量前不确定性因素很多。对于大规模的 AI 大模型，我们的人才是非常少的，因为中国没有怎么训练出过好的大模型。过去我们的模型参数可能也很多，但不是通用的，语音识别、TTS、人脸识别都单独做一套，所以方法论也有点不一样。”李志飞称，“AI 通用大模型是一个核武器，它是有时间窗口的。人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来，小的团队就没有机会了。目前人是最重要的因素，每一家创业团队都会有自己的核心竞争力。但第一阶段最重要的是：找到真正懂核心技术的人才，并且能用正确的方式和节奏跟他们合作。”

彭煦潭则认为，对于中国企业来说发展和落地类产品的门槛不在技术而在决心。

“企业下定决心投入需要明确的商业规划和商业场景，但目前来说各类规划并不清晰。以搜索引擎公司为例，引入到底对用户的体验有多大的改善，是否能对公司带来正向的增益，目前无人能够给出较为确定的答案”，彭煦潭称，“面对一个收益不清晰的未来，企业是否还有决心去投入这样海量资源、人力和时间？这需要非常强的决断的魄力，我觉得这个才是现阶段最大的门槛。”

在全球所有科技公司中，无疑是大模型的坚定支持者。2019年，推出参数为15亿的GPT-2，2020年推出GPT-3，将参数提升到了1750亿，成为当时全球最大的预训练模型，引发业内轰动。则由GPT -3.5模型提供支持，被视为在GPT-4正式推出前的演练。

钉钉聊天机器人接入chatgpt_对接钉钉机器人_钉钉聊天机器人开发

在融资方面，2019 年 7 月，重组后的新公司获得了微软的10亿美元投资。2023年1月，微软以290亿美元的估值继续投资约100亿美元，获得 49%的股权，并加大微软各地产品与技术融合，其中包括关注最大的是搜索引擎bing，被认为对抗的搜索的带来希望。

金小刚教授表达了对国内企业形成合力的期望，“我个人认为这里面需要天才的介入，需要像阿里、百度这样的大企业来发动，将智慧汇聚在一起，形成我们自己的布局和战略。”同时，金小刚教授强调，目前GPT技术领域不适合中小型企业贸然进入，即便有天才创业者的存在，其背后也需要有微软这样的大型公司进行支持。“不应该每一个小企业都去跟风参与，我期待中国有能力的企业去引导这样一个生态，而普通公司则可以寻找特定场景，解决用户具体问题，不要盲目跟风炒作。”

“并非每个公司都要自己训练一个大模型，肯定是看投入产出比，量力而行。我们一直强调的是数据的重要性，其实最有用的数据是基于用户在使用过程中的反馈数据，把数据和模型真正结合在一起重新做训练会更有效果。而这个过程本身建立的壁垒也是巨高无比的，不是靠短期砸大量的金钱和资源就能达到，而是需要积累真实产品用户的数据。”李志飞表示，“出门问问在三年前就已经着手做大模型。未来将专注于‘通用的认知模型’，短期目标是把一个 60 分的通用大模型给做出来。中长期而言，有了 60 分的基础模型后，我会花大力去把它打磨成 80 分，从而可以在真正的商业场景里稳定使用。”

“目前更像一个玩具，而非工具”

除了资金投入之外，相关技术的应用场景是引发企业关注最多的话题，南都记者初步统计发现，一部分企业选择开发自有大模型，推出类产品，另一部分则选择与合作，目前已有搜索引擎、游戏、数字人，以及教育、医疗、汽车等板块的企业宣布将与进行业务方面的联动。

如2月3日和2月7日，天娱数科在互动平台均表示，其下属子公司元境科技虚拟数字人已经接入等模型，并已在跨境电商直播、虚拟主播直播互动等场景实现应用。2月13日开普云在互动平台表示，目前没有开放接口，但公司的数字人已经与的GPT3-003接口完成对接，该接口是的前一个版本，待接口开放后即可快速完成集成，并结合开普云的内容安全能力形成更可靠的数字人对话服务。昆仑万维集团在2月8日宣布旗下的Opera浏览器计划接入功能，其将成为全球除微软Bing必应搜索引擎、Edge浏览器之外，又一家集成功能的浏览器。

值得关注的是，目前在实际使用仍存在诸多问题，最典型的是回答内容的准确性不可控。

如谷歌在2月6日展示旗下聊天机器人Bard，由于回答中生成了错误结果，导致其母公司股价周三暴跌7.7%，短短两天，市值蒸发近1700亿美元。

微软接入的搜索引擎“新Bing”上线一周多后问题不断，有用户测试发现，新版必应在某些情况下会出现“精神错乱的”言论，甚至侮辱用户、撒谎，并试图操纵用户的情绪。如有用户询问电影《阿凡达：水之道》放映时间，新Bing给出的答案是还未上映。用户试图通过说现在是 2023 年来纠正机器人，但据称 Bing 否认了他们的说法。“我不知道你为什么认为今天是2023年，但也许你感到困惑或错误”，bing聊天机器人回答说，“请相信我，我是bing，我知道日期。”

“就的来说，目前还没有太清晰的商业模式，更像一个玩具，而非工具。首先，在技术层面，本身并非基于真正的基础数据库、知识结构，依旧会无中生有，虚构或编造答案。另外，在道德伦理和法规层面，它最大的弱点是会生成虚假的、有害的、不存在的回答，这些都蕴含着巨大的风险问题。”李志飞同样指出。

三年内能否商用尚不明朗

另一方面，从成本角度来看，的大规模商用仍十分遥远。

“首先在三年之内，GPT相关技术带来的更多是投资方面的影响，如市值股价、从业者技术战略等，并不会给实际产业带来赋能，但是三年之后它可能会对整个业态产生大幅度的刷新。”彭煦潭直言，“从运营成本来考虑，目前GPT技术所需巨大成本并不在各大行业的接受范围内，因此业界需要将GPT所需的超级大模型的运营成本降到商业上可持续的量级。而根据摩尔定律，人工智能的核心架构GPU大约在三年之内可能达到商业的期望。”

在彭煦潭看来，目前相关技术更多是属于概念品的存在，真正的商用需要对不同的行业赋能产生实际的价值。“让用户能感知到还有很长的距离要走，这部分的距离其实很大程度并不是科研上面的距离，需要各大行业在精神上做好准备，思考如何让工程落地，如何让商业模型可持续。”

金小刚教授再次表达了对中国企业掌握人工智能主动权的期望。“人工智能的方向不仅是深度学习，还有很多其他值得探索的可能性，不应该扎堆在上去找应用”，金小刚称，“大家应该认真思考如何将自己积累的人工智能技术变为产品，比如可以从AI对制造业、建筑行业、医疗、法律等行业的服务中寻找突破，背后技术的厚积使得它产品能力提升，但同时我们也要意识到商业模式的重要性，因为一个好的商业模式可以让技术真正走向工作。”

出品：南都政商数据新闻部

采写：南都记者马宁宁实习生张海若