微软与谷歌围绕的这场龙争虎斗,以出人意料的方式揭开了第一季的结局。
北京时间2月8日晚间,谷歌在巴黎举行AI发布会,向外界正式披露聊天机器人产品Bard。作为最重要的挑战者,谷歌过去两周没少为这场发布造势,但万众瞩目的产品演示却出了重大纰漏——Bard在回答“詹姆斯·韦伯空间望远镜的新发现”这个简单问题时,错误地把另一个望远镜取得的成就安给了前者。
谷歌的股价在盘后大跌7.4%,市值一夜蒸发近千亿美元。形成鲜明对比的是:投资数十亿美元的微软,半天前刚刚举行了一场小型媒体活动,发布集成最新版模型的搜索引擎和新版浏览器Edge,微软在过去两天上涨近4%,市值重回2万亿美元,并在谷歌翻车、全球概念回调之际,盘后继续微涨0.5%。
将谷歌卷入这场生成式AI大战,微软毫不掩饰自己的想法。“我们的创新,将让谷歌。我们想让人们知道,是我们让他们dance。”微软总裁纳德拉直言。
微软的尝试取得了成果,除了市值上涨,AI功能的加入也如他们预期般,看到了撕开谷歌搜索引擎长城的曙光。新版功能小范围开启试用后,Bing已经跃居至iOS免费榜的第12位,根据data.ai的初步估计,的新下载量增长了10倍。
但这场围绕的生成式AI战争才刚开始,聊天机器人能否动摇搜索引擎的市场格局还有待时间观察。此外,围绕大模型的竞争也不止于搜索引擎,今天人们正在使用的大部分软件和服务都有可能被生成式AI重塑,更多产品和服务都会被卷入其中。
甚至更进一步,随着类以及更广泛的AI能力需求的增加,对微软、谷歌、阿里、百度和国内外所有的云服务平台提供商而言,生成式AI相关能力将成为重要的基础设施,围绕后者的竞争,将成为未来数年改变云服务市场的X因素。
01
先后发布新产品,
谷歌跌了,微软涨了
上一次科技巨头之间刺刀见红,还要追溯到疫情前掀起的短视频大战。爆火后,资本、创业者和科技巨头纷纷卷入,科技圈的热闹恍如隔世。
打响第一场白刃战的是谷歌和微软,主题是搜索引擎。2月2日谷歌宣布,8号将举行现场发布会,介绍有关搜索引擎的最新产品。一周内,先是微软短暂上线疑似“集成GPT-4的Bing搜索版本”激起人们的好奇,随后谷歌总裁于2月6日公布了用于搜索服务的聊天机器人Bard,同一天,微软公布要在谷歌发布会的前一天7号举行发布会,介绍最新的搜索引擎和浏览器Edge。
“这是搜索的新一页,新的范式已经出现,军备竞赛从今天开始。”发布会上,纳德拉充满信心地宣布。走红后,业界很快意识到,大语言模型对于更新搜索产品的临界点到来了。在最新的产品发布中,谷歌和微软共同强调了这一点:以自然语言提问查询,AI基于多方信息、返送重新创作后的针对性回答。用户还可以基于首轮回答,再进行追问。
两家都给出了购物场景下的查询案例。
比如谷歌:我想为家庭买一辆新车,应该考虑些什么?Bard会建议你考虑预算、座位数、设计特点、安全性、动力类型几个维度。接下来,你可以追问,如果想买一个电动车型,有什么优势/不足?
还可以将对话的主题从选车,转移到旅行计划。你可以接着问Bard:第一次长途自驾将会从旧金山到圣克鲁斯,沿途有什么停车点?
对比之下,微软展示的产品体验则更完善。
在微软的演示中,给出了挑选电视的例子。当你在搜索引擎中输入“最好的65英尺电视”,Bing就会为你罗列出不同的产品。在展示形式上,Bing的回答会在页面的右边栏框中,这样保证了用户可以同时看到传统搜索引擎给出的链接、以及生成式语言模型给出的综合回答。这也是微软所谓的“副驾驶”体验。
当想进行追问,则可以从“chat”选项切入,进入对话界面。基于已有的答案进行追问:哪一款最适合游戏?在给出的回答中,也可以继续追问,哪一款最便宜?
从产品的形态设计上而言,微软更为完备,考虑到了问答与传统搜索模式之间的自由切换。而谷歌目前仅仅展示了问答部分的产品形态。
更关键的部分在于,在Demo的展示中,微软显示了信息来源,以角注和“”的形式供用户核实与进一步了解。在谷歌的Demo演示中则没有这个部分。
此外,谷歌还展示了向Bard提问开放式问题。例如:观星时最好的星座是什么?搜索顶部的位置也会返回生成一段答案,同样没有显示信息来源。
这带来的隐患是,当答案里有信息错误时,更难以核查。在谷歌博客中展示的第一个Demo,就出现了这样的问题。回答“怎样向9岁的孩子解释詹姆斯·韦伯空间望远镜的新发现?”时,Bard称韦伯望远镜拍摄到了首张地外行星的照片。这就是一个事实性错误,这一成就实际上来自2004年的智利甚大望远镜;此外,第一条中“2023年,韦伯望远镜发现了大量昵称为『绿豌豆』的星系”的时间也出现了错误,应该是2022年7月。
这样的事实性错误,经常犯,如今出现在了为Bard提供技术支持的LamDA。这种错误,成为搜索引擎的服务时,就会影响到使用者对产品的信任。因为没有信息来源,使用者也无法通过核对发现错误。产品Demo中出一次生成答案就出现两次错误,给用户带来了强烈的不良观感。
而没有显示引用来源,也招致了搜索引擎产的行业人士对目前产品形态的不满。“引用必须要有,希望这不是谷歌前进的方向,这样不对”,“在目前的实验形式中,我没有看到任何的归因或引用,没有链接,没有点击。这是对出版商的战争……”两位行业人士评论道。
真实产品与期待值的落差,致使谷歌盘后大跌。但这也是今天聊天式机器人产品需要面对的现实,甚至从某种意义上来说,在语言大模型积累多年的谷歌,即使将最新功能加入搜索产品,还有许多影响用户体验的问题需要解决。
02
谷歌的谨慎与无奈
从目前更新的产品形态上来看,谷歌落后微软。而从之前传出的Picha在内部发起“红色警报”()、搜索引擎两位创始人重回公司商讨AI战略等消息来看,谷歌的确是在大火之后,调整策略,紧急迎战。
的爆火,让公众形成了印象,这是目前最先进的技术。但是在学术界则认为,并没有在技术上领先很多。
乔治亚理工学院的计算机教授、机器学习专家对媒体表示,背后的技术并不一定比谷歌和Meta更好。但公开语言模型,让公众使用这一行为,带来了极大优势。
深度学习三巨头之一、Meta研究院院长LeCun对媒体表示:“()这不是什么革命性的东西,尽管公众是这么认为的”,“这是很好的组合,这是很好的做法。”不仅如此,刚刚离职的的前产品负责人表示赞同LeCun的观点,并说“这本不该引起争议”。
LeCun在上解释,“我不是批评的工作和他们的主张。我试图纠正公众和媒体的看法,他们认为是一个令人难以置信的全新的、创新的、独特的技术突破,远远领先于其他所有人,事实并非如此。”
大公司差不多同时期开始研究语言大模型。第一个重要的技术突破是2017年谷歌的神经网络架构,这也是从去年开始爆火的生成式AI模型所用到的底层技术。能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了模型对于语言的理解能力。
2017年的网络论文,成员大部分来自谷歌|来源:arXiv
随后,谷歌于2018年发布了预训练大模型BERT;2021年,发布了预训练模型GPT-3,已经表现出了很强的写作、对话能力,但也表现出致命缺陷,就是“口无遮拦”,会生产极端种族主义、暴力等相关的内容;同年,谷歌发布了预训练模型LamDA,也显示出了良好的对话能力。
最初的项目名称为“-3.5”,是在GPT-3与即将发布的GPT-4之间,因为担心对手公司提前发布聊天机器人,而临时确定的项目。工作人员接到的任务是,在两周之内快速发布一个聊天机器人。让所有人惊讶的是,它能在短时间吸引如此多的使用者,并加速了AI进入搜索产品的进程,随之引发了谷歌与微软间的较量。
走红不久,谷歌内部便开始了担忧。“对于谷歌来说,这是一次错失良机吗,毕竟我们已经拥有LamDA一段时间了。”
12月初的内部会议上,这个问题为员工们所关注。那时,谷歌AI部门主管杰夫?迪恩()表示,谷歌拥有类似能力,但如果出现问题,代价将更高,因为人们必须相信从谷歌得到的答案。在技术公开和产品化上一直行为保守,对声誉风险的担忧是重要因素。
谷歌员工们表示,多年来,员工一直在提议将聊天功能加入搜索,这也是很明显的演变趋势。但是谷歌有充分的理由不着急迭代,不仅仅因为返送更有针对性的回答会减少广告空间。而是如果谷歌提供的聊天机器人给出一个不健康或者抄袭而来的答案,就会增加责任风险。而就外部环境而言,谷歌这几年一直面临反垄断审查或诉讼,再增加这样的道德风险肯定会带来更大压力。
如今,像墨菲定律起作用一样,Bard所犯的错误,恰恰是谷歌原先所担心的问题,并在谷歌与微软第一次亮相比拼中,带来了负面效应。在技术封装进产品这一步上,谷歌因前期保守、仓促应战而落后。
摩根士丹利的分析师表示,语言模型可能抢占市场份额,并扰乱谷歌作为互联网用户入口的地位。从下载量增长10倍来看,这个担忧绝对不是空穴来风。但基于谷歌的技术储备,他也表示,期待谷歌更多的产品表现。
03
搜索引擎战之下,
AI成为战略重心
无论是微软还是谷歌,目前两家发布的新产品尚未完全放开使用。
微软的需要登记,等待功能发放。截止发稿,我多次尝试从Edge官网进入的页面,尚无法打开。
页面无法打开|来源:凌梓郡
而谷歌的Bard目前仅开放给受信任的测试人员,在这之后,将是依托LaMDA轻量级模型版本发布。“在未来几周,我们会继续向更广泛的公众开放此服务。”在博文写道。
因此,产品模型仅仅是做了演示,还没有大规模发放到用户手中体验。之前人们所关心的问题,比如胡编乱造、大规模使用的成本问题,目前还只停留在讨论阶段。
成本是必然需要面对的因素。据了解,谷歌未来会优先使用轻量级版本的LamDA,就是出于计算成本的考虑。
此前,表示,回复一次的成本为几美分。估计,每次查询的成本约为谷歌每次传统搜索查询成本的7倍,如果依托微软的云服务Azure提供最低价,可以降低到传统搜索成本的4倍。考虑到搜索是一个日均百亿级使用次数的高频行为,长期运行,潜在的成本增加是一个天文数字。
微软官方披露,这次的背后驱动的是下一代语言模型,比更强大,也是专门为搜索制定的。在发布会后的问答环节,对于成本问题,微软的态度也很干脆,“我不打算回答这个。”对于模型胡编乱造的问题,回应则是“我们从一开始就在做这件事。我们正在衡量该模型在搜索结果中哪些地方没有站稳脚跟,但它并不完美。”
纳德拉说,“AI将从根本上改变每一个软件服务类别,从最大的软件服务类别——搜索开始。”搜索引擎的变革刚刚开启,依旧有许多尾部问题需要花费时间解决。从产业角度而言,它或许意味着,以大模型为基础,AI进入了全新的阶段。这或许是微软、谷歌、Meta甚至苹果,以及国内的阿里、百度都在战略层面开始规划的原因。
目前,谷歌和微软都处于类似的时期,主要业务疲软。前不久,两家都交出了一份不太理想的财报,接下来业务增长的预期也不高。谷歌广告收入出现上市以来第二次下滑,云业务虽然保持两位数增长,但同比增速正逐季回落。微软主要的和Azure业务增速都在放缓。整体业绩疲软,收入增速为2%,持续下滑。纳德拉表示,微软在2022年末就面临着核心业务+的业绩下滑。
与此同时,两家都在财报电话会上强调了AI作为战略的重要性。
谷歌表示,从下个季度开始,其研究机构的财务状况将单独列出,体现在季报中。“AI已经成为的战略重心,我们也看到AI领域潜藏的巨大机遇。目前的研发领域将成为未来产品组合的核心。”前不久,谷歌便通过投资亿美元,成为其云供应商。
微软主要强调了在过去的三年多时间里,微软致力于训练超算、打造推理基础设施,为未来AI进入应用程序做准备。也就是意味着,微软的云设施和服务,需要嵌入更强的AI能力,“对于Azure来说,AI将是其核心组成部分”、“我们希望为大家提供的也远不止服务。如何将与微软的分析服务相结合等,都在我们的考虑范围之中。”
不难看出,无论是谷歌还是微软,都将会以大模型为基础设施,加快产业布局,其中的重要部分包括嵌入AI能力的云设施、基于大模型的API。公司AI分析师表示,微软可以利用目前与的合作与热度,获得更重要的短期回报,这便是扩大Azure、及更广泛AI和机器学习平台的需求。
长期来看,当搜索产品大规模上线,稳定提供服务,可靠性和成本将成为更重要的影响因素,这也将考验双方基础设施的能力。
大模型领域独角兽的创始人Emad曾表示,将打败谷歌的故事听起来有点愚蠢。因为谷歌拥有最好的LLM(语言大模型)全套团队和定制芯片,没有竞争对手可以在创新、成本、或者市场上和其较量。这些基础设施包括PalM(单项语言模型)、LAMDA、(少量参数语言模型)、MUM(多任务统一模型)、TPU等。
很明显,谷歌首战的表现出乎了所有人的预料。面对有的模型能力加持、来势汹汹的微软,全世界见证了一场巨人的跌倒。