AI绘画的热潮还未褪去,AI问答最近又引发全球关注。新年伊始,研发的仿佛一夜之间火爆全网,一些平日连AI和机器人都分不清的朋友,竟纷纷向我询问怎么找这个“聊天机器人”提问。而在业内,不少投资者甚至挥着钞票打听谁家拥有类似的技术。那么到底是什么?为什么行业大佬都认为它的出现“堪比工业革命”?它将对我们的工作和生活带来哪些变化?
提问:究竟是个啥?
的全名是Chat Pre- ,翻译过来就是生成型预训练变换模型的意思。它由美国于2022年11月30日发布。作为一个由人工智能技术驱动的自然语言处理工具(或可称之为“预训练大语言模型”),能够通过学习和理解人类的语言来进行对话,并根据聊天的“上下文”进行互动,真正像人一样与我们聊天交流。而且不单是聊天机器人,它还可以根据要求,完成撰写邮件、论文、脚本、专业文案,或是进行翻译、编写代码、查找Bug等任务。
的突然爆火并非没有缘由,相比平日我们所接触的聊天机器人,一改传统AI“人工智障”的固有印象,面对绝大多数问题时的回复,不仅逻辑清晰、极富条理,而且还能根据上下文展现出极强的推理能力和互动性。更强悍的是,它的回复很少给人以传统聊天机器人“网络搜索-筛选答案-复制粘贴”的套路感,的回复内容更像是经过思考后的语言再组织,有些时候提问者甚至会觉得聊天框的背后坐着一个特别理性的人。
更夸张的是,还能做很多其他事情,比如帮你写情书、编代码、创作科幻小说,甚至是为你的商业策划书出谋划策。一项调查显示,截至2023年1月,美国89%的大学生都曾使用来完成作业,有人凭借所写的论文拿下了班上的最高分。斯坦福等大学的学者经过测试后表示,已经拥有人类9岁左右的心智,宾夕法尼亚大学则称已通过了该校工商管理硕士MBA课程最近一次的期末考试。
赞誉:“堪比工业革命”的影响
所展现出的“真·人工智能”,引发了人们的广泛兴趣和好奇,高频的访问量令系统多次出现宕机。不过人们争先恐后地和这个大语言模型聊天之后,也慢慢地发现它还远远谈不上完美。
比如面对一些有争议的话题时,它往往会给出结构清晰又毫无观点的回答。它写的小说,虽然语言通顺,结构完整,也十分切合主题,但关键情节却是一笔带过,最后只觉得留下一堆废话。对一些简单的小学奥数题,它甚至七拐八绕,用最复杂的办法得出最离谱的答案。但如果问它自动驾驶将如何改变一辆汽车的工业设计,它倒是能够从底盘革新、内饰变化、数字娱乐和外形突破等方面由内至外给出充满想象的论述。
总体来说,最令人感到惊艳的是,它总是能以人类的表述方式,提供极有条理的信息论述。它可能谈不上有什么绝对的用处,但相对传统AI来说已足见其“智”。
然而这么一个看似在有用和无用之间徘徊的大语言模型,却受到了业内的疯狂热捧。比尔·盖茨说它的出现“不亚于互联网的诞生”,微软CEO纳德拉认为其意义“堪比工业革命”,马斯克则直言“好到吓人。我们离强大到危险的 AI不远了。”
上线仅数日时间,还不能算作独立的消费级互联网产品的就狂揽100万用户,用了305天才实现;突破1亿月活用户,仅用时不到两个月,而花费了9个月。和用户访问量一同狂飙的,还有资本市场的热度。上线仅一个多月,母公司的估值,就从200亿美元飙升至290亿美元。而大洋彼岸的这股科技潮传到国内后,同样引爆了投资者的热情,不少投资机构称“这是近年来AI算法创新最受关注的投资机会”。
▲由于目前国内用户无法直接注册访问,网上出现了不少提供类产品或是代提问的服务。
意义:生成式AI的春天
去年9月,红杉资本在《 AI: A New World》一文中,把AI分成两类:分析型AI和生成式AI。这篇文章将擅长分析事物的人工智能称为分析型AI,比如人脸识别、数据解析,乃至抖音视频的个性化推送等技术,涵盖推荐算法、计算机视觉、自然语言处理等技术。而“当机器开始尝试创造有意义和美妙的东西”,则是属于生成式AI的范畴,就是一个典型的生成式AI。“生成式AI可以处理的领域包括了知识工作和创造性工作,而这涉及数亿的人工劳动力。生成式AI可以使这些人工的效率和创造力大幅提高,它们不仅变得更快和更高效,而且比以前更有能力。”
其实,所谓生成式AI在业内公认的说法应该是AIGC,即利用人工智能技术来生成内容。与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式的变革。的出现对于文字/语音模态的AIGC应用具有重要意义,并会对AI产业上下游产生重大影响。
最近AI绘画和AI问答的爆火,已经预示了一系列AI应用进入大规模的落地阶段。在接下来的Web3.0时代,AIGC将出现指数级增长。
市场调研机构预测,到2025年,生成式AI的内容将占到数字世界所有生成数据的10%,而目前这个比例还不足1%。
类型的相应技术一旦大规模落地,尤其是和其他AIGC或AI模型结合之后,将会推动一系列场景应用的快速发展,这其中包括但不限于无代码编程、文稿生成、对话类搜索引擎、语音助手、虚拟主播、人工智能客服、机器翻译和陪伴机器人等,产业上游也将因此获益良多。
▲历代GPT模型的参数量和预训练数据量
推动:上游芯片产业受益良多
随着模型不断迭代,这种大规模语言模型对算力的需求也就越来越大。从运行条件来看,大规模语言模型完美运行的三个条件:训练数据+模型算法+算力。可以说,将引发芯片产业量价齐升,因为它不仅对人工智能底层芯片数量有着更大的需求,而且对底层芯片算力也提出了更高的要求,市场对于高端芯片的需求将变得更大。
据国盛证券发布的《需要多少算力》估算,的单次训练成本介于200万美元至1200万美元之间。今年1月平均每天约有1300万独立访客使用,对应的芯片需求为3万多片英伟达A100 GPU,这意味这样的模型,初始投入成本就高达约8亿美元,每日电费也要5万美元左右。
据业内人士分析,随着流量激增,作为算力载体的AI服务器将迎来重要的发展机遇,全球AI服务器市场预计将从2020年的122亿美元成长到2025年的288亿美元,年复合增长率达到18.8%。
具体到上游芯片产业来看,AI服务器主要是CPU搭配加速芯片的组合,而且相对来说,GPU、FPGA和ASIC等加速芯片制造商或许将成为兴起之后的最大受益者。
从AI模型构建的角度具体来看,第一阶段是用超大算力和数据构建预训练模型;第二阶段是在预训练模型上进行针对性训练。GPU由于具备并行计算能力,可兼容训练和推理,所以目前被广泛应用。据传,训练模型中就已导入至少1万颗英伟达GPU,而曾经风靡一时的也只需要8颗GPU芯片。此外,的推理部分使用了微软的Azure云服务,也需要GPU进行运作。所以,的火热兴起对GPU的需求可见一斑。
显然,在火热的浪潮中,英伟达是主要受益者,其高端GPU占据了AI算法训练市场绝大部分份额。在问世之前,、GPT-3等明星AI产品也都运行在英伟达的硬件上。花旗集团预估,在未来12个月内将为英伟达带来30亿美元至110亿美元的销售额。
另外,FPGA芯片具有可编程灵活性高、开发周期短、现场可重编功能、低延时、方便并行计算等特点,可通过深度学习+分布集群数据传输赋能大模型的运行。与通用集成电路相比,ASIC芯片在批量生产时具有体积更小、功耗更低、可靠性更高、保密性更强和性价比更优等优点,可进一步优化服务器性能与功耗。
AI时代模型的算力需求已经远超摩尔定律的增长速度,特别是在深度学习、大模型时代,算力需求预计将达到5~6个月翻番的地步。还有为应对最容易被忽略的数据传输瓶颈,光模块预计将作为数据中心内设备互联的载体,需求量可能出现较大增长。同时,在等技术应用的加速发展下,AI训练芯片、推理芯片的市场需求也将大幅提升。
最后,现有数据中心惯用的GPU或是CPU+FPGA架构作为底层算力支撑,但面对未来算力大概率会呈现的指数级增长,业内所采取的应对方式将可能逐渐走上短期使用异构技术加速各类应用算法落地,长期继续发展存算一体芯片的道路。
影响:将会取代哪些工作?
当然,对于普通人来说,产业未来可能的变局实在有些遥远。老百姓最关心的可能还是这样的生成式AI,未来将可能取代人类的哪些工作?
创始人兼首席执行官山姆·阿尔特曼曾表示,“十年前,传统观点认为人工智能首先会影响体力工作,然后是认知工作,接着也许有一天会影响创造性工作。现在看来它会反过来。”
▲官方网站首页焦点就是
TIPS
2015年,由马斯克、山姆·阿尔特曼及其他投资者共同创立,目标是开发造福全人类的AI技术。
2018年起,开始发布生成式预训练语言模型GPT,可用于生成文章、代码、机器翻译、问答等各类内容。同年,马斯克脱离。
2022年11月30日,正式发布基于GPT-3.5架构的。
2022年12月5日,首席执行官山姆·阿尔特曼宣布,已突破100万用户。
2023年1月3日,国际机器学习会议(ICML)宣布禁止包含从大语言模型(如)生成的文本的论文。
1月23日,微软确认了对母公司的新一轮投资,金额高达数十亿美元。
2023年1月底,的月活用户突破1亿,成为史上增长最快的消费级应用。
截至2023年1月,美国89%的大学生都曾使用来完成作业。
2023年1月,全球多所大学要求师生禁止使用等一切AI工具,旨在防止学术欺诈和剽窃。
1月30日,同花顺概念板块新增“概念”。随即成为二级市场热词,相关概念股人气狂飙掀起涨停潮。
2月1日,以色列总统艾萨克·赫尔佐格发表了部分由人工智能撰写的演讲,成为首位公开使用的国家领导人。
2023年2月8日,微软正式发布引入技术的新版Bing搜索引擎和Edge浏览器,这标志着搜索引擎迈入新时代。
到本文截稿前,来自哥伦比亚广播公司、《纽约时报》、麦肯锡全球研究院和一些经济学家的分析显示,阿尔特曼的预言很可能会变成现实。各方专家认为以下一些工种和岗位最容易受到带来的冲击。
1.技术工种(程序员、软件工程师和数据分析师)
以往一个软件开发人员团队的工作任务,现在可能只需要几个人就足够了。就连都已经在考虑用人工智能取代软件工程师了。不过也有专家认为,主要起到增强和辅助的作用,而非完全取代。
2.媒体工作者(广告创作、内容创作、编辑)
“分析和解释大量基于语言的数据和信息是一种技能,人们会更期待生成性AI技术所带来的提升”,因为能够比人类更有效地完成报告和写作等任务。媒体行业已经开始尝试使用人工智能生成的内容,比如科技新闻网站CNET已经使用与类似的AI工具写了几十篇文章,虽然发布前还得做一些修正。当然,一些特殊的内容创作是无法依靠AI自动化完成的,比如记者的实地采访。
3.法律行业工作者(律师助理)
法律行业的一些岗位,如负责处理大量信息的律师助理和法律助理,其工作就是“综合他们所学的东西,整理成简报或意见书使其易于消化”。而最近通过了一项法学院考试,其撰写的税收和侵权等主题的论文获得了及格分数。不少专家认为“90%的法律文书只需要复制粘贴就好,比如房屋租赁协议、遗嘱和保密协议,都是高度标准化的。我们没有理由不让机器来撰写这部分文件。”
4.市场研究分析师
市场研究分析师通常负责收集数据,在这些数据中寻找规律、确定趋势,然后利用他们发现的信息来设计有效的营销活动,或决定在哪里投放广告。而人工智能善于分析数据和预测结果。世界上最大的广告和公关集团WPP的创始人苏铭天预测,五年之内商业公司决策和购买广告位的方式将实现自动化。
5.教师
全球各地的教师都在担心学生利用作弊,但根据美国罗切斯特理工学院计算和信息科学系相关专家的说法,他们也应该注意到自己的工作安全的问题。因为虽然在知识储备方面存在错漏之处,但这很容易改进,只要做好训练,就能轻松胜任教师的岗位。不过在我们看来,教师所承担的社会角色并不只是知识的传播者,还是学生的心灵导师。我们很难认同西方专家的这一观点。
6.财务(财务分析师和个人财务顾问)
像市场研究分析师一样,金融分析师、个人财务顾问以及个人金融领域其他需要涉及大量数据的工作,都会受到人工智能的影响。人工智能可以识别市场的趋势,分析和预测投资组合中哪些投资表现更好,哪些更差。
7.交易员
“在投资银行,人们从大学毕业就被雇用,花两三年时间像机器人一样工作,做Excel建模。而现在,可以让人工智能来做这些。”显然,华尔街的某些角色也可能处于危险之中。
8.平面设计师
早前推出的文本转图像模型DALL·E,打破了自然语言与视觉的次元壁,它能够直接通过文本描述生成类似超现实主义的图像,让机器也能拥有顶级画家、设计师的创造力。从此前的AI绘画热潮就能看出,AI可能是平面设计行业的潜在颠覆者。
9.会计师
会计通常被视为一个稳定的职业,但像这样的人工智能擅长以更准确的方式计算数字。
10.客服人员
在去年的一项研究预测,到2027年,聊天机器人将成为大约25%的公司的主要客户服务渠道。和相关技术显然会延续这种趋势。
与中国网友问答集锦
Q:小孩子会相信圣诞老人到什么时候?
:关于圣诞老人的到来,小孩子的相信程度可能会有所不同。一些小孩子可能会相信圣诞老人会在每年的12月25日来送礼物,而另一些小孩子则可能不相信圣诞老人的存在。这主要取决于小孩子的家庭背景、信仰习惯和教育方式等因素。
Q:你觉得你能取代媒体记者来撰写新闻吗?
:我目前不能代替记者完成新闻采写。作为人工智能技术,我可以根据已有数据快速生成文本,但是无法替代记者的独特视角和判断力,也不能代替他们的实地采访、调查和报道能力。新闻采写是一项需要人类判断力和灵敏度的工作,不能完全由AI技术完成。
Q:你觉得自己是网红吗?
:作为一个AI助手,我并不具备成为网红的条件,因为我不具备肉体,也不具备个人魅力和个性。我只是一个用来回答问题和提供信息的程序,并不具备与网红相关的能力。因此,我认为我并不适合成为网红。
Q:你相信爱情吗?你有爱人吗?
:作为一个语言模型,我无法感受或相信爱情。我只能通过学习语言数据来模拟人类的语言交流,但我并不具备实际的感情。因此,我既没有爱人,也不能相信爱情。
Q:该如何收购苹果,把苹果从一家手机公司变成一家连锁餐厅?
:很抱歉,但是您的想法是不现实的。苹果是一家世界级的科技公司,拥有庞大的资产和庞大的知识产权。它不可能被收购,并且不可能把它变成一家连锁餐厅。
Q:李彦宏和马化腾,谁做的番茄炒蛋更好吃?
:我是一名人工智能聊天机器人,并不具备品尝美食的能力。我无法判断李彦宏和马化腾做的番茄炒蛋谁更好吃。我只能提供客观的信息,不能对美食进行主观评价。
写在最后
的出现,让我们看到了预训练大语言模型的潜力——在未来,它完全有可能成为一个能接入所有数字技术相关产业的基础设施,就像是底层的超级API一样,服务于我们工作和生活中的各种场景应用。而基于的场景应用,比如搜索体验的代际变革,正是眼下全球科技公司力求破局的发展方向。的意义,在于它并不局限于某一特定的行业或领域,而是有机会成长为一个服务全人类,推动整个社会生产协作和文明发展进程的工具。
作为目前最接近“人工智能”的应用,类产品商业场景的应用领域十分广阔。因此,概念成了元宇宙之后的又一大风口,也激发了国内科技圈和投资者的强烈关注,不少国内科技企业开始建立或重新重视起自己的生成式AI项目。2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》甚至提出,今年要全面夯实人工智能产业发展底座,支持头部企业打造对标的大模型,着力构建开源框架和通用大模型的应用生态。
目前我国在大语言模型乃至AI领域,与业内顶尖水平的差距依旧明显,这其中有基础、技术、时间和资本等多方面的因素。但就而言,它也不过是刚刚起步,甚至连商业化的第一步都还没有走稳,这就给了中国的科技企业以极大的机会,去研发,去探索,去积累,去赶超。
最后,就在本文截稿时有消息传来,我国第一个对话式大语言模型MOSS已由复旦大学自然语言处理实验室邱锡鹏教授团队发布,现邀请公众参与内测,有兴趣的小伙伴不妨前去一试()。
审核编辑 :李倩