马斯克联名呼吁暂停AI大模型研发6个月,理由是给社会带来风险,其曾称人工智能可能会毁灭人类文明;比尔盖茨说GPT是他一生中第二次让他印象深刻的技术演示,上一次把他送上世界首富的PC图形界面;而黄仁勋发布人工智能芯片H100,称是AI时代的时刻。
上线5天用户破百万,两月用户月活过一亿,成为历史上增长最快的消费级应用,手机用了16年,web用了7年,用了4.5年,只用了两个月。
企业老板们要思考业务会不会被人工智能重构,如何转型升级业务和商业模式,而打工人焦虑的是会不会失业,会不会被人工智能替代,如何提升自己在人工智能时代的竞争力。而在这波热潮里,送水类服务,账号买卖付费社群etc,已经挣到第一桶金。
在这些讨论里,除了技术创新带来的震撼和可能性,也有各利益相关方的推动,媒体需要新流量,资本需要新故事,创业者需要新希望,普通人需要新话题,多少带点情绪和煽动,不一定都是事实,很多结论是基于成功的归纳总结和包装。
00
要点
带来的不是人工智能技术范式的变化,它真正创造的价值,是让每个像我们一样的普通人用上了AI这个生产力工具,它将开启个体大规模应用AI的智能时代。
不是,而是个超级APP,它是个微信,依然需要依赖其它硬件和平台上去输出自己的能力。
自然语言交互,对后面整个互联网软件应用生态,是一个变革性的能力,所有应用都能用AI式的交互再做一遍。
大模型的竞争,是资源的竞争,最终的格局可能是BAT+H+T5家和一两家创业公司+多家垂直行业大模型共存。
意义是人赋予的,对意义的定义和感受,是人跟机器最大的不同,意义来自于体验,创造和分享。
职业划分这个事情,为了简化,但未必合理,有时代的局限性,更需要讨论的是什么能力会被替代,而不是什么职业会被替代。
01
它是什么
的表现形式是一个聊天机器人,是基于GPT( Pre- )自然语言处理大模型衍生的一个应用。相对于其他同类的产品,在上下文的理解,回答的准确性,广泛的场景支持,都有非常突出的表现,突破点在于它引入了RLHF:基于人类反馈的强化学习方法。
它在尝试做一个通用人工智能AGI( ),从局部AI到通用AI,从垂直行业到所有行业,它是一个通用人工智能的雏形,是通用人工智能的一种可能性。
它像一个全能全知的助手(如果这个能力所有人都可以用,未来世界是怎样?个人的竞争力在哪里?你怎样与别人不同?),有整个人类的知识体系,能随时调用回答你的问题,它可以对这些知识做排列组合展示优化,给到最匹配用户需求的答案,本质上还是Y=F(X)的解法,只是X是上一步生产的Y,它依然是个概率匹配的问题,只是在对问题的匹配概率更高效果更好。
在当下,我们很难说它有创造知识的能力,更不会像人一样有情感,之所以有时候感觉像人,或者回答很有用,部分是因为用户在使用时就设定了自己对机器「人」的期待,另外是在产品的设计上,产品经理功不可没。
一是它模拟人类对话的方式甚至是语气词,让自己感觉与人对话的温度。二是在答案呈现的时候,结构化的列个一二三,显得逻辑很清晰,满足人性对确定性的需求,人很容易被这种的形式的答案说服,即使很多时候的答案并不准确。三是答案输出有时快有时慢有时要等好久,特别是一个字一个字往外蹦时,会有一种跟人在交流的错觉。
到目前为止,人工智能70年的发展历史,是大力出奇迹的历史,更多的数据,更多的参数,更强的计算能力,做出一个更好的算法模型,这种形式对算力的需求会不会有瓶颈?算法模型大到一定程度对效果提升是不是有局限?
GPT是个黑盒,我们不知道达到这个智能程度,它结构是什么,能力是从哪里涌现出来,甚至的人再做一遍都不一定能保证这个效果,当我们没有办法解构它,我们就没法理解和预测它,那未来它智能的天花板在哪里,这是个问题。
当然,单纯讨论的能力到底行不行,没有建设性,只是需要对AI的能力边界有个清晰的认识,最核心的事情,其实是如何把GPT和的能力结合到现有产品和行业上。
02
当下AI处在什么时间点上
带来的不是人工智能技术范式的变化,它是神经网络模型的优化,也谈不上是数字化体系的下一代计算平台和新模式升级,它更多的是对当下数字化平台的补充、提升和加速,它更像是一个微信级别的超级APP,内核是GPT模型。
但不影响它开启的AI对互联网和各行各业变革性的改造,它真正创造的价值,是让每个像我们一样的普通人用上了AI这个生产力工具,它开启AI大规模应用的智能时代。
如果AI在当下和局部很难理解,那么拉大时间尺度,拉出结构,找到它的驱动力,能帮助我们更好的去分析它。
AI技术的成熟度
代表的生成式 AI只是AI的一个细分方向,一个起点,处在期望膨胀期,距离真正的落地创造价值,还有2-5年的时间,很多时候我们用觉得,很有用,是它启发了我们思考和学习,它离正真的价值创造,还有一段路径,简单来说就是你付的会员的钱,通过挣回来了吗。AGI通用人工智能的阶段就更为早期,通用人工智能这个命题是否成立,还值得商榷。
数字化的体系结构
数字化的本质,是针对大规模的信息,通过计算平台,用芯片+算法,来提升我们解决任务的能力。相对于人脑+其他工具(算盘、笔和纸张),它的计算能力更强,规模更大,产生的效益也越高,它是大脑的部分替代和延伸,AI是用来提升数字化计算的效率和交付需求的精准度。
数字化的发展,基本上都是由计算平台的发展和规模驱动,平均每12年有新一代的计算平台诞生,每一代计算平台的诞生,都会产生数字化结构性的机会。计算平台核心的结构,由前台、后台构成,前台以交互的效应和规模来驱动。后台是以计算资源的规模和能够覆盖的空间来驱动。
判断是否是下一代计算平台,主要是看有没可能形成新的商业生态,前端是否有更自然高效的交互方式,新终端硬件的成熟度,是否有杀手级应用,以及其他基础支撑技术能力是否成熟,特别重要的是有没有一个定义性的体验产品来驱动生态的发展,如web时代的浏览器,移动互联网的。
PC时代的交互是从笔跟纸切换到图形界面,硬件是图形化PC,企业办公软件是杀手级应用,它把企业的办公和管理数字化了,商业生态是以为核心的软件开发者生态。
移动互联网的交互从鼠标键盘转到手指和触屏,是定义性的产品,微信类社交产品是杀手级应用,应用商店则驱动了整个商业生态的正向循环,它数字化了人的行为,手机成了人体器官的延伸。
元宇宙是下一代互联网,AR是下一代计算平台,但在当下,不管是在多模态手势语音交互方式的提升,硬件入口XR硬件产品成熟度,杀手级的应用,还有整个商业生态的建设,都遇到瓶颈,但它的普及只是时间问题。
GPT很像会开启下一代的计算平台,它有更自然的交互方式,也有商业生态形成的可能性,但是目前还缺少支撑它新的硬件终端,后面很有可能是AR眼镜或者机器人。
不过AI人工智能本身是个技术形式,它不像互联网和元宇宙,是模式的概念,把当下为代表的AI去和以往的计算平台对比,没有太多的可比性,也会产生很多误导。它没法类比开启移动互联网的,GPT4不是,不是iOS,也不是App Store。
GPT是个AI技术基础设施,是个算法模型,他更像是一个可调用的中心化的能力,通过API的形式展现,需要依赖电脑和手机等终端上,给各类型的应用做赋能,提供新的产品特性。
是个超级APP,它是个微信,依然需要依赖其它硬件和平台上去输出自己的能力,是微信小程序,基于微信平台的能力,会衍生出各种基于微信组建构建的应用。
如何基于现有的互联网平台和商业生态,用GPT的能力,把原来的应用用AI提升或者重构一遍,像微软把自身产品用GPT重构一样,或是基于这个超级APP去构建轻量化的小程序,是一个值得参考的路径。
人类文明演进的范式
人类财富增长的历史,是技术驱动的历史,技术是推动人类发展核心的驱动力,经济是技术外延的表现形式。
技术的本质,是通过改造自然现象,来满足人类需求,它通过不断的组合老的技术,不断的满足人类各种形式的需求,来推动社会进步和经济发展,技术对自然现象改造的能力越强,对人类需求的满足范围越大越精准,社会财富总量的创造就越快越大。AI通过算法提升改造自然现象能力和更精准满足人类需求。
整个宇宙,一切事物可以简单的总结为:宇宙=能量+信息,能量是一切的源头,物质是能量的表现形式,信息是能量和物质的符号,组织和调用方的式。
能量密度越大,对能量组织效率越高,产生的效益就越大。AI通过算法,提高信息的组织效率来提高了能量的转化效率,能量转化效率的提高,意味着技术满足人类需求的能力越高,人类财富就自然增长就越快。
农业文明把太阳能和人的劳动力,通过光合作用转化出来食物,食物是最大的财富,工业文明把能量密度更高的煤和石油,通过电和人的知识技能,更高效的转化成财富,所以有了飞机汽车,而数字文明本身,能源并没有太多改变,但是组织能源的方式发生了极大的变化,计算机和人工智能,把数据转化为信息,在信息中抽取知识,用知识来组织,提升人类社会现有的资源和能力,把财富创造的总量和速度提升到一个更大的量级。
从这个角度看,GPT开启的不只是下一个计算平台,它会颠覆原来所有计算平台和商业生态,不只是数字化计算平台的升级,而是数字文明范式的更新,从原来的信息时代,跨步到智能时代。但它不会来得太快,人往往太高估一个事情短期的影响,忽视中期的影响,低估长期的影响,互联网把世界拉平,人工智能把世界缩小。
以上都是类比和归纳,它的局限性在于,希望用过去小模型的经验去预测大模型可能发生的不确定的未来,发布的时候,我们并不知道它会开启一个怎样的新时代,虽然很多人都会说第一眼看到就知道新时代来了。
当下我们所处的时间点是AR、VR、5G、AI、区块链,3D等各种快速融合发展的阶段,AI与其他技术相结合,会创造出很多新的东西,创造出新的行为、思维模式、工作方式、商业模式和新的不确定性。
在确定性消失的时代,思想最大的问题是以为确定性的方法可以解决不确定性的问题。
03
带来的可能性
更自然的交互
生成式AI可能会创造出一种更为深刻的人机关系,用户端的最大变化,是因为后端智能的提升,信息展示架构更简单,降低了前端的交互复杂度度,相对移动互联网,从触屏操作到自然语言交互的升级,它的交互路径更短更自然,拿求职应用举例:
原来用户需要浏览大量岗位信息才找到匹配的工作,现在只需要说几句话,AI就能精准的给你匹配工作。求职1.0是上51job投简历等电话,求职2.0是上boss直聘刷招聘需求直接找老板聊,基于AI的求职3.0可以直接通过自然语言的表达,跟机器人聊。
在聊天过程中让AI推荐最合适的工作,减少求职者大量信息的筛选,降低使用门槛,提高匹配的效率,它的产品形态,可以就是个式的对话框。
PC互联网是鼠标+键盘 mouse+,移动互联网是手指+触屏++GPS+,AI时代是自然语言+麦克风voice++各种。
这也是整个人机交互的趋势,它沿着信息展现越来约简单,交互越来越自然,路径越来越短,精准度越来越高,互动性越来越强的方向在发展,最极致的情况是脑机接口。
自然语言交互,对后面整个互联网软件应用生态,是一个变革性的能力,所有应用都能用AI式的交互再做一遍。
商业模式的变化
类生成式应用一个很大的特点在于,上线即可以收费,不像互联网应用,需要先免费圈用户再找盈利模式,相对于互联网提供信息,移动互联网做交易和服务的撮合,类的生成式应用,一上来就能直接提供价值,或者说它提供的是生产力工具,所以它能直接收费,从免费到收费,这是无到有的巨大区别,也能从中看到此类应用的价值。
如果你开发一个生成式AI应用,还需要思考要不要收费,那你需要思考的是,这个应用,到底有没有为用户创造价值,它值得做吗?
超级个体和公司小型化
超级个体和公司的小型化趋势,在短视频和直播已经体现的非常明显,微信抖音等超级平台提供了完善的生态和工具,让每个有特长的个体,都能基于平台创造价值。
带来了低成本强智能获得方式,提高价值创造的速度,企业和个人能以足够低的成本以及便捷的方式获得这个能力,来提高生产的效率,从而减少团队的规模,甚至是产生一人团队,对大公司也一样,公司平台汇集资源,下面落地具体业务的团队会越来越小,有时候团队规模太大反而会产生太高的协同成本。
创造价值,很多时候不是凑够一波人,而是找到合适的方法路径,善用合适工具,网传营收一个亿美元的图片生成工具,核心团队只有11人。
04
带来的机会和挑战
带来这波AI的浪潮,算不算个大的结构性机会,我不知道,机会有大小,有时间点,但没有高低,对个人来讲要看合不合适,对企业来说要评估的是是否在战略规划上,能不能提升现有业务价值,有没有竞争优势。
但能确定的是,它将对每个企业的运营,对每个个体工作与生活,都将产生非常大的影响与挑战。
大模型
当下吸引眼球的是做中国的AI大模型,把别人干过的事情用中国式的方式再干一遍,赛道足够性感,也足够拥挤,对数据,算力,人才密度,资金,节奏把控的要求很高。
基于中国的国情和互联网环境,最后的终局可能是BAT+H+T5家和一两家创业公司+多家垂直行业大模型共存,参考下当下中国自然语言处理和云的产业格局。
有一个比较大的问题是,大模型,怎样才算大?是否需要专门的人工智能模型或垂直行业模型用于不同的用途——比如一个用于教育,一个用于医疗,另一个用在制造,还是只需要一个通用的人工智能?
中国大模型是个相对确定的事情,基本可以照着的路径往前走,但确定性高的竞争,通常是资源的竞争,未必是模型和算法本身,特别是云的竞争,大模型可以算是云原生,云厂商和大模型厂商的竞争关系会非常微妙,即有竞争也有合作。
大厂本身有算力,数据,人才,最重要的是有具体能落地的场景和应用,大模型可以直接赋能给自身产品,提升现有产品的竞争优势,创造商业价值,缺点在于本身有盈利压力,还有各大业务线的相互限制,普通大众和股民的期望过高, bard和百度发布文心一格发布后股价暴跌就是个很好的例子。
从各个方面看,创业公司都没有太大的优势,除了没有组织和业务的包袱,更适合当下快速变化不确定性的环境,可能就是叫相信相信的力量,也证明靠使命和愿景驱动,未必会比资源丰富的大公司做得差,但这个关键点在于,当时做的是创造,当下大家想做的更多是复制,这有本质上的区别。
当然,对做通用大模型公司来讲,沉淀基础能力后做垂直行业的大模型或者应用,先放再收,可能是个更好的选择,通用大模型创造的价值最大,但是创造价值,跟获得价值是两回事,如果非得把比作做操作系统的话,那获得最大价值的,不是操作系统,是基于操作系统的应用。
如果沿着的路径走,未必能跑出来,这里还有几个挑战:
1、GPT3发布于2020年,GPT4早在2022年8月就发布了,这中间的差距最少两年,能否追赶或者得花多长时间,追上了意义有多大。
2、大模型盈利模式不够清晰,投入到实现盈亏平衡的时间是多长,特别是在国内这种竞争环境下。
3、 GPT会以什么样的方式落地到中国。