前言:“原点”到来,“奇点”还会远吗?这块砖抛进了人类历史的湖泊里,可能会引起人工智能革命的浪潮原点,如果真的是那样的话,恐将改变45岁以下数代人的命运。
目录
1.了解
1.1 是什么东西
1.2 都能做什么
1.3 要如何使用
2.透视
2.1 网络安全与
2.2 安全机制与
2.3 数据安全与
3.深思
3.1 “数据石油”归属变革
3.3 “数据饲料”养殖奇想
后记-深思危机
1.了解
1.1 是什么东西
,美国公司研发的一款尚处于原型阶段的人工智能聊天机器人程序,于2022年11月30日发布。能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
的核心技术来源于名为GPT-3.5的人工智能训练模型,GPT模型自2018年发布以来,分别经历了GPT、GPT-2、GPT-3等几个版本,目前可供外界访问并使用的GPT-3模型由1750亿个参数构成,预训练文本数据量就达到了惊人的45TB(约为),规模为初代GPT的数千倍,计算量十分庞大。据外界保守估计,训练GPT-3模型至少要耗费1200万美元。
使用示例
在我看来,真正令我惊叹的地方不是其信息收集组装能力,而是其恐怖的语义理解能力。
要知道“十五派”这个名词的含义是很多元很模糊的,而通过上例可知,可以很好地将其提炼出来,并能准确将之与“信息安全”、“网络安全”区分对应,着实令人惊叹。
1.2 都能做什么
目前网上的例子实在是太多了,例如插科打诨、询问技术问题、写代码、做表格乃至安排行程等,这里我就不再展开讲这些了。
在我看来,就目前版本的而言,其能做的东西有限,如果其使用成本高度可控的话,我能想到的最大的使用场景就是可能会用来做搜索引擎的替代品。
目前的搜索引擎并不能对搜索结果进行挑选、清洗,这虽然保证了用户查阅搜索结果的自由性,但是对于大多数场景而言这其实是增加了用户的负担。而可以将其整理后的规整文本格式(或数据格式)直接返回,并辅以类人化的语言串联,极大地提高了搜索效率,当然这同样会引申出数据准确性问题,但这是可以通过技术解决的。
例如现在与微软Bing搜索引擎的结合,以及网上类似于搜索代码、让安排行程等,都是类似的应用。
举例来说,为什么很多程序员反映可以写代码?甚至可以写一个简单的游戏?
因为大多数程序员对于搜索引擎返回的结果并不敏感(虽然这些数据与信息搜索引擎已经给出了),因此其难以快速的在其中挑拣出有用的信息。而借助,则可以极大地缩短这一过程,并且返回的数据是清洗凝练后的,所以给人的错觉就是真的能写一个游戏。
由此可见,目前尚处于原型阶段的已经可以将程序员搜索技术问题的效率提高至少数十倍。
1.3 要如何使用
因为目前并不对中国大陆开放,所以使用起来还是有点困难的。
首先,我们是可以通过网络直接访问()的,通过点击相关连接可以进入到的登录界面()。
一直到现在都很顺利,但是我们显然没有账号。
而不好的消息是,注册的帐号必须要手机号,而中国大陆以及港澳台的手机号都不能注册,因此最靠谱的是我们需要一个美国的手机号。
但如何临时租用美国手机号接受验证码可能涉及到平台审核问题,因此这里不方便直接告诉大家,有需要的同学可以联系咱们十五派的客服,可以协助同学们解决此问题。
注册帐号成功后,你会发现赠送给你18美元的使用额度,然后你就可以敞开畅聊了(一次API调用大概0.01美元)。如果想要更好聊天体验,也可以在的插件中搜索“中文版”,安装后按照“中文版”的使用说明在的后台()复制后,输入到“中文版”的插件中即可使用。
当然,如果想要更加顺畅的使用低延迟版,并考虑到赠送的18美元额度有效期仅几个月的时间,也可以考虑付费版。
但付费版也有同样的问题,就是中国大陆的支付渠道无法使用,且中国大陆的信用卡也无法使用,这就又涉及到临时租用美国信用卡进行支付的问题……
2.透视
2.1 网络安全与
就目前尚处于原型版的来看,因为其样本量不足以及使用频率限制、返回信息准确性等原因,对于网络安全这种细分领域的影响还是相对有限,但也不容忽视,例如:
这些问题以及给出的回答在业内人士看来是显得有些初级,但是对于相当部分的刚入门人员来说也不失为一个有效的信息源。
特别是在脱离原型阶段后,通过更加海量的数据“投喂”,这个人工智能机器能输出的能量其实是让人很难预测的,我最好奇的想法是,这对于网安渗透攻击领域内常用的“社会工程学”技术会产生什么影响,进一步思考的话,这对于国与国之间的各种APT黑客组织的攻击强度会有何影响,对于一个网安人来说,我认为这已经是摆在眼前的问题了。
而从更长远的发展趋势来看,如果中国能有类的产品可以进行本地化部署的话,我认为国内的网络安全厂商可以在内容审查、舆情监控、员工行为管理、事态感知、防诈骗、安全意识培训以及网络安全初级咨询等方面取得质的飞跃。
而对于网络安全领域内传统的恶意代码分析、流量分析,以及由此构成的各种入侵检测系统来说,暂时无法看到落地场景。
但如果从更宏观且长远的角度去考虑,如果能对对于语义理解的能力进行有效拓展泛化,使其能够将此能力迁移至恶意代码分析、流量分析中,那么可能会引起网络安全乃至各个相关领域的重大变革。
2.2 安全机制与
可以这么说,快速构建一个合适且恰当的安全机制对于可谓是当务之急,各位可以先看看下面这两个实例:
相信各位同学在看到以上的惊悚表演后,一定想到了内容审查问题,我相信的工程师们当下(2023年2月)应该已经正意识到了这个急需解决的问题。
就目前而言,只对部分国家启用了安全审查机制,当提问内容触及部分关键词后会被自动屏蔽,但对于其他大多数地区而言,目前的还是一个蛮荒混沌的状态。
但是鉴于对于人类语言优秀的理解能力,这种安全机制恐怕并不容易建立,例如提问者可以将问题修改的无害化,且因为拥有短期记忆能力,甚至通过多个问题的串联来达到提问的最终目的。
为了避免大家误入歧途,这里就不再展示具体实例了。
2.3 数据安全与
鉴于目前拥有超强信息搜索、清洗、整合能力的仅仅是个原型产品,使我不得不思考一个令人担忧的问题,也就是数据资源的归属以及安全问题。
正如本文前面所介绍的,GPT-3的预训练数据量就高达45TB,那么未来的GPT更高版本势必需要更多的数据来对其做支撑。
而对于一个限制中国人使用的美国人工智能来讲,如果肆意的、零成本的抓取中国互联网的公开数据,进而因此将美国的人工智能训练成一个“中国通”的话,对此我作为中国人显然是难以接受的。
我们可以想象一下这个美国人工智能所拥有的能力:
– 这是一个在网络世界中比大多数中国人更像中国人的人工智能;
-这是一个聚合了中文互联网世界所有网友语言智慧的人工智能;
-这是一个抓取了14亿人对于政治、经济、文化、科技、工业领域所有智慧结晶的人工智能;
-这是一个在所有中文世界的小众领域内都能成为“圈内人”的人工智能,它甚至能熟练理解并使用这个圈子内的俚语(黑话)用以沟通;
-最关键的,这个人工智能比孙悟空的毫毛还要利害,能瞬间裂变为成千上万个网络虚拟主体,在互联网中游走,而这仅仅取决于其需要的算力与网络容量有多大……
你看看,这美国是玩的好一手“以子之矛,攻子之盾”,不知道韩非子老人家对于这个要怎么想,无论他老人家怎么想,我对这件事的想法是偏悲观的。
无论是军迷动画圈的“兔子”、“鹰酱”与“脚盆鸡”;
亦或是军武高玩圈的“热喵”、“像素”与“上真铁”;
还是用“宫廷玉液酒的下一句是什么”来鉴别网络间谍的梗;
这对于未来的也许都是小儿科,不但能无缝衔接,还能与你唠圈子内的家常,这想想就令人发指。
对于目前本来舆论战战力就基本为负,各大主流媒体政治敏感性普遍不如网友的中国来说,如果让美国把这大杀器给练成了,那在舆论战的战场上我们可能就要被踩在地上摩擦了。
当然了,可能有朋友不关心政治时事,那么也不妨把这个概念发散至其他商业、公益甚至宗教等团体上。请相信,即便是就目前的状态而言,也是搞舆论的好手。
不过这还没完,除此之外我们还可以再深入一步。
我们每个人都有一个在网络中活动的身份,这个身份就是我们在各个平台的网络ID。而与此同时,因为网络安全问题导致的数据泄露问题层出不穷,随便搞搞就是上百个GB的各种账号密码,其中甚至不乏地址、借贷信息、开房信息等。
美国会不会想到将这两种数据合二为一呢?
假如到时我去问“刘德华的网络ID都是什么?”、“吴京最近一年都在那住过酒店?”、“张译常用的快递收货地址都有哪些”会得到什么样的答复呢?
假如将这些人名换成屏幕前的你呢?
很显然,到时美国可以使用类似于的人工智能去筛选中国互联网世界的数以十亿的虚拟身份,并根据其网络留言加以判断,进而分析出他们最感兴趣的那一小部分人,再结合目前已经泄露的海量数据与这一小部分人进行分析配对,得出的信息以及导致的后果将令人难以想象。
有圈外的朋友可能有疑问“为什么出现之前这些事就不会发生呢”,答案很简单,这原来是需要天文数字的人力才能做完的工作,现在机器可以自动做了,而他只需要电力、网络与一点点时间。
3.深思
3.1 “数据石油”归属变革
当网民们无意识交流产生的数据成为一种战略级资产后,后信息时代对于这种“数据石油”的归属权问题可能会形成新的博弈点。
如果说大数据时代的人们让渡出了部分隐私权,进而换取了更加便利的生活方式;
那么后信息时代的国家让渡出了整个互联网的公开信后,能换取到什么呢?是其他国家更好的服务还是敌对国不怀好意的舆情引导呢?
而如果某个国家过于封闭,是否会因为这种信息以及数据上的割裂而导致更严重的问题呢?因此,就目前而言,我认为解决这个问题的方案相对有限。
因为这个问题过于宏大且与本文相关性有限,这里我就不再展开了。
3.2 “智力资本”暴跌变革
一百年前的马克·吐温说“历史不会重演,但总会惊人的相似”,与此同时人类开启了工业时代,解放了双手与双脚,使用化石能源将体力工作的效率提升了成千上万倍。
一百年后的今天,我们正在经历人工智能技术爆发的原点,与此同时人类开启了个新的时代,人类将解放自己的大脑,使用电力将脑力工作的效率提升了成千上万倍。
如果说目前的计算机仅能处理计算以及固定的简单逻辑问题,那么从今天开始,有了人工只能加持的计算机将能够逐步的替代人类做更复杂的决策,这将带来两个重大变革。
3.2.1 平庸无用化变革
就目前的趋势来看,不熟练的或工作能力偏弱的人可能要首先受到冲击。
举例来说,使用编写的论文前言在世界顶刊审稿人中的通过率已经突破30%(顶刊正常的论文发布成功率约为10%),而且这仅仅是一个原型。
如果对其进行有针对性的优化后,那么我想有可能会淘汰相当部分的人类写手(作家、记着、商业文案写手等),也就是说如果你是一个专业写作者,但是你文章写的一般,那么以后可能就没有工作机会了。
与此同理的,届时当人类创作出例如“”、“PsGPT”后,普通的原画作者以及平面设计人员可能也将丧失工作机会。
如果再进一步泛化,以后的世界,平庸的人将彻底失去价值。并且随着人工智能的逐步发展,替代的水平也将逐步提高,被替代的人群也将逐步扩大,将有越来越多的人进入服务业,社会的阶层固化也将越来越严重。
那么我们应该怎么办呢?
如果从原点出发,人工智能的根基来源于创意,人工智能目前本质上只能做筛选,未来可能会有一定的推理乃至发散能力,但是其很难发展出纯粹的原始创意。
因此,接受过高等教育,在专业领域内研究颇深,并且富有创意的人是未来社会所需要的人。
就目前而言,国内的教育更多的还是偏向于“小镇做题家”模式,而未来的人工智能时代是最不缺的就是“解题”能力,因此我们有必要对下一代的教育进行深度思考,毕竟道理很简单,四五十个平庸的写手即便是凑在一起,也卷不过人工智能的产出,但是能雇得起四五十个人写文章的公司又能有几家呢。
3.2.2 智力价值白菜化
其实这个问题很简单且很现实,假如随着人工智能的发展,使得绝大多数的智力劳动价值降为现在的万分之一,那么会带来什么后果呢?
例如现在一副不错的平面设计单页是1000元,当其降至0.1元时,原先价值5000元的设计现在应该是多少钱呢?
例如现在一篇不错的商业文案是2000元,当其将至0.2元,原先价值一万元的文案现在应该是多少钱呢?
要知道,这些事可能在三年内就会出现。
如果我们再大胆的想远一点呢?
例如程序设计人员、机械图纸设计人员、建筑图纸设计人员……
我认为,这些事可能快一点十年内就会出现。
如此低廉的智力成本,是否会推动整个人类社会加倍成长呢?假如未来的人类十年就要经历现在一千年才能有的巨大变革,人类社会要如何适应或者说是承受这种剧变呢?
3.3 “数据饲料”养殖奇想
文章的结尾,与大家一起玩个游戏:
假如人类已经进入到深度人工智能时代,人类世界绝大多数的数据(文章、图片、音频、视频)都已经是人工智能创作生成的,但是人们所期待的“奇点(指人工智能有自我意识、有情感且能自我进化)”却迟迟未到,而人工智能的进化又需要由人类创作的大量数据才能进行,那么未来可能各行各业都有一个岗位用来专门创造行业内的各种专业信息,用以“投喂”人工智能,进而使人工智能在相关领域内具备更加智能更加专业的输出能力。
大家可以想想这个岗位叫什么名字比较好?
数据作物农民?人工智能饲养员?
另外,大家猜猜未来世界的各种智力产出产品(例如由人类谱写的乐曲,或由人类设计的图案)是否会像今天的手工制品一样被追崇?
后记-深思危机
从目前来看,国内的人工智能与国外似乎有一些差距,而随着人工智能的不断发展,整个人工智能产业对于算力的需求也越来越高,中国是否会因为美国的芯片封锁而对此受到影响?初期的被动封锁,是否会进一步引发智慧生产成本差距加大?而后是否会因为人工智能底层研究的落后导致被降维打击?
当然,如果中国能做到并驾齐驱,那么最后赢的就一定是我们,因为我们有人工智能最需要的东西——电。