在比尔盖茨最新博客文章 “AI将彻底改变你使用电脑的方式“中,他展望了AI Agent/代理的未来。
文章要点:
全文
今天我仍然像保罗·艾伦和我创办微软时一样热爱软件。但是,尽管从那时起的几十年里它已经有了很大的进步,但在很多方面,软件仍然相当愚蠢。
要在计算机上执行任何任务,您必须告诉它要使用哪个应用程序。您可以使用 Word 和 Docs 起草商业提案,但它们无法帮助您发送电子邮件、分享自拍照、分析数据、安排聚会或购买电影票。即使是最好的网站也无法完全了解您的工作、个人生活、兴趣和关系,并且使用这些信息为您做事的能力也有限。这种事情只有在今天与另一个人(例如亲密的朋友或私人助理)合作时才有可能实现。
未来五年,这种情况将彻底改变。您不必为不同的任务使用不同的应用程序。您只需用日常语言告诉您的设备您想做什么。根据您选择与之分享的信息量,它将能够做出个性化响应,因为它将对您的生活有丰富的了解。在不久的将来,任何上网的人都将能够拥有一个由远远超出当今技术的人工智能驱动的个人助理。
这种类型的AI软件可以响应自然语言,并且可以根据对用户的了解来完成许多不同的任务,称为/代理。我对AI智能体的思考已经有近 30 年了,并在 1995 年的《未来之路》一书中写到了它们,但由于人工智能的进步,它们直到最近才变得实用。
不仅会改变每个人与计算机交互的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。
人人都有个人助手
一些批评者指出,软件公司以前已经提供过这种东西,但用户并没有完全接受它们。(人们仍然拿 开玩笑, 是我们包含在 中但后来被放弃的数字助理。)为什么人们会使用?
答案是他们会变得更好。您将能够与他们进行细致入微的对话。他们将更加个性化,并且不会局限于写信等相对简单的任务。
如果您愿意,Agent将能够帮助您完成所有活动。在获得跟踪您的在线互动和现实世界位置的许可后,它将对您参与的人员、地点和活动有深入的了解。它将获取您的个人和工作关系、爱好、偏好和日程安排。您将选择它如何以及何时介入以帮助解决某事或要求您做出决定。
为了了解Agent将带来的巨大变化,让我们将它们与当今可用的人工智能工具进行比较。其中大多数是机器人。它们仅限于一个应用程序,并且通常仅在您写下特定单词或寻求帮助时才会介入。因为他们不记得你每次如何使用它们,所以他们不会变得更好或了解你的任何偏好。
更聪明。他们很主动——能够在你提出要求之前就提出建议。他们跨应用程序完成任务。随着时间的推移,他们会不断进步,因为他们会记住您的活动并识别您行为的意图和模式。根据这些信息,他们会提供他们认为您需要的东西,但最终决定权始终由您做出。
想象一下您想要计划一次旅行。Agent将识别适合您预算的酒店。它会知道您一年中的什么时间旅行,并且根据其对您是否总是尝试新目的地或喜欢反复返回同一个地方的了解,它将能够建议地点。当您询问时,它会根据您的兴趣和冒险倾向推荐可以做的事情,并预订您喜欢的餐厅类型。如果您今天想要这种深度个性化的计划,您需要向旅行社付费并花时间告诉他们您想要什么。
AI Agent最令人兴奋的影响是, 它们将降低当今对大多数人来说过于昂贵的服务民的门槛。他们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。
医疗保健
如今,人工智能在医疗保健领域的主要作用是帮助完成管理任务。例如,、 DAX 和 Nabla 可以在预约期间捕获音频,然后写下笔记供医生查看。
当AI可以帮助患者进行基本分类、获得有关如何处理健康问题的建议并决定他们是否需要寻求治疗时,真正的转变才会到来。这些AI Agent还将帮助医护人员做出决策并提高工作效率。(像 Glass 这样的应用程序已经可以分析患者的摘要并提出诊断建议供医生考虑。)帮助患者和医护人员对于贫穷国家的人们尤其有益,因为那里的许多人根本没有机会去看医生。
这些临床医生AI Agent的推出速度将比其它应用慢,因为把事情做好是生死攸关的问题。人们需要看到证据。证明它总体上是有益的,尽管它们并不完美并且会犯错误。当然,人类也会犯错,得不到医疗也是一个问题。
教育
几十年来,我一直对软件能够使教师的工作变得更轻松并帮助学生学习的所有方式感到兴奋。它不会取代教师,但会补充他们的工作—为学生提供个性化的工作,并将教师从文书工作和其他任务中解放出来,这样他们就可以将更多的时间花在工作中最重要的部分上。这些变化终于开始以戏剧性的方式发生。
目前最先进的是 ,这是可汗学院创建的基于文本的AI机器人。它可以辅导学生数学、科学和人文学科—例如,它可以解释二次公式并创建数学问题进行练习。它还可以帮助教师做一些事情,例如编写教案。
但基于文本的AI只是第一波浪潮—AI将带来更多的学习形式。
例如,很少有家庭能够花钱请一位导师来与学生进行一对一的辅导。如果AI Agent能够掌握导师的有效要素,他们将为每个需要它的人解锁这个辅导。如果辅导机构知道一个孩子喜欢《我的世界》和泰勒·斯威夫特,它就会用《我的世界》教他们计算形状的体积和面积,用泰勒的歌词教他们讲故事和押韵方案。与当今基于文本的导师相比,这种体验将更加丰富(例如图形和声音)并且更加个性化。
生产力
微软正在将 AI助手 纳入 Word、Excel、 和其他服务中。谷歌正在通过 Bard 及其生产力工具 做类似的事情。这些可以做很多事情,例如将书面文档转换为幻灯片,使用自然语言回答有关电子表格的问题,以及在代表每个人的观点的同时总结电子邮件线索。
会做得越来越多。就像有一个人致力于帮助您完成各种任务。如果您有创业想法,Agent将帮助您编写商业计划、创建演示文稿,甚至生成产品的图像。公司将能够为员工提供,参加每次会议,以便他们回答问题。
无论您是否在办公室工作,您的都可以像高管们才有的私人助理一样为您提供帮助。如果您的朋友刚刚做过手术,您的Agent会主动提出送花并为您订购鲜花。如果你告诉它,你想和你以前的大学室友见面,它会与他们的AI Agent一起寻找聚会的时间,并且在你到达之前,它会提醒你,他们最大的孩子刚刚在大学开始上大学,哪所大学。
娱乐和购物
人工智能已经可以帮助你挑选新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了 Pix,它可以让你提出问题(“我喜欢哪些罗伯特·雷德福的电影以及在哪里可以观看它们?”),然后根据你喜欢的内容提出建议。 拥有人工智能 DJ,不仅可以根据您的喜好播放歌曲,还可以与您交谈,甚至可以叫您的名字。
AI Agent不会简单地提出建议,他们会帮助你采取行动。如果您想购买相机,您将让您的Agent为您阅读所有评论,总结它们,提出建议,并在您做出决定后下订单。如果您告诉您的Agent, 您想观看《星球大战》,它会知道您是否订阅了正确的流媒体服务,如果没有,它会主动为您注册。如果你不知道自己想看什么,它会提出定制建议,然后弄清楚如何播放你选择的电影或节目。
您还可以获得根据您的兴趣量身定制的新闻和娱乐内容。 可以针对您询问的任何主题创建自定义播客,让您对即将发生的事情有所了解。
科技行业的冲击波
简而言之,将能够为生活的任何领域提供帮助。这对软件行业和社会的影响将是深远的。
在计算行业,我们谈论平台—构建应用程序和服务的技术。 、iOS 和 都是平台。将是下一个平台。
要创建新的应用程序或服务,您不需要知道如何编写代码或进行图形设计。您只需告诉您的Agent您想要什么即可。它将能够编写代码、设计应用程序的外观和风格、创建徽标并将应用程序发布到在线商店。
将影响我们使用软件的方式以及软件的编写方式。它们将取代搜索网站,因为它们更擅长查找信息并为您总结信息。他们将取代许多电子商务网站,因为他们会为您找到最优惠的价格,并且不会仅限于少数供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天的独立业务—搜索广告、广告社交网络、购物、生产力软件—将融合成为一项业务。
我不认为任何一家公司会主导业务—将会有许多不同的人工智能引擎可用。如今,已嵌入文字处理程序和电子表格等其他软件中,但最终它们将自行运行。尽管有些可以免费使用(并由广告支持),但我认为您需要为其中的大部分付费,这意味着公司将有动力让代表您而不是广告商的利益工作。如果从今年开始研究人工智能的公司数量来看,将会出现异常激烈的竞争,这将使变得非常便宜。
但在我描述的复杂成为现实之前,我们需要面对一些有关该技术以及如何使用它的问题。我之前写过关于人工智能引发的问题,所以这里我将特别关注。
技术挑战
还没有人弄清楚Agent的数据结构会是什么样子。为了创建个人Agent,我们需要一种新型数据库,它可以捕获您的兴趣和关系的所有细微差别,并快速调用信息,同时维护您的隐私。我们已经看到了存储信息的新方法,例如矢量数据库,这可能更适合存储机器学习模型生成的数据。
另一个悬而未决的问题是人们将与多少个进行交互。您的私人Agent人会与您的治疗师Agent和数学导师分开吗?如果是这样,你什么时候希望他们互相合作,什么时候他们应该留在自己的领域里?
您将如何与您的互动?企业们正在探索各种选择,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都有可能,但我认为人机交互的第一个重大突破将是耳机。
如果您的Agent需要与您联系,他们会与您通话或显示在您的手机上。(“你的航班延误了。你想等吗?或者我可以帮你重新预订吗?”)如果你愿意,它会监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音来增强声音, 或者更容易理解口音很重的人说话。
还有其他挑战。目前还没有一个标准协议允许相互交谈。成本需要降低,以便每个人都能负担得起Agent。需要更容易地向客服人员提示,以便为您提供正确的答案。我们需要防止幻觉,特别是在健康等领域,准确性非常重要,并确保Agent不会因为偏见而伤害人们。我们不希望Agent做他们不应该做的事情。(尽管我担心的不是流氓Agent,而是人类罪犯利用Agent来达到恶意目的。)
隐私和其它大问题
当所有这些结合在一起时,在线隐私和安全问题将变得比现在更加紧迫。您将希望能够决定可以访问哪些信息,以便您确信您的数据仅与您选择的人员和公司共享。
但是谁拥有您与共享的数据,以及如何确保这些数据得到适当使用?没有人愿意开始收到与他们告诉治疗师Agent的事情相关的广告。执法部门可以使用您的Agent作为对您不利的证据吗?您的Agent什么时候会拒绝做可能对您或其他人有害的事情?谁选择Agent中内置的价值观?
还有一个问题是Agent应该分享多少信息。假设您想见一位朋友:如果您的经纪人与他们的经纪人交谈,您不希望他们说:“哦,她周二要见其他朋友,但不想包括您。” 如果您的Agent帮助您撰写工作电子邮件,则它需要知道它不应使用有关您的个人信息或之前工作的专有数据。
其中许多问题已经成为科技行业和立法者最关心的问题。最近,我与其他技术领袖一起参加了由参议员查克·舒默 (Chuck ) 组织、许多美国参议员参加的人工智能论坛。我们分享了有关这些问题和其他问题的想法,并讨论了立法者采取强有力立法的必要性。
但其他问题不会由公司和政府决定。例如,Agent可能会影响我们与朋友和家人互动的方式。今天,您可以通过记住某人的生活细节(例如他们的生日)来向他们表明您关心他们。但是,当他们知道你的Agent可能提醒过你这件事并负责送花时,这对他们来说还有意义吗?
在遥远的未来,Agent甚至可能迫使人类面对关于目的的深刻问题。想象一下,Agent变得如此优秀,以至于每个人都可以享受高质量的生活,而无需付出同样多的工作。在这样的未来,人们会用时间做什么?当Agent拥有所有答案时,还会有人想接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全、繁荣的社会吗?
但我们距离这一点还有很长的路要走。与此同时,Agent已经来了。在接下来的几年里,它们将彻底改变我们的生活方式,无论是线上还是线下。