chatgpt 4接入siri快捷指令 谁能成就中国的Siri

AI资讯1年前 (2023)发布 fengdao
25 0

网易科技专栏作家 冀勇庆( 微博)

3月22日下午,北京国家会议中心四层的会议大厅来了2000多人,他们是来参加科大讯飞的“语音云”平台发布大会的。

作为国内最领先的语音技术提供商,科大讯飞董事长刘庆峰现身说法,演示了讯飞自己开发的示范版应用产品——“讯飞语点”。他用自己的声音“命令”智能手机,先后做了发短信、安排日程、找饭馆等工作,甚至还调侃了手机“你能做什么”?对于这个问题,手机一开始的回答也颇有意思:“我正在反思自己的不足”。

所有这些,都让我想起了与苹果 4S同期推出的语音服务Siri——在欧美国家,很多手机用户也正在以“调戏” 4S的Siri为乐。

如果只是把Siri当成一个玩具,那就太小瞧它的划时代意义了。实际上,Siri有可能改变移动互联网未来的竞争格局。让我们想想,移动中的场景与固定场合(办公室或者家里)都会有哪些不同。当你处在移动状态的时候,你可能正在开车或者坐车,你必须将注意力集中在看路等方面,你能够腾出来的感知器官也就剩下耳朵了。这个时候,语音就能够发挥更大的作用。

举个例子,在电影和电视等视觉媒体的冲击下,作为语音媒体的广播早就被判了死刑。不过,最近媒体广告市场上,广播的增长却相当喜人。原因很简单,虽然在固定场合听广播的人越来越少,却也有越来越多的人在移动中(开车或者坐车)听广播,广播反而焕发了第二春。

快捷指令接口_快捷指令连接_chatgpt 4接入siri快捷指令

因此,在移动领域,语音会是一门大生意。还有一点,处在移动状态的你必然携带的是便携设备,这种小尺寸设备也特别适合采用语音的方式进行交互。

苹果之所以推出Siri,就是希望Siri成为移动互联网的第一入口,从而获得批发信息流量的权力,就像谷歌在PC互联网中那样。随着移动互联网的迅猛发展,这也会威胁到谷歌在整个互联网世界的地位。

这个事情要做成,首先需要有一整套的语音技术能力,它包括语音识别、语音合成等技术,为Siri提供支持的这家语音技术供应商就是这家公司。目前,已经能够较好地支持英语、法语、日语等语种。而在汉语上做得最好的,还是科大讯飞这家从高校走出来的技术型公司。

语音识别很关键的一点就是需要将人们日常的声音去掉噪声干扰之后,与语料库中的声音特征进行比对,并转化成正确的文字。过去,语料库的建立需要花费大量的时间和精力,也许需要招聘数百名大学生日夜不停地采集声音信号进行比对。好在,现在有了移动互联网。我注意到,前不久UC推出了语音云输入功能,搜狗输入法也有了语音输入功能。这些语音功能的推出一方面将改变手机用户的输入习惯,另一方面也通过网友自发的语音输入,帮助相关的技术厂商完善了语料库。

语料库建立起来之后,语义正确理解率达到80%以上,也就具备了大规模商用的条件了。这个时候,竞争的关键点就在于围绕语音技术建立技术平台,接入丰富多彩的应用了。好在,手机用户的应用比较聚焦和集中,一般都与沟通、找位置、定日程、订餐馆等特定的应用相关,这也使得技术上的难度相对降低了不少。

chatgpt 4接入siri快捷指令_快捷指令连接_快捷指令接口

Siri的背后就隐藏着 Alpha这家“知识引擎”公司,与谷歌等搜索引擎针对一个关键词给出成千上万个网站的搜索模式有所不同, Alpha通过分析问话直接给出答案。这种问答方式也更加符合手机用户的使用习惯。在此之前,电信运营商的12580、114实际上也是提供这样的服务,只不过一个是通过算法,另一个是通过人工。我注意到这次科大讯飞的合作伙伴当中,也不乏知乎这样的社会化问答社区。

当然,手机用户的很多提问并不只是为了找到答案,而是希望能够获得需要的服务。这个时候,就需要各种垂直领域的服务提供商了。例如,你问手机“王府井怎么走?”手机就必须马上为你接通高德、凯立德等地图服务提供商,给你指出具体的路线,甚至为你提供语音导航服务了。

因此,谁能够成就中国的Siri,下一步的关键就是尽可能多地接入与移动互联网相关的开发商和服务商,形成一个“语音超市”,让消费者在这个市场上自由地选择琳琅满目的服务。据了解,自2010年年底发布“语音云”平台之后,科大讯飞的合作伙伴增长很快,目前已经有将近3000家合作伙伴,使用“语音云”的最终消费者已经超过了3300万。

但是,这并不足以保证科大讯飞的“语音云”成为中国的Siri。且不说苹果的中文Siri还在虎视眈眈准备进入中国市场,谷歌、微软、IBM等公司也都有不亚于苹果的语音技术,他们欠缺的其实只是一个与中国消费者产生广泛联系的运营平台。一旦这些技术厂商与中国本土的移动互联网厂商达成合作,完全有可能迅速抢占这个市场。我也注意到了,像国内的UC和搜狗等互联网公司,其实已经开始了语音方面的尝试。

谁能成就中国的Siri?这其实已经变成了产业链的竞争,在这个长长的链条当中,语音技术、运营平台、开发者平台和消费者的粘性,一个都不能少。

相关专栏: 调戏SIRI需要理由吗

© 版权声明

相关文章

暂无评论

暂无评论...