全球估计有3900万人失明,预计到2050年,这一数字将增加两倍。
根据中国残联官网的数据,目前仅持残疾人证的盲人已经超过1300万,每年还以45万人失明的速度累加着,平均每100人就有1个盲人。随着AI(人工智能)技术逐渐走入我们的生活,微软AI在致力于释放常人潜能、为人们提供更智能便利服务的同时,也在不断践行着公益项目,期望为残障人士构建一个无障碍的世界。
技术予力, 再现炫酷科技
2018年12月,微软率先在全球范围内推出端到端的深度神经网络语音合成服务( Voice),使计算机和智能设备拥有了媲美真人的人工智能声音。2019年11月,在美国奥兰多召开的全球大会上,微软更进一步推出了基于深度神经网络语音合成技术的声音定制服务 Voice的有限预览。通过这个服务,微软的合作伙伴和客户可以用极少量的声音样本定制出各式各样的高度仿真的人工智能声音。
这项服务可以将制作一个高品质声音所需要的训练数据规模降低到十分之一甚至更低,同时输出的声音效果更加自然逼真。多项评估表明,该技术合成的声音与真人说话的录音几无差异,可大幅降低用户与智能设备和应用程序进行语音交互时容易产生的听觉疲劳,帮助客户与最终用户建立独特的声音情感连接。为了负责任地推广对AI语音技术的使用,在服务预览期间,微软仅选择有限的合作伙伴审慎进行声音的定制开发。
以AI之名,想把世界「读」给你听
2019年,红丹丹开始借助微软人工智能语音技术——尤其是微软中文女声“晓晓”来自动合成有声读物,极大地提高了有声内容的生产效率。通过微软最新的深度神经网络声音定制服务,红丹丹更是用盲人播音员董丽娜老师的语音数据作为原型,定制了一个发音标准、情感饱满、同时为盲人朋友们所熟悉的人工智能声音。这些声音可以快速地将红丹丹的电子书转换成更贴合人声、饱含温度的有声读物,从而大大改善视障人士有声读物匮乏且读物声音机械、空洞的阅读环境,帮助视障人士更好地感知世界。
红丹丹视障服务中心执行主任曾鑫女士表示:“我们很惊喜微软公司的人工智能技术可以用丽娜老师的录音快速地复制出非常自然的、神似她本人的声音。现在我们可以高效地用这个人工智能声音来为视障人士生产有声学习内容。通过这个声音定制服务,全国105所盲校的孩子们都可以听到用丽娜老师的声音朗读的书籍。在这个合作过程中,微软对丽娜老师和她的声音极其负责任的态度也给我们留下了深刻的印象。”
初心不泯,爱与责任同行
然而,在选择AI神经语音定制服务时,安全性是不可忽略的重要因素。由于定制语音的具有高度逼真的特性,这项新技术也可能被别有用心的不法分子滥用,引发虚假信息传播的风险。
为了控制技术遭到不当使用的风险,微软秉持负责任的人工智能伦理原则,对该项技术采用选择性预览的方式以限制定制声音的使用场景,已经制订并正在执行相应的服务申请和审核机制,以期保护社会公众权益、促进人工智能人机交互透明性。