随着海数据的积累以及对于神经网络研究的不断深入,使得语音识别的准确率不断提升,诸如像微软所提供的语音识别服务的准确率更是提升不少,堪称能够媲美人类了。人工智能产链从底层到顶层也正在经历着不同程度的变革,而也有很多内家表示,语音识别技术的成熟度从某种程度上也代表了人工智能水平发展水平的高低。
在智能手机的各种应用中,“语音识别”属于发展比较早也比较成熟的一个领域。从初期的“语音拨号”,到现在以苹果Siri为代表的语音搜索等,虽然此次iPhoneX在发布会上并未强调其“语音识别”功能,但有一点可以肯定——那就是智能手机巨头们的探索与努力从未止步。
为何“语音识别”如此重要?因为相较于“人脸识别”的“验证与鉴别”功能,“语音识别”侧重于移动环境中便捷的人机交互。此前在《AI芯片——开启手机由智转慧新纪元》一文中笔者提到:“目前各种APP将成为人机交互过程中待命的功能模块,手机会成为所有应用的直接入口”,而这一“入口”打开的好方式,莫过于让手机“听得懂人话”,像一个全能管家一样满足用户的各种需求。
试想,当有手机将家居、办公、购物、餐饮等生活与工作场景相关的应用全部集成,并实现全程语音操控。譬如上班者在上班途中可以先通过语音指令开启工作电脑、工作平台(EBOSS等)、打开需要使用的文档、搜索需要的数据,在准备过程中,手机会与你实时互动保证不出现偏差,到公司后一切工作准备已经就绪。
从目前智能手机语音识别技术发展程度看,一些标准场景如打电话、点餐、查询等的指令已不是问题。但要实现真正意义上的“听得懂人话”,除了硬件上需要的芯片模块、耳机、扬声器等之外,针对语音以及语义识别需要的算法、大数据采集以及整合各种应用场景并打通让沟通畅通无阻的平台才至关重要。苹果、谷歌、微软、腾讯、亚马逊等企,便具备了这样的潜。
|