“小度小度,拉开窗帘。小度小度,空调调到24摄氏度。“在青岛市北区的一家盲人按摩店里,按摩师熟练地发出一连串的语音指令,店里的窗帘、空调等设备准确无误地完成了上述动作;而在位于上海佘山脚下的世茂洲际酒店里,来宾只需轻唤一声小度,即可与AI互动,享受客房内的智能酒店体验。无论是老百姓身边的盲人按摩店还是高大上的五星酒店里,都充满了浓浓的科技感,这项技术其实是百度的语音识别。
语音识别,通常称为自动语音识别,主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,是人机自然交互技术中的关键环节。截至20世纪90年代,语音识别系统的速度都太慢,无法开发有用的应用程序。追溯到2009年之前70年左右的漫长岁月里,中国在语音识别技术上大多处于边缘角色,直到百度、科大讯飞等中国企业的崛起。2017年,Google宣称语音识别准确率达到95%,而早在2016年百度世界大会上,李彦宏就宣布了百度语音识别准确率达到97%的消息,超过人对语音的识别能力。
众所周知,百度多年来一直深耕语音技术,语音识别能力越来越成熟。2013年,百度的语音识别技术还主要基于mel-bank的子带CNN模型,2014年就独立发展出了Sequence Discriminative Training(区分度模型)。此后,一路推出基于LSTM –HMM的语音识别、Deep Peak 2模型,并于2019年发布了流式多级的截断注意力模型。而在不久前结束的AI开发者大会上,百度还推出了针对远场语音交互的鸿鹄芯片,能够实现远场阵列信号实时处理,高精度超低误报语音唤醒以及离线语音识别。
语音专利方面,2015年就开放了上百项智能语音专利,与海尔、京东、中兴通讯、中国普天等组建了智能语音知识产权产业联盟,同时PaddlePaddle、Warp-CTC、百度大脑的开放和开源,对中文语音识别有着潜移默化的影响,成为了中国语音识别领域标准的制定者。2018年公布的第二十届中国专利评审结果中,百度的语音、机器翻译、无人车相关三项专利获奖,成为人工智能领域至今为止在国内专利界获得的最高级别政府奖项。其中“语音专利”涉及的新语音识别模型——采用深度学习算法在24时内对数以百亿级的大规模数据进行实时分析,高性能计算,令语音识别技术的准确率达97%,解决了语音识别领域关键性、共性的技术难题,被MIT 评为“2016年全球十大突破技术”。2017年,百度将技术赋能到硬件产品,小度智能音箱应运而生。如今,身为国内智能音箱行业的先驱者,小度的技术始终走在行业前端。今年百度AI开发者大会上重磅发布的小度助手5.0,上线了全球领先的全双工免唤醒功能,能够识别出用户说的话是不是给它的指令,过滤掉无效干扰信息再做出反应。
正如百度创始人、董事长兼首席执行官李彦宏在今年重庆智博会上所说的:“以前大家比较喜欢传人工智能又战胜了世界围棋冠军,今天我们更关注人工智能给人们的生活带来了什么便利,给工作提升了多少效率。人工智能从酷炫的效果变成了一个社会的共识,变成了一个国家战略,要扎实地去推进人工智能在各个产业领域的渗透,帮助各个领域、各个行业提升效率,提升人们的感受。”
在国内,小度推出第一款带屏智能音箱小度在家。随后,小度在家系列产品不断增加,小度在家1S成为该系列的“明星产品”。小度在家系列不仅开创了国内带屏智能音箱的行业先河,还作为小度涨势迅猛的重要产品线,驱动小度快速完成“后来者居上”的反超。最近,全球知名市场调研公司Canalys发布了2019年第二季度全球智能音箱出货量报告。小度在延续Q1的高增长趋势下,Q2出货量高达450万台,不仅蝉联国内市场第一,更是首次超越了谷歌的430万台,跃升全球第二。据Canalys分析师介绍,百度在其Q2的智能音箱出货量中,带屏音箱的比例高达45%。
在Canalys 发布的数据报告之前,百度公司发布了第二季度财报,从财报中披露的数据中,也可见小度生态成长的迅猛速度:截至今年6 月,搭载小度助手的激活设备数累计超过4 亿台,同比增长4.5 倍,语音交互次数超36 亿次,同比增长7.5 倍。。
李彦宏认为,AI的价值在于如何更好地服务人,而小度就是一个很好的例证:“智能音箱本质上是一个人工智能助理。人的身上是没有屏幕的,所以智能音箱作为智能助理的载体,它的发展方向并不是长得越来越像人,而是越来越能够帮助人、服务人。”