深网｜百度CTO王海峰：语音能力日均调用量过100亿

%title插图%num

百度CTO王海峰博士致辞

新闻资讯作者相欣

11月28日，百度大脑宣布语音能力引擎日均调用量已经超过100亿次，为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力，推动智能语音技术在各行业落地应用。

在当天举行的百度大脑语音能力引擎论坛上，百度大脑语音引擎还发布和升级了14大产品内容，包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案，升级了语音自训练平台、呼叫中心语音解决方案等。

百度首席技术官王海峰博士出席论坛并致辞，他表示：“AI技术的进化和产业赋能正向循环，相互促进，AI在应用场景中不断进化。百度的语音技术基于深度学习和产业应用加速突破，已应用到百度App，百度地图、小度音箱，百度输入法等百度产品，更通过AI开放平台赋能众多产业伙伴。百度大脑语音能力每天的调用量已经超过100亿。”

现场，百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术，该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设，消除学科间壁垒，直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法，错误率降低超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。

据悉，百度从2012年起就开始把深度学习用于中文语音搜索。百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力，并广泛应用于金融、政务、文娱等多种行业和场景。百度AI技术生态部总经理喻友平表示，百度大脑语音能力引擎的应用规模广泛，同时一直在积极拓展语音能力引擎生态链的建设。

针对智能硬件设备，百度大脑发布基于百度鸿鹄语音芯片的4款硬件模组、开发板，以及智能家居、智能车载、智能IoT设备3大端到端软硬一体远场语音交互场景解决方案，具备交互效果优异、软硬一体快速应用、广泛兼容集成门槛低等优点。同时，在语音识别领域，全面升级短语音识别、实时语音识别能力，发布音频文件转写能力，升级可零代码提升业务术语识别率的语音自训练平台，以及呼叫中心语音解决方案；在语音合成方面，全新发布6个在线语音合成精品音库和5个离线语音合成精品音库。丰富的语音能力，助力智能硬件、互联网、呼叫中心等领域智能化升级。

资料显示，百度大脑开放平台目前已开放228项AI能力，拥有超过150万的开发者用户。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

相关推荐

热门文章

热门标签

分类目录

贝斯通检测专业认证诚挚服务

国内外一站式检测认证。

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续给力更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫

切换注册登录

切换登录注册