发布时间 : 2018年04月25日
美国目前的手机语音助手使用比例已经从2013年的30%左右快速攀升至2015年的60%以上,渗透率快速提升一倍以上。谷歌的语音搜索量较2008年增加35倍以上,较2010年增加7倍以上。语音识别行业现状分析,随着语音识别近年来的突破性进展,相关商业应用已经展开。2014年,全球智能语音市场规模整体达到45.6亿美元,与2013年的33.7亿美元同比增长35.3%。2015年,全球智能语音市场规模预计将达到61.9亿美元,较2014年增长35.7%。
全球智能语音产业规模持续增长
自动语音识别(ASR)技术的目的是让机器能够“听懂”人类的语音,将人类语音信息转化为可读的文字信息,是实现人机交互的关键技术,也是长期以来的研究热点。语音识别的门槛并不高,声学在线很多文章里提到过,因此国内各大公司也逐渐加入进来。现从具体要解决的四大问题来分析语音识别行业现状。
①增强系统的鲁棒性,也就是说如果条件状况变得与训练时很不相同,系统的性能下降不能是突变的。
②增加系统的适应能力,系统要能稳定连续的适应条件的变化,因为说话人存在着年龄、性别、口音、语速、语音强度、发音习惯等方面的差异。所以,系统应该有能力排除掉这些差异。达到对语音的稳定识别。
③寻求更好的语言模型,系统应该在语言模型中得到尽可能多的约束,从而解决由于词汇量增长所带来的影响。
④进行动力学建模,语音识别系统提前假定片段和单词是相互独立的,但实际上词汇和音素的线索要求对反映了发声器官运动模型特点的整合。所以,应该进行动力学建模,从而将这些信息整合到语音识别系统中去。
未来的语音识别市场,预计将会有越来越多的公司参与,以后语音识别的性能可能更多的体现在前端技术和语义理解上。语音识别行业现状分析,机器要与人自然交流,当然就不能重复手机这套语音对话规则,必然就要考虑到用户说话的环境、周围环境的噪音、用户发音不准或者方言等等诸多因素,这就要求前端技术更加精准的模拟人体结构,仿真出机器人听觉系统,以实现解放双手自由对话的目的。