一、智能语音产业链完善
主要有核心技术开发、知识库提供以及应用、服务三个层面。核心技术开发主要包括语音交互技术提供商、平台支撑提供商以及人工智能机器人提供商三个部分,知识库提供主要是指数据和内容(包括影视、股票、餐饮、旅游等)提供商。应用、服务主要包括智能家居、个人语音助手、车载设备、可穿戴设备等平台。


一、中国智能语音技术蓬勃发展
论文、专利数量快速增长。伴随着人工智能技术的飞速发展,中国在人工智能核心技术——深度学习环节的论文数量以及论文引用量已经位列世界第一。而中国在智能语音技术专利数量方面也在逐年增加,2013、2014 年每年的专利数量大约在700 件左右。


庞大的用户群基础以及互联网系统优势明显,国内公司已经占据一席之地。国内用户群数量巨大,互联网用户群体稳定在10 亿以上。结合国内互联网近10 年来飞速发展形成的规模优势以及高效的人才和资金制度,国内在智能语音行业诞生了一批明星公司。并且掌握核心算法技术,准确率都已在90%以上。国内语音公司领跑者科大讯飞旗下讯飞智能语音与人工智能平台为包括QQ、高德地图、滴滴出行、携程、大众点评、新浪微博等在内的13 万+合作伙伴提供服务,覆盖终端用户数超过7 亿,在线日服务量达15 亿次。目前为止,国际智能语音市场,Nuance、谷歌、苹果、微软以及科大讯飞分别占有31.6%、28.4%、15.4%、8.1%以及4.5%的市场份额。科大讯飞已经超越老牌计算机巨头IBM 位列全球第五。
国内各大互联网公司语音识别技术特点 | ||
公司名称 | 技术特点 | 优势特点 |
百度 | Deep CNN(深卷积神经网络) | 百度语音在“安静条件下”的识别准确率达到了 97%。身为搜索服务提供商,百度在海量数据的收集上有着先天优势,这为其语音大数据库的搭建以及模型的强度化训练提供了无与伦比的便利。 |
搜狗 | DNN、RNN(循环神经网络)、LSTM(长短时记忆模块) | 搜狗语音的识别准确率达到了 97%,并支持最快每分钟 400 字的听写。搜狗输入法用户基数庞大以及搜狗搜索市场份额的快速提升,搜狗在大数据的获取上也占尽先机。 |
科大讯飞 | DFCNN(深度全序列卷积神经网络) | 语音识别成功率达到97%,离线识别率亦达95% |
阿里 | BLSTM(双向长短时记忆模块) | 2016 年年初,阿里提出了“智能解决率”的概念,大意是旗下的智能客服产品“阿里小蜜”每天面对百万级服务量,智能解决率接近80%,远高于同类产品的60%的水平;同时,在人机对话语义意图的精确识别中匹配率提升到了93%。 |
腾讯 | 未透露 | 2016 年5 月,腾讯上线智能语音服务;12 月3 日发布微信语音开放平台。后者在垂直细分领域的识别率可达90%以上。 |

目前,中国语音市场主要份额由科大讯飞、百度、苹果占据。三家公司分别占据了44.2%、27.8%和6.9%的市场份额。在2015 年宝马举行的全球语音识别大赛中,科大讯飞排名第一。

本文采编:CY317