简体中文 English

国内智能语音技术发展趋势初探

时间:2018-07-24浏览量:410

      智能语音技术又名语音识别技术,它的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等,语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

国内智能语音技术的发展历程

   我国语音识别研究工作起步于五十年代,但近年来发展很快,研究水平也从实验室逐步走向实用;从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
  清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。
  中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

语音识别技术分类

  语音识别系统可以根据对输入语音的限制加以分类,从说话者与识别系统的相关性考虑可以将识别系统分为三类:一是特定人语音识别系统:仅考虑对于专人的话音进行识别;二是非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;三是多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

探究国内语音技术未来的发展趋势

  语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。智能语音的技术一直呈现茁壮成长的欣欣之态,美国权威杂志《麻省理工科技评论》还将其评为2016年十大突破技术。随着智能语音与移动端、社会信息服务、网络信息搜索等产业方向越来越好的融合步伐,智能语音成为人工智能领域“最接地气”一族。

市场驱动下的语音技术:国内众多厂商借助语音技术为产品增光添彩

智能语音产业规模的大幅度提升除了是技术快速发展,突破了瓶颈之外,更重要的是离不开市场需求驱动。从智能语音现在落地到的应用领域就可知道,各行各业对智能语音的需求有多大。据统计,2013年智能语音的产业规模达33.7亿美元,同比增长38.1%,2014年同比增长35.3%,2015年规模达61.9亿美元。今年中国语音技术市场份额占世界12%,实现了很大的市场突破!

除了日常使用,如手机上语音拨号、语音操控、语音查找,导航仪语音设置目的地,电子词典、MP3的语音搜索等功能,智能语音还多出现在智能家居、智能车载系统、智能安防以及人工智能等多领域。

据记者了解,智能语音技术对于很多创业型企业并非遥不可及,虽然他们没有核心的语音技术,但往往希望借助外部的技术团队,帮助自己实现某个有创意的定制化需求,以达到为产品增光添彩,满足市场的多样化需求,增强市场竞争力。“最近,我们有一个做智能灯具的客户,他想设计一款可以用自然语音(普通话)进行交互的智能灯具,实现开关灯,调亮度和调色温等功能,但无奈自身的开发技术有限,无法实现这些功能,因为非常看好语音技术为灯具带来的市场影响力,遂愿意花很高的价钱将它们外包出去,快速开发出来抢占市场。类似于这样的客户在我们平台还有很多。”一家专注于智能硬件外包的平台快包工作人员介绍道。

中国的智能语音厂商动态:互联网+智能语音推动产业发展

国内智能语音的高速发展,离不开互联网的强势推动,近几年,BAT是中国智能语音市场最活跃的企业之一。

百度在2014年从谷歌挖来了人工智能泰斗吴恩达,辅以重金做研发,在2016年斩获了中国语音产业13%的市场份额。

阿里的语音识别技术在2015年开始就已经渗透到客服所接听的每一个电话中去,应用的场景还包括有阿里的YunOS、虚拟客服阿里小蜜等。

腾讯微信AI团队自主研发出的语音技术,在2016年5月搭载腾讯云正式上线。

除了这三家互联网龙头企业之外,据我爱方案网记者了解,目前我国的语音技术厂商大致可分为三类:一类是传统语音技术厂商,包括像科大讯飞、小i机器人、捷通华声等它们拥有自己的核心智能语音芯片以及语音相关软件系统;第二类是互联网厂商,包括百度、腾讯、搜狗等,普遍采用战略合作或者收购等方式,掌握智能语音技术,推广语音服务;第三类是创业企业,像云知声、思必驰、中科信利、中科模识等,它们专注于某些行业领域,比如汽车、家电,来推广自己的语音技术和产品。

首页
电话
留言反馈