顺应语音应用的趋势,近日,科大讯飞公司推出了国内语音界首款MRCP服务器产品:iFLY MRCP Server 2.0(简称IMS2.0)。该产品基于最新的开放国际标准MRCPv2开发,为科大讯飞公司业界领先的InterPhonic语音合成产品家族提供了新的遵循开放标准的服务接口。这款产品的推出,对科大讯飞公司的新老客户,特别是应用开发商、集成商的意义重大,可以为用户带来很大的灵活性和可选择性,加快开发周期,降低开发成本。
什么是MRCP协议
媒体资源控制协议(Media Resource Control Protocol, MRCP)是一项新兴的标准,用于管理和访问分布式系统架构上的语音资源服务器。该协议已经被语音通信领域的主流供应商所采用,如IBM、CISCO、Nuance、Loquendo、Telisma等,语音行业几乎所有的重要厂商都支持或承诺支持MRCP。
采用MRCP协议后,独立软件商和应用开发商仅需面向MRCP接口撰写程序,而无需考虑不同语音厂商的语音引擎产品之间的差异,可以真正做到一次开发,多种环境下应用;任何支持MRCP标准的语音引擎都可以被无缝集成和调用。另外,MRCP也与其它新兴的技术兼容,如VoIP,VoiceXML和会话发起协议(Session Initiation Protocol,SIP)等,在电话交互系统等环境下的应用将更加直接方便。
IMS2.0产品
科大讯飞公司长期以来一直着力于推动和研究语音技术和交互的公共开放标准,在MRCP标准日趋成熟的情况下,即根据最新的MRCPv2草案实现了新一代的语音服务平台。内部集成了科大讯飞的InterPhonic语音合成引擎,对外则按标准规范提供了访问接口,从之前的特定服务方式跨入到业界统一的服务方式,继续保持着语音行业发展的领先潮流。
IMS2.0在功能上完全遵循MRCPv2 draft11的标准,目前支持对合成资源的访问,不远的将来即会全面支持包括识别,声纹认证等各个语音服务,同时它还提供了多种客户端接口以方便集成开发,开发商甚至无需针对MRCPv2协议去开发,只要调用方便的封装接口即可实现语音服务功能,目前提供的客户端接口包括MRCPv1客户端接口、MRCPv2客户端接口和传统科大讯飞接口的客户端,这样无论是重新开发基于MRCP标准的应用还是直接将原有的应用移植到MRCP平台中都将是很轻松的事情。 同时IMS2.0还具有它独特的特色,包括在不与MRCP标准有冲突和额外需求的情况下透明支持大规模的负载均衡,可以方便的扩展升级语音服务能力;支持基于浏览器的网络管理功能,随时可以轻松管理所有的服务节点;而且还继续保持着科大讯飞合成系统的高效性能和稳定的运行状态。
主流的语音发展方向
采用开放的标准对于企业和网络通信的成长是非常必要的。采纳MRCP,为广大的开发商群体增强了信心,不仅仅是简单地生产高质量的产品,更重要的是,为应用开发、集成商的创新提供了更大的灵活性和更多的机会。
语音处理行业对标准化的需求促生了MRCP。MRCP是标准化组织IETF开发的协议标准。MRCP设计的特定目标很明确,就是为那些采用不同厂商的ASR和TTS产品来构建IVR或消息类应用的开发商提供便利。
语音行业几乎所有的重要厂商都承诺支持MRCP。这样,开发商在选择每个语音处理构件时,都有很大的灵活性。这种灵活性甚至可扩展到在一个应用内,比如:为了包含多种语言的支持而采用多个ASR或TTS供应商。IMS2.0已经和一系列的语音产品集成测试过,包括: Nuance和Aculab。
标准化的MRCP带来的益处在于:无需再为不同的或专用的语音产品提供不同的接口。这意味着集成不同语音厂商的语音技术时,可以显著地降低费用,并且确保新语音应用解决方案能快速进入市场。进一步而言,MRCP降低开发商的总拥有成本(TCO),也可以惠及最终用户,从而能在充满竞争的商业环境内确保利润。采用MRCP,在更新一个应用方案时,传统上所产生的额外费用和时间成本消失了。应用系统据此在选用不同的ASR/TTS时可以更加模块化,不必担心互操作的问题。
|