谷歌正计划向第三方开发者提供自身的语音识别API与Nuance公司和其他语音识别公司迎面竞争。为了吸引广大开发者,该应用将在日后免费推出。
我们几乎每周都会听到关于服务发展行业的杂音。谷歌这次的决定是在它的NEXT云计算用户大会上宣布的,此次大会上,它同时也推出了其他学习机的改进和更新计划,最显著的是这次可是一个全新的机器学习平台。
谷歌的这次的云语音API将覆盖超过80种语言,并且该应用支持实时和批量处理模式,它以“看,听和翻译,”的方式为该应用提供了一整套的API。谷歌说,它与谷歌键盘的语音搜索和语音输入应用相比,它是基于同样的神经网络技术的。当然它还有一些其他有趣的特性,比如在嘈杂的环境中它仍然能够实时工作。
谷歌的这次举动将会对该行业有很大的影响 - 特别是Nuance,Nuance早就想到了提供业界最好的语音识别能力,并且也是此类服务得最大提供商。许多Nuance的客户,包括创业公司,可以会抛弃Nuance从而选择支持谷歌的技术,因为它不仅给当前用户提供了更佳的体验,同时也是目前成本较低的一个。
最初为了吸引开发者的兴趣,该API将是完全免费使用。过了一段时间后,该API将可能需要支付一个低成本的定价,这一点我们当然可以理解。谷歌方面可能会选择过一段时间,等它成为同行业的龙头老大后再次提高这些价格。
谷歌在它产品更新后,已经为它的语音技术提供了有限的访问权限。开发者可以利用JavaScript调用到Chrome的API,例如,之后将其发送到语音识别的API。同时谷歌在2015年宣布了开放一个Google I/O的语音交互API,这使得Android开发者能够将语音交互添加到他们的应用中。但谷歌还没有直接开放它们进入语音识别的API。
语音API介绍将不仅会影响到Nuance公司和其他语音识别提供商,同时也被看作是对苹果的攻击,因为苹果的虚拟助理Siri所拥有的语音识别功能也是谷歌的对手。Siri也没有为了开发者能够让自己的应用使用Siri技术而提供自己的API。
谷歌将会更加强调它的语音技术和并且提供许多使用案例。例如,该公司在二月份宣布,它将允许谷歌文档的用户通过语音编辑和格式化他们的文档。
想了解更多请持续关注,我们将在活动中听到您的想法。
英文原文:Google opens access to its speech recognition API, going head to head with Nuance