谷歌正计划向第三方开发者提供自身的语音识别APINuance公司和其他语音识别公司迎面竞争。为了吸引广大开发者,该应用将在日后免费推出。

我们几乎每周都会听到关于服务发展行业杂音谷歌这次的决定是在它的NEXT云计算用户大会上宣布的,此次大会上,它同时也推出了其他学习机的改进和更新计划,最显著的是这次可是一个全新的机器学习平台

谷歌的这次的云语音API将覆盖超过80种语言,并且该应用支持实时和批量处理模式,它以“看,听和翻译”的方式为该应用提供了一整套的API。谷歌说,与谷歌键盘语音搜索语音输入应用相比,它是基于同样的神经网络技术的。当然它还有一些其他有趣的特性,比如在嘈杂的环境中它仍然能够实时工作

谷歌的这次举动将会对该行业有很大的影响 - 特别是Nuance,Nuance早就想到了提供业界最好的语音识别能力,并且也是此类服务得最大提供商。许多Nuance的客户,包括创业公司,可以会抛弃Nuance从而选择支持谷歌的技术,因为它不仅给当前用户提供了更佳的体验,同时也是目前成本较低的一个

最初为了吸引开发者的兴趣,该API将是完全免费使用。过了一段时间后,该API将可能需要支付一个低成本的定价,这一点我们当然可以理解。谷歌方面可能会选择过一段时间,等它成为同行业的龙头老大再次提高这些价格

谷歌在产品更新后,已经为它的语音技术提供了有限的访问权限。开发者可以利用JavaScript调用到Chrome的API,例如,之后将其发送到语音识别的API。同时谷歌2015年宣布开放一个Google I/O的语音交互API,这使得Android开发者能够将语音交互添加到他们的应用中但谷歌还没有直接开放它们进入语音识别的API。

语音API介绍将不仅会影响到Nuance公司和其他语音识别提供商,同时也被看作是对苹果的攻击,因为苹果的虚拟助理Siri所拥有的语音识别功能也是谷歌的对手。Siri没有为了开发者能够让自己的应用使用Siri技术而提供自己的API。

谷歌将会更加强调它的语音技术和并且提供许多使用案例。例如,该公司在二月份宣布,它将允许谷歌文档的用户通过语音编辑和格式化他们的文档。

想了解更多请持续关注,我们将在活动中听到您的想法

英文原文:Google opens access to its speech recognition API, going head to head with Nuance