语音识别作为人工智能最普遍应用于民用范畴的成熟手艺,已经引起各类语音识别手艺厂家的竞争,科大讯飞语音识别、谷歌语音识别等公司都在市场进行一系列的推广设计,不外谷歌在语音识别比来祭出大招,设计开放语音识别IPA(应用法式编程接口)。
语音识别API
据科技博客TechCrunch报道,谷歌设计向第三方开发者开放其语音识别API,与Nuance及其它的语音识别公司竞争。为了吸引开发者,该API一起头将免费供给。
有关该办事的动静已经传了好几周。该公司今天在NEXT云用户大会上正式发布了该项办事。
谷歌默示,谷歌云语音API(GoogleCloudSpeechAPI)将笼盖高出80种说话,兼容任何及时串流或者批处理模式的应用,它将为应用法式供给一整套API,给它们带来“看、听与翻译”方面的功能。它基于今朝驱动谷歌应用的语音搜刮和谷歌键盘的语音输入的神经收集手艺。它还有一些其它有趣的功能,如可在嘈杂的情况运行,撑持及时运行。
谷歌的这一行动将会对整个行业发生不小的影响——尤其是对Nuance。恒久以来,Nuance一向被认为是业界最好的语音识别手艺供给商,它也是该范畴最大的一家公司。鉴于谷歌供给的体验比现有供给商要好,并且订价较低,包孕创业公司在内的浩繁Nuance客户有可能会转投谷歌手艺的怀抱。
为了引起开发者的爱好,谷歌的语音识别API一起头将完全免费供给。将来它将要收费,但价钱很可能会比力低。谷歌可能会在成为该行业的主导者之后再上调办事价钱。
截至今朝为止,谷歌在其产物中供给的语音手艺会见权限十分有限。该公司在客岁的I/O大会上发布了一款语音交互API,让Android开发者或许为他们的应用插足语音交互功能。不外,谷歌尚未直接开放它的语音识别API。
而语音识别API的推出,将不仅仅影响到Nuance和其它的语音识别手艺供给商,也将会对苹果造成冲击。苹果虚拟助手Siri的语音识别功能并不如谷歌的。苹果今朝也没有过程供给API闪开发者在他们的应用中利用Siri手艺。
各种迹象显示,谷歌似乎变得加倍注重语音手艺和浩繁的利用案例。例如,该公司在2月颁布将答应GoogleDocs用户过程语音来编纂和设计文档。
|