語音識別作為人工智能最普遍應用于民用范疇的成熟手藝,已經(jīng)引起各類語音識別手藝廠家的競爭,科大訊飛語音識別、谷歌語音識別等公司都在市場進行一系列的推廣設計,不外谷歌在語音識別比來祭出大招,設計開放語音識別IPA(應用法式編程接口)。
語音識別API
據(jù)科技博客TechCrunch報道,谷歌設計向第三方開發(fā)者開放其語音識別API,與Nuance及其它的語音識別公司競爭。為了吸引開發(fā)者,該API一起頭將免費供給。

有關該辦事的動靜已經(jīng)傳了好幾周。該公司今天在NEXT云用戶大會上正式發(fā)布了該項辦事。
谷歌默示,谷歌云語音API(GoogleCloudSpeechAPI)將籠蓋高出80種說話,兼容任何及時串流或者批處理模式的應用,它將為應用法式供給一整套API,給它們帶來“看、聽與翻譯”方面的功能。它基于今朝驅動谷歌應用的語音搜刮和谷歌鍵盤的語音輸入的神經(jīng)收集手藝。它還有一些其它有趣的功能,如可在嘈雜的情況運行,撐持及時運行。
谷歌的這一行動將會對整個行業(yè)發(fā)生不小的影響——尤其是對Nuance。恒久以來,Nuance一向被認為是業(yè)界最好的語音識別手藝供給商,它也是該范疇最大的一家公司。鑒于谷歌供給的體驗比現(xiàn)有供給商要好,并且訂價較低,包孕創(chuàng)業(yè)公司在內(nèi)的浩繁Nuance客戶有可能會轉投谷歌手藝的懷抱。
為了引起開發(fā)者的愛好,谷歌的語音識別API一起頭將完全免費供給。將來它將要收費,但價錢很可能會比力低。谷歌可能會在成為該行業(yè)的主導者之后再上調(diào)辦事價錢。
截至今朝為止,谷歌在其產(chǎn)物中供給的語音手藝會見權限十分有限。該公司在客歲的I/O大會上發(fā)布了一款語音交互API,讓Android開發(fā)者或許為他們的應用插足語音交互功能。不外,谷歌尚未直接開放它的語音識別API。
而語音識別API的推出,將不僅僅影響到Nuance和其它的語音識別手藝供給商,也將會對蘋果造成沖擊。蘋果虛擬助手Siri的語音識別功能并不如谷歌的。蘋果今朝也沒有過程供給API閃開發(fā)者在他們的應用中利用Siri手藝。
各種跡象顯示,谷歌似乎變得加倍注重語音手藝和浩繁的利用案例。例如,該公司在2月頒布將答應GoogleDocs用戶過程語音來編纂和設計文檔。
|