語音識別手藝已經(jīng)成為全球科技大鱷競相追逐的黑科技,也是將來進入智能家居、聰明家庭的主要切入點,國際巨頭微軟、IBM、蘋果、谷歌一向在語音識別手藝下足功夫,識別能力分庭抗禮,IBM以誤碼率低的細小優(yōu)勢領(lǐng)先行業(yè)。
但近期泛起展轉(zhuǎn),就在此前,近期微軟頒布了一項關(guān)于機械了解人類說話的主要測試成績,即研究人員獲得了迄今最低語音識別會話誤碼率(WER)——6.3%,讓其成功登頂語音識別最低誤碼率,引起了業(yè)界存眷。
據(jù)領(lǐng)會,該測試是美國國度尺度局(NIST)的2000總機語音識別進行的使命。咨詢機構(gòu)Wall Street Pit辯論認為,微軟團隊轉(zhuǎn)向“作為行業(yè)尺度的德律風語音識別測試”成就斐然,鞏固了其在語音識別范疇的霸主地位。 闡明認為,微軟取得這一成就來自幾個方面的勉力:研究人員在本年早些時辰,應用深度神經(jīng)收集手藝博得了一項爭論機視覺挑戰(zhàn);微軟比來在爭論收集東西包(CNTK)中的成熟案例,也是獲得本次好成就的環(huán)節(jié)構(gòu)成部門。CNTK實現(xiàn)了“深度進修算法”的復雜優(yōu)化進級,運行速度比本來晉升一個數(shù)目級;另一個環(huán)節(jié)步調(diào)是圖形處理單元的并行練習能力取得了沖破。
業(yè)內(nèi)助士默示,近年來,大型軟件公司科研經(jīng)費有被縮減的趨勢,且更專注于深度神經(jīng)收集的研究,但現(xiàn)實上,語音識別手藝的應用更早一些。有辯論稱,曩昔20年中,研究顯示的爭論機語音識別系統(tǒng)的最高誤碼率甚至達到過43%,而隨后最超卓的單系統(tǒng)NIST2000總機誤碼率為6.9%。
在近日于舊金山進行的“Interspeech語音通信和手藝國際會議”上,IBM驕傲地頒布其誤碼率只有6.6%。但此次微軟頒布的6.3%的誤碼率,以微弱優(yōu)勢取勝。
今朝,微軟已經(jīng)擬定出了基于語音平臺的人機交互策略,成功構(gòu)建起人工智能的環(huán)節(jié)手藝,讓相關(guān)語音對話在可穿戴設備、智妙手機、聰明家庭、聰明車輛及貿(mào)易辦事中闡揚主要感化。
|