IT之家3月13日消息 今日,谷歌通過博客悄然宣布實時語音識別技術的突破。使用人工智能技術并利用其Pixel手機的神經處理功能,Gboard用戶現在可以進行離線實時語音識別。
圖源:谷歌
目前,如果用戶在Pixel設備上使用Gboard,要進行語音識別并轉化成文本,實時語音處理需要使用Wi-Fi或蜂窩數據連接進行。谷歌宣布,自從它首次引入神經學習來處理人類語音以來,它一直在繼續(xù)開發(fā)軟件架構,以便使用其Pixel設備的神經處理功能完全離線工作。
據介紹,谷歌新型遞歸神經網絡傳感器(RNN-T)體積已經足夠小,可以完全安裝在手機上,消除網絡延遲和零散連接,這是隨時使用該技術的障礙。它可以實時輸出逐字輸出的字樣,就好像有人在說出你說的那樣。
谷歌已經能夠通過將數據處理要求從2GB(需要無線連接進行離線處理)降低到僅僅80 MB進行處理來實現這一目標。
雖然最初只適用于使用Pixel設備并僅使用美國英語的Gboard用戶,但Google希望其開發(fā)的研究技術將被用于更多語言和更多設備以及用于其他環(huán)境。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。