IT之家 3 月 24 日消息,據(jù)《麻省理工科技評論》報道,當(dāng)?shù)貢r間周五(22)日發(fā)表的一篇論文顯示,蘋果公司的研究人員正在探索利用人工智能來檢測用戶何時在與 iPhone 等設(shè)備交談的可能性,從而消除像“Siri”這樣的觸發(fā)短語的技術(shù)需求。
在這項上傳到 Arxiv 且未經(jīng)同行評審的研究中,研究人員使用智能手機捕獲的語音以及來自背景噪音的聲學(xué)數(shù)據(jù),訓(xùn)練了一個大型語言模型,以尋找“可能表明用戶需要設(shè)備輔助”的模式。
論文中稱,該模型部分基于 OpenAI 的 GPT-2 構(gòu)建,因為它相對輕量級,可以在智能手機等設(shè)備上運行。論文還描述了用于訓(xùn)練模型的超過 129 小時的數(shù)據(jù)、額外的文本數(shù)據(jù),但沒有說明訓(xùn)練集的錄音來源。據(jù)領(lǐng)英個人資料,七位作者中有六位列出他們的隸屬關(guān)系為蘋果公司,其中三人在蘋果 Siri 團隊工作。
論文最終得出的結(jié)論“令人鼓舞”,聲稱該模型能夠比純音頻或純文本模型做出更準(zhǔn)確的預(yù)測,并且隨著模型規(guī)模的擴大而進一步改進。
IT之家提醒:目前,Siri 的功能是通過保留少量音頻來實現(xiàn)的,聽到“嘿,Siri”等觸發(fā)短語之前,不會開始錄制或準(zhǔn)備回答用戶提示。
斯坦福人類中心人工智能研究所的隱私和數(shù)據(jù)政策研究員詹?金表示,取消“嘿,Siri”提示可能會增加對設(shè)備“始終監(jiān)聽”的擔(dān)憂。
參考
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。