研究人員推手語轉(zhuǎn)文字 AI 翻譯器，幫助聽障人士正常交流

2023/5/25 11:29:34 來源：IT之家作者：漾仔（實(shí)習(xí)） 責(zé)編：汪淼

評(píng)論：

IT之家 5 月 25 日消息，巴塞羅那超級(jí)計(jì)算中心（BSC）和加泰羅尼亞理工大學(xué)（UPC）的研究人員開發(fā)了一種將手語翻譯成文本的新工具，以給予聽覺障礙者更多包容性和可及性。該工具利用人工智能技術(shù)，包括自我注意機(jī)制和更快的吞吐量，以更準(zhǔn)確地理解手語者的姿勢(shì)并產(chǎn)生準(zhǔn)確的文字轉(zhuǎn)寫。

▲ 圖源 Arxiv

該工具基于 How2Sign 數(shù)據(jù)集，這是一個(gè)公開可用的大規(guī)模、多模態(tài)和多視圖數(shù)據(jù)集，包括 80 小時(shí)的美國手語教學(xué)視頻和相應(yīng)的英語文字記錄。該數(shù)據(jù)集由 BSC 和 UPC 發(fā)布，用于訓(xùn)練模型，以便將手語轉(zhuǎn)換為文本。研究人員使用膨脹式三維網(wǎng)絡(luò)（I3D）對(duì)數(shù)據(jù)進(jìn)行預(yù)處理，這是一種視頻提取方法，可以對(duì)視頻進(jìn)行三維過濾，直接從視頻中獲取時(shí)空信息。并使用了一個(gè)轉(zhuǎn)化器式的機(jī)器學(xué)習(xí)模型，與 ChatGPT 等其他人工智能工具背后的模型類似。

研究人員推手語轉(zhuǎn)文字 AI 翻譯器，幫助聽障人士正常交流

▲ 圖源論文《Sign Language Translation from Instructional Videos》

該研究的主要作者 Laia Tarrés 表示：“我們開發(fā)的新工具是以前發(fā)布的名為 How2Sign 的出版物的延伸，在那里，訓(xùn)練模型所需的數(shù)據(jù)被公布。利用這些已經(jīng)可用的數(shù)據(jù)，我們開發(fā)了一個(gè)新的開源軟件，能夠?qū)W習(xí)視頻和文本之間的映射。”

研究人員推手語轉(zhuǎn)文字 AI 翻譯器，幫助聽障人士正常交流

▲ 圖源 Pexels

研究人員發(fā)現(xiàn)，他們的模型能夠產(chǎn)生有意義的翻譯，但仍存在改進(jìn)的空間。該工具尚處于實(shí)驗(yàn)階段，研究人員將繼續(xù)努力，以創(chuàng)建一個(gè)能夠與無聽力損失者使用的技術(shù)相媲美的工具。

Laia Tarrés 同時(shí)表示：“這個(gè)自動(dòng)手語翻譯的開放工具是對(duì)關(guān)注無障礙環(huán)境的科學(xué)界的寶貴貢獻(xiàn)，它的發(fā)表代表了向?yàn)樗腥藙?chuàng)造更具包容性和無障礙的技術(shù)邁出的重要一步。”

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

研究人員推手語轉(zhuǎn)文字 AI 翻譯器，幫助聽障人士正常交流

相關(guān)文章