網(wǎng)易科技訊12月12日消息,據(jù)國外媒體報道,自2014年亞馬遜發(fā)布智能音箱Echo以來,亞馬遜Echo、谷歌Home和Apple HomePod等“智能音箱”設(shè)備已經(jīng)銷售了數(shù)以百萬臺,大科技公司正在將亞馬遜Alexa、蘋果Siri、谷歌Assistant、微軟Cortana,以及Facebook的類似服務(wù)整合到人們生活中。咨詢公司Juniper Research估計,到2023年,全球智能音箱年市場規(guī)模將達到110億美元,全球約有74億部語音控制設(shè)備。
科技公司表示智能音箱只有在用戶激活時才會錄音,但事實上正在把永遠開著的麥克風(fēng)引入私密空間。亞馬遜及其競爭對手表示,絕大多數(shù)語音請求都是由電腦自動執(zhí)行的,無需人工審核。然而,這些智能設(shè)備都在依賴成千上萬的低薪員工進行人工轉(zhuǎn)錄,用戶私密對話已經(jīng)成為他們最有價值的數(shù)據(jù)集之一。所有科技公司都認為,這是改善他們產(chǎn)品的一種合理方式。
蘋果
2011年,蘋果公司推出了帶有Siri功能的iPhone 4S,不再需要通過實驗室收集錄音。幾天之內(nèi),蘋果賣出了400多萬部4S手機,開始免費積累不可估量的自然語音數(shù)據(jù)。在最初的幾年里,直到2014年之前,蘋果都在依賴外部語音軟件專家使用這些數(shù)據(jù)來提高Siri的分析能力。過去幾年,蘋果在收集和分析自然語音方面非常積極,期望外包商能解釋語音片段中不同的語言、方言和文化特質(zhì)。在GlobeTech辦公室里,合同工們戴著耳機坐在電腦前,每天要抄錄1300個片段。當(dāng)合同工點擊播放語音錄音時,電腦會在一個文本框中填入它認為Siri“聽到”的單詞,然后提示通過或更正內(nèi)容。當(dāng)合同工詢問負責(zé)人是否可以跳過過于私密的語音片段時,卻被告知沒有任何片段是過于私密的。合同工通常只工作幾個月,關(guān)于隱私問題的培訓(xùn)也很少。一名對這項工作毫無疑慮的前合同工表示,偷聽真實世界的用戶的聲音“絕對令人捧腹”。
2015年,蘋果Siri每周處理的請求超過10億次。這時的用戶可以開啟一項功能,不必再按iPhone上的按鈕來激活語音助手,但這種情況下Siri總是處于傾聽狀態(tài)。蘋果表示,語音數(shù)據(jù)可能會被記錄和分析以改進Siri,但它沒有提到人們可能會被監(jiān)聽?!巴德爠e人說話讓我覺得非常不舒服,”一位前合同工說。
蘋果Siri部門的十名前高管表示,他們從不認為Siri系統(tǒng)侵犯了隱私。這些前高管表示,錄音與蘋果用戶標(biāo)識無關(guān),他們認為用戶會理解蘋果在處理他們的音頻剪輯,那么有人幫忙處理又有什么關(guān)系呢?“我們在情感上感到安全,認為這樣做是正確的,”Siri高級開發(fā)小組前員工約翰·伯基(John Burkey)說。“這與應(yīng)用程序崩潰并詢問你是否要將報告發(fā)送給蘋果是一樣的。這只是個語音錯誤?!?/p>
蘋果公司表示,只有不到0.2%的Siri請求經(jīng)過了人工分析。到2019年,蘋果將Siri引入無線耳機和HomePod音箱等產(chǎn)品后,Siri每月處理150億條語音指令,0.2%仍意味著每月有3000萬次請求經(jīng)過語音分析,一年就是3.6億次。
亞馬遜
在智能音箱領(lǐng)域,蘋果的HomePod估計只占美國市場的5%。亞馬遜估計有70%。亞馬遜Echo的七個麥克風(fēng)一直在監(jiān)聽“喚醒詞”,這將觸發(fā)新的錄音。與蘋果一樣,每一段用戶音頻都會被發(fā)送到公司的服務(wù)器,其中的一部分會被分流到數(shù)百個數(shù)據(jù)關(guān)聯(lián)公司中進行人工審查。
默認情況下,亞馬遜會無限期保留錄音。亞馬遜沒有透露這些數(shù)據(jù)的具體用途,只是表示在將Alexa翻譯成世界各地新語言和擴展其響應(yīng)能力方面,人工轉(zhuǎn)錄已被證明具有巨大的優(yōu)勢。
從羅馬尼亞首都布加勒斯特到印度南部城市欽奈,亞馬遜已經(jīng)在世界各地的城市建立了數(shù)量眾多的人工轉(zhuǎn)錄機構(gòu),今年它已經(jīng)舉辦了好幾次為海外人工轉(zhuǎn)錄員舉行的招聘會。一位花了數(shù)十年時間為科技公司開發(fā)識別系統(tǒng)的技術(shù)專家表示,亞馬遜最近一次招聘活動中概述的音頻數(shù)據(jù)分析規(guī)模之大令人震驚。亞馬遜表示,它非常重視“客戶及其語音記錄的安全”,而且它需要完全理解地方口音和各種口語,才能讓Alexa全球化。
微軟
今年8月,微軟承認,會使用人工審查包括Cortana和即時通訊應(yīng)用程序Skype在內(nèi)的語音識別技術(shù)產(chǎn)品生成的語音數(shù)據(jù)。寶馬、惠普和Humana等公司正在將相關(guān)技術(shù)整合到自己的產(chǎn)品和服務(wù)中。行業(yè)分析師說,谷歌和Facebook同樣認為音頻數(shù)據(jù)將極大推動它們龐大的廣告業(yè)務(wù)。密歇根大學(xué)教授Schaub表示,網(wǎng)頁瀏覽行為向這些公司提供了大量個人信息,但錄音可以讓人工智能更容易估算出用戶年齡、性別、情緒,甚至所處地點和興趣。
谷歌
谷歌Assistant為谷歌搜索引擎提供來自10億臺設(shè)備的查詢,包括Android智能手機和平板電腦、Nest恒溫器和索尼電視。谷歌也聘請海外臨時工來轉(zhuǎn)錄音頻片段,以提高系統(tǒng)的準(zhǔn)確性。谷歌承諾,經(jīng)過審查的語音記錄不會與任何個人信息相關(guān)聯(lián)。但今年夏天,谷歌一家承包商向比利時廣播公司VRT NWS共享了1000多份用戶錄音。媒體根據(jù)錄音內(nèi)容確立了一些用戶,讓人大為震驚。其中大約有10%的錄音片段是在未經(jīng)這些用戶同意的情況下錄制的,因為設(shè)備錯誤地檢測到了喚醒詞“OK,谷歌”。
谷歌的一名女發(fā)言人說:“自從聽到這些擔(dān)憂后,我們一直致力于暫停助理音頻的人工轉(zhuǎn)錄,同時加強我們的隱私控制。該公司拒絕評論人類是否轉(zhuǎn)錄了從其他谷歌服務(wù)收集到的語音數(shù)據(jù)。谷歌助理的一名高級工程師最近離開了公司,他說,如果語音助理(包括谷歌的)更有用的話,人們可能會忽視窺探的擔(dān)憂。
Facebook在2018年11月推出了集智能音箱和可視電話于一體的Portal時,就已經(jīng)受到數(shù)據(jù)隱私丑聞的困擾。但其也一直依賴人工轉(zhuǎn)錄音頻來訓(xùn)練人工智能,來源不止是用戶音頻。Facebook通過埃森哲雇傭的一名承包商被要求使用Facebook個人賬戶給朋友和家人打電話,創(chuàng)建新的音頻,但沒有告訴他們?yōu)槭裁?。Facebook內(nèi)部的一名消息人士證實,這些同化會被記錄下來。但Facebook表示,從未明確要捕捉實際的通話內(nèi)容。
Facebook聊天應(yīng)用Messenger支持用戶傳輸音頻信息,其也依賴人工轉(zhuǎn)錄。公司會提示用戶選擇讓其人工智能自動轉(zhuǎn)錄這些語音信息,但沒有告訴他們這些剪輯也被交給了承包商TaskUs進行人工審查。Facebook也沒有告訴TaskUs這些音頻是從哪里來的。
負責(zé)監(jiān)督Facebook硬件部門的副總裁安德魯·博斯沃思(Andrew Bosworth)說,除了像蘋果那樣將語音文件與用戶ID分開之外,F(xiàn)acebook軟件還會在將文件轉(zhuǎn)發(fā)給承包商之前,略微改變每個人的音調(diào)。他承認使用語音指令工具需要“對工具背后的技術(shù)承包商抱有很大信息”,但很他相信谷歌、亞馬遜以及Facebook使用語音數(shù)據(jù)實在改善他們的服務(wù)而非利用敏感信息。博斯沃思表示自己家中也有多個語音設(shè)備。
今年,幾家大型科技公司調(diào)整了它們的策略。谷歌暫停人工轉(zhuǎn)錄Assistant音頻,蘋果已經(jīng)開始允許用戶刪除Siri的歷史記錄,并選擇不再分享更多內(nèi)容;把共享錄音設(shè)為可選項,并直接聘用許多前承包商來加強對人工轉(zhuǎn)錄的控制。Facebook和微軟在其隱私政策中增加了更明確的免責(zé)聲明。亞馬遜也披露了類似的信息,并開始允許Alexa用戶選擇對錄音不進行人工審核?!斑@是業(yè)內(nèi)眾所周知的事情,”亞馬遜最近談到人工轉(zhuǎn)錄時說?!安还苁敲襟w還是用戶都知道,很明顯我們在這方面做得不夠好?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。