谷歌新規(guī)引擔(dān)憂：消息稱外包人員被迫評(píng)估自己不擅長(zhǎng)的 Gemini 回復(fù)

2024/12/19 10:19:53 來源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評(píng)論：

IT之家 12 月 19 日消息，據(jù) TechCrunch 報(bào)道，谷歌針對(duì)其大型語言模型 Gemini 回復(fù)的外包評(píng)估流程進(jìn)行了一項(xiàng)調(diào)整，引發(fā)了外界對(duì)其在敏感領(lǐng)域信息準(zhǔn)確性的擔(dān)憂。這項(xiàng)調(diào)整要求外包評(píng)估員不得再像以往那樣，因自身專業(yè)知識(shí)不足而跳過某些特定的評(píng)估任務(wù)，這或?qū)?dǎo)致 Gemini 在醫(yī)療保健等高度專業(yè)性領(lǐng)域的信息輸出出現(xiàn)偏差。

為了改進(jìn) Gemini，谷歌與其外包公司日立旗下的 GlobalLogic 合作，由后者雇傭的合同工負(fù)責(zé)評(píng)估人工智能生成的回復(fù)，評(píng)估標(biāo)準(zhǔn)包括“真實(shí)性”等因素。此前，如果評(píng)估員認(rèn)為某個(gè)問題超出了自身專業(yè)領(lǐng)域，例如一個(gè)關(guān)于心臟病學(xué)的專業(yè)問題，而評(píng)估員本身并無相關(guān)科學(xué)背景，他們可以選擇“跳過”該回應(yīng)，從而避免評(píng)估針對(duì)該提示（prompt）的人工智能回復(fù)。

然而，上周 GlobalLogic 宣布了一項(xiàng)來自谷歌的變更：評(píng)估員不得再以缺乏專業(yè)知識(shí)為由跳過任何提示。內(nèi)部通信顯示，此前的指導(dǎo)方針是：“如果您沒有評(píng)估此提示所需的關(guān)鍵專業(yè)知識(shí)（例如編碼、數(shù)學(xué)），請(qǐng)?zhí)^此任務(wù)?！倍碌闹笇?dǎo)方針則改為：“您不應(yīng)跳過需要特定領(lǐng)域知識(shí)的提示?！比《氖?，評(píng)估員需要“評(píng)估您理解的提示部分”，并注明自己缺乏相關(guān)領(lǐng)域知識(shí)。

這項(xiàng)變更引發(fā)了人們對(duì) Gemini 在某些主題上準(zhǔn)確性的擔(dān)憂，因?yàn)楝F(xiàn)在評(píng)估員有時(shí)需要評(píng)估一些他們完全不熟悉的、高度專業(yè)的技術(shù)性人工智能回復(fù)，例如關(guān)于罕見疾病的問題。一位合同工在內(nèi)部通信中表示：“我原以為跳過的目的是通過將其交給更專業(yè)的人來提高準(zhǔn)確性？”

根據(jù)新的指導(dǎo)方針，評(píng)估員現(xiàn)在只能在兩種情況下跳過提示：一是提示或回復(fù)“完全缺失信息”，二是提示包含需要特殊同意書才能評(píng)估的有害內(nèi)容。

這項(xiàng)新規(guī)的實(shí)施，意味著一些對(duì)專業(yè)性要求極高的領(lǐng)域，例如醫(yī)療健康等，將由缺乏相關(guān)背景知識(shí)的評(píng)估員進(jìn)行評(píng)估，這無疑增加了 Gemini 輸出不準(zhǔn)確信息的風(fēng)險(xiǎn)。外界擔(dān)憂，此舉可能會(huì)對(duì)用戶造成誤導(dǎo)，尤其是在涉及健康等重要問題時(shí)，不準(zhǔn)確的信息可能會(huì)帶來嚴(yán)重后果。

截至IT之家發(fā)稿時(shí)，谷歌尚未回應(yīng)相關(guān)報(bào)道。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

谷歌新規(guī)引擔(dān)憂：消息稱外包人員被迫評(píng)估自己不擅長(zhǎng)的 Gemini 回復(fù)

相關(guān)文章