AI「幻覺(jué)」可能在一般人看來(lái)是模型的胡言亂語(yǔ),但它為科學(xué)家提供了新的靈感。David Baker 甚至利用 AI「幻覺(jué)」贏得了諾貝爾化學(xué)獎(jiǎng)。紐約時(shí)報(bào)發(fā)文 AI 正在加速科學(xué)發(fā)展,但「幻覺(jué)」一詞,在科學(xué)界仍有爭(zhēng)議。
萬(wàn)萬(wàn)沒(méi)想到,一直備受批評(píng)的 AI「幻覺(jué)」問(wèn)題,竟然在科學(xué)領(lǐng)域具有極大的應(yīng)用價(jià)值?
就在最近,計(jì)算機(jī)科學(xué)家 Amy McGovern 表示:「公眾認(rèn)為這完全是壞事。但實(shí)際上,它為科學(xué)家提供了新的靈感,讓他們得以探索一些原本可能不會(huì)想到的思路?!?/p>
AI「幻覺(jué)」可以幫助科學(xué)家通過(guò)測(cè)試「夢(mèng)幻式」的新概念,來(lái)追蹤癌癥、設(shè)計(jì)藥物、發(fā)明醫(yī)療設(shè)備并揭示氣象現(xiàn)象
AI「幻覺(jué)」激發(fā)科學(xué)創(chuàng)造力
科學(xué)在人們心中的形象冷靜而理性。
然而,在科學(xué)發(fā)現(xiàn)的早期階段,往往充滿了直覺(jué)和大膽的猜想。正如科學(xué)哲學(xué)家 Paul Feyerabend 所言,這是一種「無(wú)拘無(wú)束」的探索狀態(tài)。
如今,AI 的「幻覺(jué)」正在重新激發(fā)科學(xué)的創(chuàng)造力。
這種技術(shù)加速了科學(xué)家和發(fā)明家提出新想法并驗(yàn)證其是否符合現(xiàn)實(shí)的過(guò)程。
這可以被視為科學(xué)方法的加速版。以往需要數(shù)年完成的任務(wù),現(xiàn)在可能在幾天、幾小時(shí)甚至幾分鐘內(nèi)實(shí)現(xiàn)。
有時(shí)候,甚至幫助科學(xué)家加速了研究周期,開(kāi)辟了全新的研究領(lǐng)域。
麻省理工學(xué)院教授 James J. Collins 說(shuō):「我們正在探索」。他最近稱贊 AI 的「幻覺(jué)」加速了他對(duì)新型抗生素的研究進(jìn)展?!肝覀冏屇P吞岢鐾耆路f的分子?!?/p>
科學(xué)家向生成式計(jì)算機(jī)模型輸入特定主題的信息,然后讓機(jī)器對(duì)主題進(jìn)行重新加工,從而產(chǎn)生 AI 的「幻覺(jué)」。
結(jié)果可能有細(xì)微的偏差,也可能超越現(xiàn)實(shí)。有時(shí),它們會(huì)帶來(lái)重大發(fā)現(xiàn)。
「幻覺(jué)」帶來(lái)的諾貝爾化學(xué)獎(jiǎng)
去年十月,華盛頓大學(xué)的 David Baker 因其開(kāi)創(chuàng)性的蛋白質(zhì)研究獲得了諾貝爾化學(xué)獎(jiǎng)。這些復(fù)雜的分子是生命活動(dòng)的關(guān)鍵動(dòng)力。
諾貝爾委員會(huì)稱贊他發(fā)現(xiàn)了快速構(gòu)建完全不同于自然界中蛋白質(zhì)的新方法,并稱其成就「幾乎不可能」。
在獎(jiǎng)項(xiàng)宣布前的一次采訪中,Baker 博士將 AI 的「突發(fā)想象」描述為「從零開(kāi)始設(shè)計(jì)蛋白質(zhì)」的關(guān)鍵。
他補(bǔ)充說(shuō),這項(xiàng)新技術(shù)幫助他的實(shí)驗(yàn)室獲得了約 100 項(xiàng)專利,其中許多用于醫(yī)療用途。一個(gè)專利用于一種新的癌癥治療方法,另一個(gè)旨在支持全球抗擊病毒感染的工作。他還創(chuàng)辦或協(xié)助創(chuàng)立了超過(guò) 20 家生物技術(shù)公司。
他說(shuō):「發(fā)展速度非???,即使是專門(mén)研究蛋白質(zhì)的科學(xué)家,也不了解目前的進(jìn)展有多大?!?/p>
他的實(shí)驗(yàn)室設(shè)計(jì)了多少種蛋白質(zhì)?
他回答道:「一千萬(wàn)種,而且都是全新的。它們?cè)谧匀唤缰胁⒉淮嬖?。?/p>
諾貝爾獎(jiǎng)獲得者 Baker 博士對(duì)「幻覺(jué)」采取了直截了當(dāng)?shù)膽B(tài)度。
在 2021 年,他在 Nature 上發(fā)表了一篇論文,標(biāo)題為《通過(guò)深度網(wǎng)絡(luò)幻覺(jué)進(jìn)行從頭蛋白質(zhì)設(shè)計(jì)》(De novo protein design by deep network hallucination)。
論文地址:https://www.nature.com/articles/s41586-021-04184-w
標(biāo)題中的「從零(De novo)」一詞源自拉丁文,意為「從零開(kāi)始」,與 1980 年代初科學(xué)家開(kāi)始修改自然界已知蛋白質(zhì)結(jié)構(gòu)的做法形成了鮮明對(duì)比。
2003 年,Baker 博士及其同事實(shí)現(xiàn)了一個(gè)更宏偉的目標(biāo):從零構(gòu)建世界上第一個(gè)全新蛋白質(zhì)。
他們將其命名為 Top7。這一成就被視為一項(xiàng)重要的突破,因?yàn)榈鞍踪|(zhì)的復(fù)雜性堪稱驚人。
專家將 DNA 的結(jié)構(gòu)比作一串珍珠,而將大型蛋白質(zhì)的結(jié)構(gòu)比作糾結(jié)的毛球。即使是詳細(xì)的圖示,也只能粗略地表現(xiàn)蛋白質(zhì)的復(fù)雜結(jié)構(gòu)。
在流感病毒表面的血凝素蛋白的棱周?chē)鷷?huì)形成一種粘合劑蛋白,針對(duì)這些易受攻擊的點(diǎn)可以阻止病菌附著在肺部和其他地方的細(xì)胞上
隨著 AI 發(fā)展成為一種強(qiáng)大的新技術(shù),Baker 博士開(kāi)始思考它是否能夠加速?gòu)牧汩_(kāi)始的蛋白質(zhì)設(shè)計(jì)。
他在 2021 年的論文中提到,新方法受到了谷歌 DeepDream 模型的啟發(fā)。
DeepDream 模型可以將現(xiàn)有圖像轉(zhuǎn)化為迷幻風(fēng)格,創(chuàng)造全新的視覺(jué)內(nèi)容。
當(dāng)人們看滿月時(shí)看到一個(gè)人的臉,這被稱為「空想性錯(cuò)覺(jué)」(pareidolia),即一種將模糊圖案轉(zhuǎn)化為有意義圖像的感知現(xiàn)象。DeepDream 正是利用了這種特性來(lái)創(chuàng)造超現(xiàn)實(shí)的圖像。
Baker 博士的計(jì)劃是測(cè)試 AI 是否可以將這種「空想性錯(cuò)覺(jué)」應(yīng)用于模糊的氨基酸集合 —— 氨基酸是蛋白質(zhì)的基本構(gòu)建塊。
他的團(tuán)隊(duì)將隨機(jī)的氨基酸序列輸入一個(gè)經(jīng)過(guò)訓(xùn)練的模型,而該模型能識(shí)別真實(shí)蛋白質(zhì)的結(jié)構(gòu)特征。
結(jié)果大大超出了預(yù)期。
論文指出,測(cè)試運(yùn)行生成了數(shù)千種虛擬蛋白質(zhì),并將其比作互聯(lián)網(wǎng)中泛濫的貓圖片。
論文寫(xiě)道:「就像由深度網(wǎng)絡(luò)幻覺(jué)生成的貓圖像可以清晰地被識(shí)別為貓一樣。這些人工蛋白質(zhì)結(jié)構(gòu)與天然結(jié)構(gòu)相似,但并不完全相同。」
隨后,貝克團(tuán)隊(duì)嘗試將這些虛擬的蛋白質(zhì)轉(zhuǎn)化為現(xiàn)實(shí) —— 這一過(guò)程類似于讓電子貓變?yōu)檎鎸?shí)存在的生物貓。首先,團(tuán)隊(duì)將這些虛擬分子的結(jié)構(gòu)信息作為藍(lán)圖,用以生產(chǎn)形成基因的 DNA 鏈。接著,正如 2021 年的論文所述,當(dāng)這些基因被插入微生物體內(nèi)后,這些微生物成功產(chǎn)生了 129 種從未在科學(xué)或自然界中發(fā)現(xiàn)的新蛋白質(zhì)。
2022 年初,Baker 博士將這一成就描述為「AI 加速?gòu)牧愕鞍踪|(zhì)設(shè)計(jì)的首次實(shí)證」。
在他于 2022 年和 2023 年發(fā)表的后續(xù)論文中,「幻覺(jué)」一詞仍然出現(xiàn)在標(biāo)題中。
擴(kuò)散模型帶來(lái)蛋白質(zhì)催化劑
Baker 博士表示,他的實(shí)驗(yàn)室最近在創(chuàng)意生成方面取得了新突破,采用了一種稱為擴(kuò)散(diffusion)的 AI 方法。這也是 DALL-E 和 Sora 等流行視覺(jué)生成器的核心技術(shù)。
Baker 博士稱贊擴(kuò)散技術(shù)在設(shè)計(jì)新蛋白質(zhì)方面比「幻覺(jué)」更高效,他說(shuō):「速度更快,成功率也更高?!?/p>
近年來(lái),一些分析人士擔(dān)心科學(xué)正在走向衰退。他們指出,過(guò)去幾十年來(lái),突破性發(fā)現(xiàn)的數(shù)量正在減少。
AI 的支持者則認(rèn)為,創(chuàng)造性爆發(fā)正在扭轉(zhuǎn)這一趨勢(shì)。
在設(shè)計(jì)領(lǐng)域,Baker 博士及其同事看到一波波蛋白質(zhì)催化劑即將誕生。這些催化劑可能幫助收集太陽(yáng)能、將老舊工廠改造成高效節(jié)能設(shè)施,并為構(gòu)建一個(gè)可持續(xù)的新世界提供支持。
Baker 團(tuán)隊(duì)的成員 Ian C. Haydon 認(rèn)為這種加速仍在繼續(xù)并表示「這令人難以置信。」
「幻覺(jué)」是天才的表現(xiàn)
谷歌旗下 AI 公司 DeepMind 科學(xué)部負(fù)責(zé)人 Pushmeet Kohli 在一次采訪中稱贊了「幻覺(jué)」在促進(jìn)科學(xué)發(fā)現(xiàn)方面的作用。
不久前,他的兩位同事與 David Baker 博士共同分享了 2024 年的諾貝爾化學(xué)獎(jiǎng)。
Pushmeet Kohli 表示:「我們擁有一項(xiàng)能夠展現(xiàn)創(chuàng)造力的驚人工具」。
Pushmeet Kohli 博士舉了一個(gè)例子,說(shuō)明了這種工具的創(chuàng)造力。
2016 年,DeepMind 的計(jì)算機(jī)在圍棋比賽中擊敗了世界冠軍。
這場(chǎng)比賽的轉(zhuǎn)折點(diǎn)是第 37 步,發(fā)生在比賽的早期階段。
Kohli 博士回憶道:「我們一開(kāi)始以為那是個(gè)錯(cuò)誤。但隨著比賽的進(jìn)行,人們意識(shí)到那是一種天才的表現(xiàn)。因?yàn)?,這些模型能夠產(chǎn)生非常新穎的見(jiàn)解?!?/p>
他認(rèn)同 AI 在加速生物科學(xué)的發(fā)展:「接下來(lái)的幾年中會(huì)出現(xiàn)許多令人驚嘆的成果」。
他認(rèn)為,AI 正在解鎖生命最深層的奧秘,并為治愈疾病、改善健康和延長(zhǎng)壽命奠定了強(qiáng)大的新基礎(chǔ)。
他說(shuō):「一旦我們破譯并真正理解生命的語(yǔ)言,那將是奇跡」。
更多的「幻覺(jué)」
另一方面,曼哈頓紀(jì)念斯隆凱特琳癌癥中心實(shí)驗(yàn)室負(fù)責(zé)人 Harini Veeraraghavan,在一篇關(guān)于利用 AI 改善模糊醫(yī)學(xué)圖像的論文中提到了「幻覺(jué)」一詞。
這篇論文的標(biāo)題部分直接寫(xiě)道「幻覺(jué) MRI」。
論文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf
得克薩斯大學(xué)奧斯汀分校的研究人員也接受了這一術(shù)語(yǔ)。他們的一篇論文標(biāo)題寫(xiě)道:「從幻覺(jué)中學(xué)習(xí)」,討論如何改進(jìn)機(jī)器人導(dǎo)航。
論文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf
「幻覺(jué)」設(shè)計(jì)的新事物需要驗(yàn)證
盡管 AI「幻覺(jué)」在科學(xué)發(fā)現(xiàn)中的吸引力巨大,但一些科學(xué)家認(rèn)為這一術(shù)語(yǔ)具有誤導(dǎo)性。
他們認(rèn)為,生成式 AI 模型的「想象」并非完全虛幻,而是具有一定實(shí)現(xiàn)可能性的,就像科學(xué)方法早期階段的假設(shè)一樣。因此,他們認(rèn)為「幻覺(jué)」一詞不夠準(zhǔn)確,并傾向于避免使用。
此外,「幻覺(jué)」一詞還因其與迷幻藥(如 LSD)導(dǎo)致的幻覺(jué)聯(lián)想而受到質(zhì)疑。迷幻藥在過(guò)去曾讓許多嚴(yán)肅的科學(xué)研究裹足不前。
最后,在科學(xué)和醫(yī)學(xué)交流中,AI 生成的信息可能被錯(cuò)誤信息所混淆,就像像聊天機(jī)器人的回復(fù)那樣,這也讓「幻覺(jué)」一詞更加備受爭(zhēng)議。
今年七月,白宮發(fā)布了一份關(guān)于促進(jìn)公眾信任 AI 研究的報(bào)告,其中唯一提到「幻覺(jué)」的部分是關(guān)于如何減少它們的存在。
諾貝爾獎(jiǎng)委員會(huì)似乎也遵循了這一思路。在對(duì) Baker 博士工作的詳細(xì)評(píng)價(jià)中,沒(méi)有提及 AI「幻覺(jué)」。相反,在新聞稿中,僅稱贊了他的團(tuán)隊(duì)「創(chuàng)造了一種又一種富有想象力的蛋白質(zhì)」。
科學(xué)界的部分機(jī)構(gòu)似乎越來(lái)越傾向于將「幻覺(jué)」視為一個(gè)不宜提及的詞匯。
盡管如此,專家們?cè)诩~約時(shí)報(bào)的采訪中指出,科學(xué) AI 的「想象」相比聊天機(jī)器人等的「幻覺(jué)」具有顯著優(yōu)勢(shì)。
最根本的一點(diǎn)是,這種創(chuàng)造性爆發(fā)基于自然和科學(xué)的硬性事實(shí),而非人類語(yǔ)言的歧義或互聯(lián)網(wǎng)中的偏見(jiàn)和虛假信息。
「幻覺(jué)」并不可靠
加州理工學(xué)院的數(shù)學(xué)與計(jì)算機(jī)科學(xué)教授 Anima Anandkumar 表示:「我們正在教授 AI 物理學(xué)」。她曾擔(dān)任 AI 芯片領(lǐng)先制造商英偉達(dá)的 AI 研究主管。
Anandkumar 博士補(bǔ)充說(shuō),對(duì)于科學(xué)而言,基于可靠事實(shí)的物理學(xué)基礎(chǔ)可以帶來(lái)高度準(zhǔn)確的結(jié)果。
她指出,聊天機(jī)器人的大語(yǔ)言模型無(wú)法實(shí)際驗(yàn)證其陳述和斷言的正確性。
她強(qiáng)調(diào),最終的驗(yàn)證來(lái)自科學(xué)家將這些 AI 生成的構(gòu)想與物理現(xiàn)實(shí)的具體細(xì)節(jié)進(jìn)行比較。
她談到 AI 的成果時(shí)說(shuō)道:「你需要對(duì)其進(jìn)行測(cè)試,AI 靠『幻覺(jué)』設(shè)計(jì)的新事物需要經(jīng)過(guò)驗(yàn)證?!?/p>
最近,Anandkumar 博士及其同事利用 AI 的「幻覺(jué)」幫助設(shè)計(jì)了一種全新的導(dǎo)管。
這種導(dǎo)管可以顯著減少細(xì)菌污染 —— 這一全球性問(wèn)題每年導(dǎo)致數(shù)百萬(wàn)例尿路感染。
她表示,團(tuán)隊(duì)的 AI 模型設(shè)計(jì)了數(shù)千種導(dǎo)管幾何形狀,并最終選出其中最有效的一種。
這種新導(dǎo)管的內(nèi)壁上覆蓋著鋸齒狀突起,能夠防止細(xì)菌附著并向上游移動(dòng),從而感染患者的膀胱。Anandkumar 博士提到,該團(tuán)隊(duì)正在討論這種設(shè)備的商業(yè)化。
與其他科學(xué)家一樣,Anandkumar 博士表示她不喜歡「幻覺(jué)」這個(gè)術(shù)語(yǔ)。
她的團(tuán)隊(duì)在關(guān)于新導(dǎo)管的論文中避免使用該詞。
「幻覺(jué)」是概率分布?
Amy McGovern 博士是 AI 研究所的負(fù)責(zé)人,也是俄克拉荷馬大學(xué)氣象學(xué)和計(jì)算機(jī)科學(xué)的教授。
她認(rèn)為 AI 的「幻覺(jué)」或許更適合被稱為「概率分布」—— 這是科學(xué)領(lǐng)域一個(gè)傳統(tǒng)的術(shù)語(yǔ)。
她補(bǔ)充道,天氣研究人員現(xiàn)在經(jīng)常使用 AI 來(lái)創(chuàng)建數(shù)千種細(xì)微的預(yù)測(cè)變化或概率范圍。這些豐富的想象幫助他們發(fā)現(xiàn)了可能引發(fā)極端事件(如致命熱浪)的意外因素。
她認(rèn)為這是一種非常有價(jià)值的工具。
參考資料:
https://www.nytimes.com/2024/12/23/science/ai-hallucinations-science.html#:~:text=The%20A.I.,they%20lead%20to%20major%20discoveries.
本文來(lái)自微信公眾號(hào):新智元(ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。