設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

人工智能顛覆下的科學(xué)與科學(xué)家

2021/12/22 10:42:25 來(lái)源:新浪科技 作者:科學(xué)大家 責(zé)編:瀟公子

作者:王大順 / 艾伯特-拉斯洛?巴拉巴西

“剛才發(fā)生了什么”

2018 年 12 月 2 日,CASP 會(huì)場(chǎng)上彌漫著一種困惑的氣氛。CASP 是結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)價(jià)(Critical Assessment of Structure Prediction)的縮寫,它是一項(xiàng)兩年一度旨在預(yù)測(cè)蛋白質(zhì) 3D 結(jié)構(gòu)的競(jìng)賽。預(yù)測(cè)蛋白質(zhì)的形狀可以讓我們更好地理解它在細(xì)胞中的作用,以及診斷和治療由于蛋白質(zhì)錯(cuò)誤折疊引發(fā)的阿爾茨海默病、帕金森病、亨廷頓病和囊腫性纖維化等疾病。但是,蛋白質(zhì)如何把其很長(zhǎng)的氨基酸鏈折疊為緊致的 3D 形狀依然是生物學(xué)中最重要的未解問(wèn)題之一。

CASP 成立于 1994 年,被稱作蛋白質(zhì)折疊領(lǐng)域的肯塔基德比馬賽。每隔兩年,這個(gè)領(lǐng)域的頂尖研究小組就會(huì)參加這一“賽馬”盛會(huì),比較各自的最佳方法,為整個(gè)領(lǐng)域建立新的基準(zhǔn)。然后,研究人員就回到各自的實(shí)驗(yàn)室,研究他人的方法,改進(jìn)和發(fā)展自己的方法,以期在兩年后賽出好成績(jī)。

在 2018 年的會(huì)議上發(fā)生了兩件非同尋常的事情。首先,正如組織者所言,“計(jì)算方法在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的能力上取得了無(wú)與倫比的進(jìn)步”??陀^來(lái)說(shuō),這場(chǎng)競(jìng)賽取得的進(jìn)步大體相當(dāng)于通常需要兩次競(jìng)賽才能取得的進(jìn)步。其次,這一巨大飛躍并非是由該領(lǐng)域的科學(xué)家完成的。獲勝的團(tuán)隊(duì)對(duì)于大家而言是完全陌生的。

過(guò)去幾年,人工智能在許多領(lǐng)域內(nèi)都系統(tǒng)性地超越了人類專家,2018 年的 CASP 競(jìng)賽結(jié)果只是其中一個(gè)例子。這些進(jìn)展已經(jīng)促成一種共識(shí):正在發(fā)生的人工智能革命將會(huì)改變幾乎每一個(gè)行業(yè),創(chuàng)造巨大的社會(huì)和經(jīng)濟(jì)機(jī)會(huì)以及同樣多的挑戰(zhàn)。整個(gè)社會(huì)都將要面對(duì)人工智能時(shí)代的到來(lái),它們也許會(huì)超越甚至取代人類醫(yī)生、司機(jī)、士兵和銀行業(yè)者。我們需要問(wèn)的是:人工智能將會(huì)如何影響科學(xué)?這些改變對(duì)科學(xué)家又意味著什么?

這波人工智能浪潮有什么不同

當(dāng)前人工智能革命的核心技術(shù)是深度學(xué)習(xí),更為專業(yè)的叫法是深度神經(jīng)網(wǎng)絡(luò)。盡管人工智能專家對(duì)于許多事情都還沒(méi)有形成共識(shí),包括這一領(lǐng)域究竟是應(yīng)該被稱作“人工智能”還是“機(jī)器學(xué)習(xí)”,但是學(xué)術(shù)圈內(nèi)外都意識(shí)到這確實(shí)是“下一個(gè)大事件”。

深度學(xué)習(xí)確實(shí)有效,這一點(diǎn)應(yīng)該說(shuō)已經(jīng)得到了驗(yàn)證。2012 年以來(lái),深度學(xué)習(xí)已經(jīng)在多到讓我們難以記錄的領(lǐng)域內(nèi)擊敗原有的機(jī)器學(xué)習(xí)方法。這些進(jìn)展無(wú)疑已經(jīng)改變了圖像與語(yǔ)音識(shí)別、問(wèn)答系統(tǒng)和機(jī)器翻譯等典型的計(jì)算機(jī)科學(xué)領(lǐng)域。深度神經(jīng)網(wǎng)絡(luò)也在其他更廣泛的領(lǐng)域突破了原有的記錄,這些領(lǐng)域包括藥物活性預(yù)測(cè)、粒子加速器數(shù)據(jù)分析、大腦回路重構(gòu)以及基因突變和表達(dá)的預(yù)測(cè)。

最為重要的是,這并非漸進(jìn)式的改善,而是性能上的跳躍性提升。2012 年,深度學(xué)習(xí)在 ImageNet 挑戰(zhàn)賽首次驚艷亮相,這一賽事是圖像目標(biāo)識(shí)別領(lǐng)域的旗艦性年度競(jìng)賽。與當(dāng)時(shí)最好的其他方法相比,深度學(xué)習(xí)方法的誤差率幾乎減小了一半。此后,深度學(xué)習(xí)算法的性能快速逼近人類水平。在圍棋和日本將旗等策略游戲、強(qiáng)調(diào)合作的多人電子游戲和經(jīng)常要虛張聲勢(shì)的得州撲克游戲等場(chǎng)景中,深度學(xué)習(xí)的表現(xiàn)甚至已經(jīng)超越了人類專家。深度學(xué)習(xí)在 2018 年的 CASP 會(huì)議上的表現(xiàn)為它又贏得了一枚超越人類表現(xiàn)的獎(jiǎng)?wù)拢核陬A(yù)測(cè)蛋白質(zhì)的 3D 結(jié)構(gòu)方面打敗了所有的科學(xué)家。

簡(jiǎn)而言之,人工智能幫助我們發(fā)現(xiàn)數(shù)據(jù)中那些隱含的、不確定的模式和結(jié)構(gòu)。這些模式對(duì)于人類而言是易于發(fā)現(xiàn)的(例如,在一幅圖像中,貓的位置),但是對(duì)于計(jì)算機(jī)而言一直是很困難的。更為精確的表述是,人們通常難以把這類任務(wù)轉(zhuǎn)換為計(jì)算機(jī)任務(wù),而人工智能讓機(jī)器可以用一種奇特的方式自己來(lái)做這種轉(zhuǎn)換。

盡管人工智能浪潮席卷全球,近期的主要進(jìn)展其實(shí)都有賴于一個(gè)方法:監(jiān)督學(xué)習(xí)。該方法要求只給算法提供兩組信息:大量的輸入,也被稱作“訓(xùn)練數(shù)據(jù)”以及為了給輸入分類所用到的清晰的指令(“標(biāo)記”)。例如,如果目標(biāo)是識(shí)別垃圾郵件,那么就給算法提供數(shù)百萬(wàn)的郵件并告知其中每個(gè)郵件是否是垃圾郵件。然后算法就會(huì)仔細(xì)檢查數(shù)據(jù)以確定垃圾郵件的特征。在這一學(xué)習(xí)任務(wù)完成后,如果給算法輸入一封新郵件,算法就會(huì)告訴你該郵件是否看上去是垃圾郵件。

深度學(xué)習(xí)的魔力在于它無(wú)須人工輸入就能找出數(shù)據(jù)的最佳表示方式,這是因?yàn)樗S多中間層,并且其中的每一層都會(huì)根據(jù)標(biāo)記給出數(shù)據(jù)的一種表示和轉(zhuǎn)換方式。只要層數(shù)足夠多,深度神經(jīng)網(wǎng)絡(luò)就有可能很好地揭示隱藏在數(shù)據(jù)中的極為錯(cuò)綜復(fù)雜的結(jié)構(gòu)或模式。更值得注意的是,深度神經(jīng)網(wǎng)絡(luò)完全是靠自己發(fā)現(xiàn)這些模式的。我們可以把深度神經(jīng)網(wǎng)絡(luò)具有不同層想象為它擁有了能夠調(diào)節(jié)數(shù)百萬(wàn)旋鈕的靈活性。只要給系統(tǒng)提供指引清晰且足夠多的數(shù)據(jù),它就能夠自動(dòng)調(diào)節(jié)所有的旋鈕以找出表示數(shù)據(jù)的最佳方式。

當(dāng)前的人工智能與以往有什么不同?畢竟 20 多年前 IBM 的國(guó)際象棋程序深藍(lán)(Deep Blue)就擊敗了當(dāng)時(shí)的世界冠軍卡斯帕羅夫(Garry Kasparov)。過(guò)去的人工智能依賴的是缺乏智能的精細(xì)計(jì)算。深藍(lán)擊敗卡斯帕羅夫是因?yàn)樗棵肟梢怨罍y(cè) 2 億個(gè)位置,從而預(yù)判哪一步最有可能獲勝。這種人工智能在面對(duì)圍棋和蛋白質(zhì)折疊這類更為復(fù)雜的游戲時(shí)就無(wú)能為力了,因?yàn)樗鼰o(wú)法處理所有的可能性。

然而,深度學(xué)習(xí)卻在這些領(lǐng)域取得了巨大的成功。2016 年,DeepMind 研究團(tuán)隊(duì)設(shè)計(jì)的 AlphaGo 在 5 輪比賽中擊敗了圍棋世界冠軍李世石。它取得勝利并非靠評(píng)估每一種可能的走法,而是靠研究人類棋手完成的棋局以學(xué)習(xí)何種走法有可能獲勝或失敗。

但是,既然機(jī)器系統(tǒng)已經(jīng)能夠向自身學(xué)習(xí),那么為什么還要向人類學(xué)習(xí)呢? 這也正是深度學(xué)習(xí)真正有趣的地方。僅僅在 AlphaGo 戰(zhàn)勝人類棋手一年之后,DeepMind 就研發(fā)出了 AlphaZero,其厲害之處在于它只知道圍棋規(guī)則而沒(méi)有任何先驗(yàn)知識(shí)和數(shù)據(jù)輸入。換句話說(shuō),它是真正從零開(kāi)始,通過(guò)不停地與自己對(duì)弈而自學(xué)成才。AlphaZero 既是圍棋大師,也是國(guó)際象棋和日本將棋大師,它擊敗了所有的人類棋手和計(jì)算機(jī)程序。

最為重要的是,由于 AlphaZero 沒(méi)有學(xué)習(xí)人類棋手的對(duì)局,它的下法也與人類棋手不同。它更像一個(gè)外星人,展示了一種人類大師以前從未見(jiàn)過(guò)的直覺(jué)和見(jiàn)解。圍棋世界冠軍柯潔甚至感嘆人工智能就像“上帝”一樣在下棋。確實(shí),它的那些復(fù)雜而又優(yōu)美的下法都沒(méi)有依靠人類知識(shí)。而且 AlphaZero 是以超人類的速度習(xí)得這一技藝的:只需 4 小時(shí)的國(guó)際象棋訓(xùn)練和 8 小時(shí)的圍棋訓(xùn)練,它的能力就能超過(guò)已有的最好程序。

再想想那些數(shù)字。我們把變化最多也是研究最多的人類游戲的規(guī)則告知人工智能算法,算法自己只是基于規(guī)則和棋盤就學(xué)會(huì)了下棋的策略。像所有的初學(xué)者一樣,它在一開(kāi)始也會(huì)犯各種愚蠢的錯(cuò)誤。但是當(dāng)你回過(guò)神來(lái)再去看的時(shí)候,它已經(jīng)是史上最佳棋手了。

如果深度學(xué)習(xí)能夠在人類自己的棋盤游戲上擊敗人類,對(duì)于復(fù)雜問(wèn)題找到先前想象不到的答案,那么它將會(huì)如何影響致力于促進(jìn)創(chuàng)新的科學(xué)呢?

更智能的人工智能,更多的創(chuàng)造性創(chuàng)新

人工智能可通過(guò)兩種主要的途徑影響我們從事科學(xué)的方式。一種方式類似于谷歌對(duì)互聯(lián)網(wǎng)的影響:人工智能將會(huì)極大地改進(jìn)信息的獲取,優(yōu)化科學(xué)的各個(gè)方面,包括從信息獲取到科學(xué)家目前所從事的許多過(guò)程的自動(dòng)化。這是一種理想的情形,因?yàn)榇蠖鄶?shù)科學(xué)家都期望能夠?qū)崿F(xiàn)日常工作的自動(dòng)化,從而可以聚焦于創(chuàng)造性的活動(dòng)。另一種途徑更像 AlphaGo 對(duì)圍棋的影響:人工智能系統(tǒng)能夠?qū)τ趶?fù)雜問(wèn)題快速給出創(chuàng)造性的答案。人工智能也許有一天會(huì)在反烏托邦式的世界里取代我們這些科學(xué)家,以一種我們今天難以想象的速度和精度推動(dòng)科學(xué)進(jìn)步。

組織信息

人工智能已經(jīng)推動(dòng)了現(xiàn)代社會(huì)的許多方面。每次你在谷歌搜索中輸入一個(gè)搜索查詢,人工智能就會(huì)在萬(wàn)維網(wǎng)上查找并猜測(cè)你的真實(shí)需求。當(dāng)你打開(kāi)臉書(shū)應(yīng)用的時(shí)候,人工智能會(huì)決定把哪個(gè)朋友的更新首先呈現(xiàn)給你。當(dāng)你在亞馬遜上購(gòu)物時(shí),人工智能會(huì)給你推薦一些你可能會(huì)喜歡的商品,盡管這些商品在你的購(gòu)物車中從未出現(xiàn)過(guò)。我們周邊的設(shè)備中也出現(xiàn)越來(lái)越多的人工智能。當(dāng)你拿著智能手機(jī)拍照時(shí),人工智能會(huì)自動(dòng)圈住面部并調(diào)整焦距以獲得最佳效果。當(dāng)你對(duì) Siri、Alexa 和 Cortana 這樣的“個(gè)人助理”說(shuō)話時(shí),需要人工智能把你說(shuō)的話轉(zhuǎn)換為文字。

科學(xué)的哪些方面能夠由這類人工智能加以擴(kuò)展?首先,我們應(yīng)該都清楚,現(xiàn)在發(fā)表的文獻(xiàn)的數(shù)量已經(jīng)多到無(wú)法全部追蹤。人工智能能否給出個(gè)性化的論文閱讀推薦?人工智能能否連貫地總結(jié)這些文章的內(nèi)容摘要,提取與我們相關(guān)的關(guān)鍵發(fā)現(xiàn),生成該領(lǐng)域關(guān)鍵進(jìn)展的快報(bào)風(fēng)格的文摘?人工智能這些新的能力將幫助研究人員擴(kuò)展他們獲得知識(shí)的深度和質(zhì)量,并幫助他們發(fā)現(xiàn)新的研究可能性。

對(duì)于科學(xué)領(lǐng)域的決策者而言,人工智能能夠提供更為全面的“天際線掃描”能力,提出戰(zhàn)略投資的領(lǐng)域,識(shí)別出有可能帶來(lái)科學(xué)變革的想法,甚至組建變革性的科研團(tuán)隊(duì)。出版商也可以使用深度學(xué)習(xí)找到論文的審稿人,或者自動(dòng)識(shí)別論文中的錯(cuò)誤和矛盾,從而減少人工評(píng)審的負(fù)擔(dān)。

其中的一些應(yīng)用看上去遙不可及,特別是如果我們想要達(dá)到科學(xué)家和決策者所期望的精度和可靠性的話。但是,真實(shí)情況是,盡管技術(shù)已經(jīng)在過(guò)去 20 年極大地重塑了人類社會(huì),但可以促進(jìn)科學(xué)過(guò)程的技術(shù)卻未有實(shí)質(zhì)性進(jìn)展。如果你對(duì)此表示懷疑的話,你可以看看“美國(guó)國(guó)家自然科學(xué)基金會(huì)”的項(xiàng)目提交頁(yè)面,或者是 ScholarOne 論文投審稿系統(tǒng),它們看上去還像是當(dāng)初互聯(lián)網(wǎng)發(fā)展初期的那些早已過(guò)時(shí)的網(wǎng)站。

求解科學(xué)問(wèn)題

人工智能有一天能否幫助我們提出和求解基本的科學(xué)問(wèn)題?通過(guò)以單個(gè)科學(xué)家根本無(wú)法實(shí)現(xiàn)的方式整合各種信息,人工智能系統(tǒng)能否幫助科學(xué)家更快地得到更具創(chuàng)造性的、更好的解答?它是否也能提出新的假設(shè),甚至新的研究領(lǐng)域?

我們已經(jīng)在這方面看到了一些令人鼓舞的早期進(jìn)展。例如,研究人員已經(jīng)把深度學(xué)習(xí)用于醫(yī)學(xué)診斷,開(kāi)發(fā)出各種視網(wǎng)膜病變的分類算法,其精度已經(jīng)與人類專家相當(dāng)。另一個(gè)例子是,一個(gè)經(jīng)過(guò)訓(xùn)練的人工智能算法對(duì)良性和惡性皮膚病的分類精度,已經(jīng)達(dá)到經(jīng)專業(yè)認(rèn)證的皮膚病醫(yī)生的水準(zhǔn)。在急診室里,深度學(xué)習(xí)現(xiàn)在可以幫助我們判定一個(gè)病人的 CT 掃描是否顯示他有中風(fēng)的跡象。新的人工智能算法不僅使識(shí)別這些信號(hào)的精度可以媲美醫(yī)學(xué)專家,更為重要的是,它的速度是人類的 150 倍!

當(dāng)然,還有讓 CASP 與會(huì)人員充滿敬畏的 AlphaFold 深度學(xué)習(xí)系統(tǒng)。在 CASP 競(jìng)賽中,每個(gè)參賽隊(duì)伍拿到的是 90 個(gè)蛋白質(zhì)的氨基酸的線性序列,這些蛋白質(zhì)的 3D 形狀已知但是沒(méi)有公開(kāi)發(fā)表。參賽隊(duì)伍要計(jì)算出蛋白質(zhì)是如何折疊的。通過(guò)篩選過(guò)去已知的蛋白質(zhì)折疊模式,AlphaFold 的平均預(yù)測(cè)精度超過(guò)了所有其他 97 支參賽隊(duì)伍。

這些人工智能技術(shù)的成功運(yùn)用都具備了深度學(xué)習(xí)的兩個(gè)基本要素:大量的訓(xùn)練數(shù)據(jù)和清晰的分類方式。例如,為了檢測(cè)皮膚癌,研究人員給算法輸入數(shù)百萬(wàn)的皮膚病變的圖像,并告知算法每一幅圖像對(duì)應(yīng)的是良性還是惡性病變。由于算法與皮膚病專家所受的訓(xùn)練是不一樣的,算法也許看不到皮膚病專家所看到的一些模式,但這也意味著,人工智能系統(tǒng)也可能看到一些皮膚病專家所看不到的模式。

哪些科學(xué)領(lǐng)域能從這些進(jìn)展中收益最多呢?我們還是再看看深度學(xué)習(xí)的兩個(gè)基本要素:大量的數(shù)據(jù)以及可用于標(biāo)記數(shù)據(jù)的清晰邊界。這意味著那些最能從人工智能技術(shù)直接受益的科學(xué)領(lǐng)域需要足夠的窄,從而能夠有清晰的數(shù)據(jù)標(biāo)記策略。這些領(lǐng)域還要足夠的深,使得人工智能系統(tǒng)以科學(xué)家無(wú)法做到的方式看到所有的數(shù)據(jù)以發(fā)現(xiàn)新的結(jié)果。

最為重要的是,盡管機(jī)器正在快速改進(jìn)精度和效率,但科學(xué)最為激動(dòng)人心的未來(lái)既不屬于人類也不屬于機(jī)器,而是有賴于兩者之間的戰(zhàn)略伙伴關(guān)系。

人工智能與人類智能

我們?cè)賮?lái)看一下 AlphaFold。通過(guò)采用新技術(shù),科學(xué)家在沒(méi)有專門知識(shí)和專業(yè)領(lǐng)域訓(xùn)練的情況下,就能夠超越該領(lǐng)域基于傳統(tǒng)技術(shù)的所有專家。這個(gè)例子提出了一個(gè)重要的問(wèn)題:如果把最新的技術(shù)與研究人員的專業(yè)技能結(jié)合起來(lái)會(huì)如何?

未來(lái)科學(xué)學(xué)研究的一個(gè)關(guān)鍵領(lǐng)域就涉及人工智能的集成,從而使得機(jī)器和人腦能夠協(xié)同工作。我們期盼人工智能能夠以一種人類合作者無(wú)法達(dá)到的能力擴(kuò)展科學(xué)家的認(rèn)知,而這將會(huì)給科學(xué)帶來(lái)深遠(yuǎn)的影響。

我們想到了一個(gè)近期的例子。為了應(yīng)對(duì)科學(xué)目前所面對(duì)的“可重復(fù)性危機(jī)”的挑戰(zhàn),研究人員使用深度學(xué)習(xí)來(lái)揭示科學(xué)論文表述中,表征強(qiáng)科學(xué)發(fā)現(xiàn)和弱科學(xué)發(fā)現(xiàn)的模式。2015 年,“可重復(fù)性項(xiàng)目:心理學(xué)”(RPP)分析了頂尖心理學(xué)期刊上的 100 篇論文,使用與論文原始研究一樣的方法人工檢測(cè)了其可重復(fù)性,結(jié)果發(fā)現(xiàn)其中有 61 篇未能通過(guò)可重復(fù)性檢測(cè)。此后,在心理學(xué)、經(jīng)濟(jì)學(xué)、金融學(xué)和醫(yī)學(xué)等領(lǐng)域的研究也得到了類似的結(jié)果。

為此,研究人員把人工智能與人類智能相結(jié)合以估算可重復(fù)性。研究人員使用經(jīng)過(guò)嚴(yán)格的人工可重復(fù)性檢測(cè)的 96 項(xiàng)研究,用它們來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)去估測(cè)一篇論文的可重復(fù)性的概率,并使用 249 項(xiàng)其他研究來(lái)檢測(cè)訓(xùn)練后的模型的泛化能力。結(jié)果是激動(dòng)人心的:該模型的平均曲線下面積(AUC)達(dá)到 0.72,表明其預(yù)測(cè)精度顯著高于完全隨機(jī)的推斷。為了把這一結(jié)果與專業(yè)評(píng)審人所提供的預(yù)測(cè)信息進(jìn)行比較,研究人員用同樣的數(shù)據(jù)和訓(xùn)練過(guò)程來(lái)訓(xùn)練一個(gè)新的人工智能模型,但是只使用評(píng)審人的評(píng)價(jià)指標(biāo),發(fā)現(xiàn)這一基于評(píng)審人指標(biāo)的模型的 AUC 只有 0.68,表明其預(yù)測(cè)精度顯著低于基于內(nèi)容表述的模型。這些研究表明人工智能依賴于專業(yè)評(píng)審人未掌握的特征信息。事實(shí)上,盡管人們通?;谡撐闹械慕y(tǒng)計(jì)報(bào)告評(píng)價(jià)其價(jià)值,人工智能則更為精確地表明,論文中的表述文本事實(shí)上具有更多人們以前沒(méi)有挖掘的解釋能力。極為重要的是,把從表述模型和評(píng)審人指標(biāo)模型所得到的信息相結(jié)合,也就是說(shuō),把機(jī)器和人類見(jiàn)解相結(jié)合,就可以得到具有最高精度的新的人工智能模型(AUC=0.74)。

對(duì)模型預(yù)測(cè)能力背后的機(jī)制進(jìn)行分析,我們發(fā)現(xiàn)那些顯而易見(jiàn)的因素,諸如單詞或短語(yǔ)的出現(xiàn)頻率、寫作風(fēng)格、學(xué)科、期刊、作者身份或主題等,并不能解釋結(jié)果。而人工智能系統(tǒng)是基于復(fù)雜的語(yǔ)義關(guān)系網(wǎng)絡(luò)來(lái)預(yù)測(cè)可重復(fù)性的。盡管科學(xué)論文中的文字要比其匯報(bào)的統(tǒng)計(jì)信息多出幾個(gè)數(shù)量級(jí),論文的文本在科學(xué)學(xué)研究中至今還幾乎沒(méi)有被發(fā)掘。算法現(xiàn)在可以利用論文的全文來(lái)檢測(cè)人類專家可能忽視的一些新模式以及證據(jù)不那么強(qiáng)的科學(xué)發(fā)現(xiàn)。

這個(gè)例子凸顯了一種新型的,并且也許是可怕的人機(jī)伙伴關(guān)系。盡管機(jī)器比人更善于閱讀并消化更多的信息,當(dāng)前的人工智能應(yīng)用還是屬于“弱人工智能”,它們只能處理特定的問(wèn)題。從這點(diǎn)來(lái)看,目前的人工智能系統(tǒng)很像洗衣機(jī)。它們可以洗滌你扔進(jìn)去的任何衣服,卻完全不知如何清洗碗碟。你需要用洗碗機(jī)完成后一任務(wù)。類似的,我們能夠建造特別擅長(zhǎng)預(yù)測(cè)蛋白質(zhì)折疊的人工智能系統(tǒng),但該系統(tǒng)卻不能做任何別的事情。相反地,人類具有學(xué)習(xí)、推理以及機(jī)器沒(méi)有的創(chuàng)造性思維能力。

諾貝爾物理學(xué)獎(jiǎng)得主弗蘭克?維爾澤克(Frank Wilczek)有一個(gè)著名的預(yù)測(cè),100 年后最好的物理學(xué)家將會(huì)是機(jī)器。類似于 AlphaFold 這樣的進(jìn)展給這一預(yù)測(cè)帶來(lái)一絲曙光。但是這一預(yù)測(cè)也過(guò)于簡(jiǎn)化了:科學(xué)不僅只是求解明確定義的問(wèn)題。最令人尊敬的科學(xué)家往往是那些提出新問(wèn)題和開(kāi)辟新的研究領(lǐng)域的人,那些意識(shí)到工具和知識(shí)的累積已經(jīng)足以使突破性的發(fā)現(xiàn)應(yīng)運(yùn)而生的人。這讓大眾意識(shí)到進(jìn)入這些新領(lǐng)域并迎接所帶來(lái)的挑戰(zhàn)的時(shí)機(jī)已經(jīng)成熟。因此,科學(xué)不僅是關(guān)于問(wèn)題求解,它也是關(guān)于直覺(jué)、發(fā)現(xiàn)新前沿的能力,前往前沿的勇氣以及領(lǐng)導(dǎo)力。

人工智能在求解人類提出的問(wèn)題方面已經(jīng)取得巨大進(jìn)展。它甚至還有可能在現(xiàn)有知識(shí)和范式的框架內(nèi)形成新的假說(shuō)。人工智能有一天是否會(huì)發(fā)展到這種地步:它感受到了創(chuàng)造一個(gè)新理論的必要,比如進(jìn)化論或量子力學(xué),然后孜孜不倦地為之奮斗?目前而言,還看不出人工智能具有這種能力,許多人工智能專家甚至懷疑人工智能是否存在這種可能。因此,我們現(xiàn)在還難以宣稱機(jī)器會(huì)在未來(lái)掌握科學(xué)的主導(dǎo)權(quán)。未來(lái)最為激動(dòng)人心的發(fā)現(xiàn)需要人機(jī)之間的戰(zhàn)略合作。的確,如果我們基于各自的能力分配任務(wù),科學(xué)家與機(jī)器的協(xié)同工作有可能極大推動(dòng)科學(xué)進(jìn)步,減少人類的盲點(diǎn),并在此過(guò)程中革新科學(xué)的實(shí)踐。

但是,我們需要意識(shí)到,當(dāng)前人工智能的一個(gè)主要缺陷在于它是個(gè)黑箱。它確實(shí)表現(xiàn)很好,但是沒(méi)有人知道原因 —— 這可能是一個(gè)大問(wèn)題,特別是在科學(xué)中??紤]一下亞馬遜采用人工智能挑選雇員這個(gè)案例。亞馬遜從 2014 年開(kāi)始采用計(jì)算機(jī)算法來(lái)評(píng)審應(yīng)聘者的簡(jiǎn)歷。這一實(shí)驗(yàn)性的人工智能工具用 1 星到 5 星給應(yīng)聘者打分,很像消費(fèi)者給亞馬遜上的商品做星級(jí)評(píng)價(jià)。乍看起來(lái),這像是人力資源部門的福音。你給它 100 份簡(jiǎn)歷,它立刻告訴你排在前 5 位的應(yīng)聘者。但是,公司很快就意識(shí)到這個(gè)新算法對(duì)女性應(yīng)聘者的歧視。這個(gè)算法是用公司 10 年間所收到的簡(jiǎn)歷來(lái)訓(xùn)練的,而那些簡(jiǎn)歷絕大部分來(lái)自男性。因此,算法很快就學(xué)習(xí)到要向男性應(yīng)聘者傾斜,而對(duì)包含“女性”一詞的簡(jiǎn)歷扣分,并降低了兩所女子學(xué)院畢業(yè)生的等級(jí)。

這一案例并非意味著人工智能不能正確處理事情,畢竟,人工智能系統(tǒng)嚴(yán)格執(zhí)行了它受訓(xùn)來(lái)完成的工作。我們讓它查看數(shù)百萬(wàn)份以前的簡(jiǎn)歷,其中包括了拒掉的和錄用的人,并使用這一信息以發(fā)現(xiàn)未來(lái)的雇員。亞馬遜的失敗其實(shí)表明,隨著我們的工具的精度和復(fù)雜性的增加,它們會(huì)放大并進(jìn)一步固化人類已有的偏差。這意味著隨著科學(xué)學(xué)的進(jìn)展,人們需要更好地理解我們所建立的工具和計(jì)量指標(biāo)中的偏差以及因果關(guān)系。

—— 本文節(jié)選自《給科學(xué)家的科學(xué)思維》,王大順 / 艾伯特-拉斯洛?巴拉巴西 著;2021 年 12 月,湛廬文化出品

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,科學(xué)

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知