平日,世界看起來(lái)像一條管理良好的鐵路:事情是按照我們?nèi)祟?lèi)所理解并能具體應(yīng)用的法則運(yùn)行。我們能接受偶爾的晚點(diǎn),它們代表了這些法則的例外。但有時(shí)我們會(huì)把這個(gè)世界所經(jīng)歷的事看作是公路上的多車(chē)相撞。這種情況下雖然也遵循與平日相同的物理規(guī)律或社會(huì)法則,但是變化的單元過(guò)多,我們無(wú)法預(yù)測(cè)或解釋每一次碰撞的細(xì)節(jié) —— 這些細(xì)節(jié)可以讓一輛車(chē)只受到輕微損傷,而另一輛車(chē)則爆炸變成火球。
一場(chǎng)車(chē)禍中所表現(xiàn)出的特點(diǎn),也同樣適用于平凡秋日里在鋪滿(mǎn)落葉的小路上散步。它們都是這樣的事件,其中無(wú)數(shù)細(xì)節(jié)之間的相互依存關(guān)系優(yōu)于決定它們的規(guī)則的解釋能力。我們能做的似乎只是在一種結(jié)果出現(xiàn)后為之憤懣或驚嘆?,F(xiàn)在,我們最新的范式技術(shù) —— 機(jī)器學(xué)習(xí),可能會(huì)揭示出日常世界更多由偶然性而非規(guī)則支配。如果是這樣,那是因?yàn)闄C(jī)器學(xué)習(xí)可以跳出人類(lèi)認(rèn)知的模式,而總結(jié)出我們所無(wú)法理解或者應(yīng)用的規(guī)律。
機(jī)器學(xué)習(xí)系統(tǒng)的不透明性引起了人們對(duì)它們的可信度和偏見(jiàn)傾向的嚴(yán)重?fù)?dān)憂(yōu)。但是它們確實(shí)能夠工作的事實(shí),可能會(huì)讓我們對(duì)世界是什么以及我們?cè)谄渲邪缪菔裁唇巧辛巳碌睦斫?。機(jī)器學(xué)習(xí)與傳統(tǒng)編程有著根本不同的工作方式。事實(shí)上,傳統(tǒng)編程是我們基于規(guī)則去理解世界的集大成者。舉個(gè)機(jī)器學(xué)習(xí)中最具代表性的例子:如果要編寫(xiě)識(shí)別手寫(xiě)數(shù)字的軟件,程序員在傳統(tǒng)方式上會(huì)告訴計(jì)算機(jī),“1”是由一條豎直的線(xiàn)組成的,“8”是由一個(gè)較大的圓圈和位于其上方的一個(gè)較小的圓圈組成的,等等。這種方法可能會(huì)有很好的效果,但它對(duì)手寫(xiě)數(shù)字的柏拉圖式理想的依賴(lài),意味著該程序?qū)?huì)誤判相當(dāng)比例的手寫(xiě)數(shù)字。因?yàn)閷?shí)際的數(shù)字出自凡人之手,不可能如此“完美”。
機(jī)器學(xué)習(xí)模型則懂得從樣例中學(xué)習(xí)。為了創(chuàng)建一個(gè)能夠識(shí)別手寫(xiě)數(shù)字的機(jī)器學(xué)習(xí)模型,開(kāi)發(fā)者們不會(huì)告訴計(jì)算機(jī)任何我們?nèi)祟?lèi)對(duì)數(shù)字形狀的了解。相反,開(kāi)發(fā)者們給它提供了數(shù)千個(gè)手寫(xiě)數(shù)字的樣例圖像,每個(gè)數(shù)字都不同,并且被正確地標(biāo)記為所代表的數(shù)字。系統(tǒng)通過(guò)算法去發(fā)現(xiàn)具有相同標(biāo)簽圖像的像素之間的統(tǒng)計(jì)關(guān)系。在某種垂直線(xiàn)上的一系列像素將增加圖像為“1”的統(tǒng)計(jì)權(quán)重,降低它為“3”的概率,以此類(lèi)推。
不可知,卻有效
在現(xiàn)實(shí)生活中的機(jī)器學(xué)習(xí)應(yīng)用中,可能的答案數(shù)量要數(shù)以?xún)|計(jì),需要考慮的數(shù)據(jù)量非常龐大,數(shù)據(jù)點(diǎn)之間的相關(guān)性非常復(fù)雜,以至于我們?nèi)祟?lèi)通常無(wú)法理解。例如,人類(lèi)的新陳代謝是一系列極其復(fù)雜的相互作用和相互依存的效應(yīng)。于是,人們創(chuàng)建了一個(gè)能夠預(yù)測(cè)人體系統(tǒng)對(duì)復(fù)雜因素反應(yīng)的機(jī)器學(xué)習(xí)系統(tǒng),稱(chēng)之為 DeepMetab。它成為醫(yī)生、研究人員、非專(zhuān)業(yè)人士和疑病癥患者提出關(guān)于人體器官的問(wèn)題、探索相關(guān)想法的地方。盡管我們無(wú)法理解它如何產(chǎn)生輸出結(jié)果,DeepMetab 仍然成為有關(guān)人體知識(shí)的最重要的來(lái)源。
隨著我們?cè)絹?lái)越依賴(lài)于像 DeepMetab 這樣我們無(wú)法理解的機(jī)器學(xué)習(xí)模型(MLMs),我們可能會(huì)逐步接受下面兩種觀(guān)點(diǎn):第一種觀(guān)點(diǎn)表示,為了獲得由機(jī)器學(xué)習(xí)模型生成的有用的概率輸出,我們必須經(jīng)常容忍無(wú)法解釋這一缺點(diǎn)。第二種觀(guān)點(diǎn)認(rèn)為,難以解釋并不是一種缺點(diǎn),而是一種真實(shí)情況。機(jī)器學(xué)習(xí)模型之所以有效,是因?yàn)樗鼈儽任覀兏瞄L(zhǎng)閱讀世界:它們通過(guò)統(tǒng)計(jì)相互關(guān)聯(lián)的海量數(shù)據(jù)而產(chǎn)生超越人類(lèi)等的認(rèn)知,無(wú)需向人類(lèi)解釋自己如何得到這樣的認(rèn)知。每當(dāng)一個(gè)公民或監(jiān)管者因無(wú)法理解機(jī)器學(xué)習(xí)的工作原理而發(fā)出絕望呼聲時(shí),我們都能感受到這些模型確實(shí)有效。
如果機(jī)器學(xué)習(xí)模型的工作原理是放棄用可以被理解的規(guī)則來(lái)簡(jiǎn)化并解釋復(fù)雜性,那么在“它有效!”的呼聲中,我們可以感受到所有微小事物在它們的相互依存中彼此互動(dòng)。而這些微小事物才是真正的本質(zhì),它們?cè)诤椭C規(guī)律的宇宙音中發(fā)出嘎嘎聲。我們技術(shù)的成功正在告訴我們,世界就是一個(gè)真正的黑匣子。
從手表到汽車(chē),從相機(jī)到恒溫器,機(jī)器學(xué)習(xí)已經(jīng)深深嵌入了我們的日常生活。它被用來(lái)推薦視頻、嘗試識(shí)別仇恨言論、引導(dǎo)車(chē)輛的行駛、控制疾病的傳播,并對(duì)緩解氣候危機(jī)至關(guān)重要。它并不完美,可能會(huì)放大社會(huì)偏見(jiàn),但我們?nèi)匀焕^續(xù)使用它,因?yàn)樗行АC(jī)器學(xué)習(xí)在不對(duì)特定事物應(yīng)用規(guī)則的情況下完成所有這些工作是令人驚訝甚至不安的。我們太過(guò)于偏愛(ài)規(guī)則而非個(gè)例,以至于我們認(rèn)為讓一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)在不知曉規(guī)則的情況下單純通過(guò)分析大量棋局和走法而玩圍棋是瘋狂的。但這就是機(jī)器學(xué)習(xí)成為史上最優(yōu)秀的圍棋選手的方式。實(shí)際上,當(dāng)開(kāi)發(fā)者為系統(tǒng)提供與一個(gè)領(lǐng)域相關(guān)的數(shù)據(jù)時(shí),他們通常會(huì)故意向它隱瞞我們已經(jīng)了解的數(shù)據(jù)之間的相互關(guān)系。
過(guò)于具體的概括?
現(xiàn)在,即使是稍微了解機(jī)器學(xué)習(xí)的人,也會(huì)感到毛骨悚然,因?yàn)闄C(jī)器學(xué)習(xí)模型是通過(guò)從數(shù)據(jù)中進(jìn)行泛化而創(chuàng)建的。例如,如果一個(gè)手寫(xiě)數(shù)字識(shí)別的機(jī)器學(xué)習(xí)模型沒(méi)有從它所學(xué)習(xí)的樣本中進(jìn)行泛化,就會(huì)因過(guò)度擬合而成為失敗的模型。但是,機(jī)器學(xué)習(xí)模型的泛化描述不同于我們用于解釋特定情況的傳統(tǒng)概括。我們喜歡傳統(tǒng)的概括,因?yàn)?(a) 我們可以理解它們;(b) 它們經(jīng)常能夠?qū)С鲅堇[結(jié)論;(c) 我們可以將它們應(yīng)用于具體情況。但是,(a) 機(jī)器學(xué)習(xí)模型的泛化描述并不總是易于理解;(b) 它們是統(tǒng)計(jì)的、概率上的且主要是歸納的;(c) 除非運(yùn)行相應(yīng)的機(jī)器學(xué)習(xí)模型,我們通常無(wú)法應(yīng)用這些描述。
此外,多層次機(jī)器學(xué)習(xí)模型的泛化描述可能會(huì)非常具體:例如,視網(wǎng)膜掃描中的血管模式可能預(yù)示關(guān)節(jié)炎的發(fā)作,但前提是滿(mǎn)足 50 個(gè)數(shù)值指標(biāo),而這 50 個(gè)指標(biāo)又可能是相互關(guān)聯(lián)影響的。這就像你想知道一輛汽車(chē)在多車(chē)相撞中是如何避免嚴(yán)重?fù)p壞的一樣:車(chē)輛必然要克服很多具體條件,但是這種事件不能歸納為一個(gè)可理解的規(guī)則,這種復(fù)雜規(guī)則也無(wú)法遷移而應(yīng)用于其他事件?;蛘?,這就像在一場(chǎng)謀殺案中的線(xiàn)索,雖然能指示兇手,但只對(duì)這一場(chǎng)案件有效。
機(jī)器學(xué)習(xí)模型并不會(huì)否認(rèn)規(guī)則或者定律的存在。它只是強(qiáng)調(diào)僅有這些規(guī)則不足以理解我們這個(gè)復(fù)雜的宇宙中發(fā)生的一切。偶然的細(xì)節(jié)相互影響,使規(guī)則的解釋能力變得不足,即使假設(shè)我們可以知道世間所有的規(guī)則。例如,如果你知道引力和空氣阻力的法則,以及硬幣和地球的質(zhì)量,并且你知道硬幣從多高的高度掉落,你就可以計(jì)算出硬幣落地需要多長(zhǎng)時(shí)間。這通常已足以滿(mǎn)足你的實(shí)用目的。但傳統(tǒng)的西方科學(xué)框架過(guò)分強(qiáng)調(diào)了規(guī)則。要完全應(yīng)用這些規(guī)則,我們必須知道每一個(gè)影響落下的因素,包括哪些鴿子會(huì)擾動(dòng)硬幣周?chē)臍饬饕约斑h(yuǎn)處星體對(duì)它的萬(wàn)有引力同時(shí)施加的影響。(你記得加上遙遠(yuǎn)的彗星的影響了嗎?)要完全準(zhǔn)確地應(yīng)用這些定律,我們必須擁有像拉普拉斯妖那樣的全面而不可及的宇宙知識(shí)。
這并不是對(duì)追求科學(xué)定律或?qū)嵺`科學(xué)的批評(píng)??茖W(xué)通常是以經(jīng)驗(yàn)為基礎(chǔ)的,并且足以滿(mǎn)足我們的需求 —— 雖然實(shí)際可實(shí)現(xiàn)的精度會(huì)讓我們做出一定讓步。但這應(yīng)該讓我們想到:為什么西方世界把難以解釋的混沌現(xiàn)象視為純粹的表象,認(rèn)為其下有可以解釋這種現(xiàn)象的法則呢?為什么我們本體論上更喜歡永恒不變的東西而不是不斷流轉(zhuǎn)的水或塵土呢?
改寫(xiě)對(duì)知識(shí)的定義
這些是西方哲學(xué)歷史上常見(jiàn)的話(huà)題,遠(yuǎn)超出了本文的范圍。但不可否認(rèn),我們被永恒法則所簡(jiǎn)化的世界所吸引,因此我們能夠理解世界,從而預(yù)測(cè)和控制它。同時(shí),這些簡(jiǎn)單而美妙的法則向我們隱藏了特定情況的混亂,這些混亂不僅由法則本身決定,而且還受到每個(gè)其他特定情況的狀態(tài)的影響。但是現(xiàn)在,我們有了一種預(yù)測(cè)和控制技術(shù),它直接源自整體同時(shí)存在并相互影響的諸多微小因素。這種技術(shù)給我們帶來(lái)了更強(qiáng)的控制力,但并沒(méi)有增進(jìn)我們的理解力。它的成功使我們關(guān)注那些超出我們理解的事物。
同時(shí),出于同樣的原因,機(jī)器學(xué)習(xí)可能會(huì)打破將確定性作為知識(shí)的標(biāo)志的迷戀,因?yàn)闄C(jī)器學(xué)習(xí)的結(jié)果是概率。事實(shí)上,從機(jī)器學(xué)習(xí)模型得出完全確定的結(jié)果會(huì)引起人們對(duì)該模型的懷疑。機(jī)器學(xué)習(xí)的輸出的概率具有內(nèi)稟的不準(zhǔn)確性;對(duì)于概率的真正陳述是能夠正確預(yù)測(cè)其錯(cuò)誤幾率。
現(xiàn)在,我們擁有了一種震撼我們的機(jī)制,一些從不可理解、精妙的網(wǎng)絡(luò)中相互連接的諸多細(xì)節(jié)中汲取信息而運(yùn)作的模型。也許,我們無(wú)需將那些混沌的漩渦視為僅僅是還未了解透徹的表象。也許,所有因素之間相互影響的復(fù)雜性與認(rèn)知難度將撼動(dòng)西方科學(xué)的認(rèn)知基礎(chǔ),即最真實(shí)的是最固定、最普遍和最可知的。
也許,我們終將接受簡(jiǎn)單事件難以想象的復(fù)雜關(guān)聯(lián)、各種意外與巧合才是世界的真實(shí)面貌。我們亦會(huì)接受 1.4 公斤重的大腦不足以建立對(duì)于世界完備的認(rèn)知。世界殘酷的不可知性正在模糊我們理解的邊界。如果這正在發(fā)生,那是因?yàn)槲覀兺ㄟ^(guò)諸如機(jī)器學(xué)習(xí)模型聽(tīng)到了更多特殊的、微小的、喧囂的信號(hào)。這些信號(hào)正在產(chǎn)生基于難以理解的萬(wàn)物之間聯(lián)系的有用的、驚人的、概率性的知識(shí)。
作者:David Weinberger
翻譯:云開(kāi)葉落
審校:圓周 π 小姐
原文鏈接:Learn from machine learning
本文來(lái)自微信公眾號(hào):中科院物理所 (ID:cas-iop),作者:David Weinberger
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。