科學(xué)家通過對神經(jīng)網(wǎng)絡(luò)的研究發(fā)現(xiàn),大腦是一臺名副其實的“預(yù)測機器”。這樣的工作方式使它們能節(jié)省許多能量。
▲ 當(dāng)看到一個模糊的圖像時,我們會依賴背景來獲得感知信息。一些神經(jīng)科學(xué)家認為,這證明了大腦能通過對預(yù)期事件的預(yù)測,自上而下地將感知信息組合起來
我們的大腦包裹在硬質(zhì)的顱骨中,是一團重約 1.4 至 1.5 千克組織。長期以來,關(guān)于大腦如何通過感覺來獲得感知的問題,一直令科學(xué)家感到困惑。大量的證據(jù)和數(shù)十年的持續(xù)研究表明,大腦并不能像玩拼圖游戲那樣,將感官信息簡單地組合起來,以此感知周圍的環(huán)境。我們可以通過一個事實來證明這一點,大腦可以根據(jù)進入眼睛的光線信息構(gòu)建出一個場景,即使這些信息既嘈雜且模糊。
因此,許多神經(jīng)科學(xué)家轉(zhuǎn)而將大腦視為一臺“預(yù)測機器”。通過預(yù)測性的處理過程,大腦利用其對世界的先驗知識,對輸入的感官信息做出原因推斷或假設(shè)。正是這些假設(shè),而不是感官輸入本身,在我們的腦海中產(chǎn)生了感知。對大腦來說,輸入的信息越模糊,它對先驗知識的依賴就越大。
預(yù)測性處理框架的優(yōu)美之處在于,它擁有相當(dāng)強的能力來解釋許多不同系統(tǒng)中的大量現(xiàn)象。
盡管有越來越多的神經(jīng)科學(xué)證據(jù)支持了這一觀點,但主要是間接證據(jù),而且存在其他解釋的可能性。如果你仔細審視人類的認知神經(jīng)科學(xué)和神經(jīng)成像研究,就會發(fā)現(xiàn)很多證據(jù),但都是極為隱性、間接的證據(jù)。
因此,研究人員開始轉(zhuǎn)向計算模型,試圖理解和驗證“預(yù)測性大腦”的想法。計算神經(jīng)科學(xué)家已經(jīng)建立了人工神經(jīng)網(wǎng)絡(luò),其設(shè)計靈感來自生物神經(jīng)元的行為,可以學(xué)習(xí)對輸入信息做出預(yù)測。這些模型顯示出一些不可思議的能力,似乎可以模仿真正的大腦。利用這些模型所做的實驗甚至暗示,大腦必須進化成預(yù)測機器,才能滿足能量的限制。
▲ 20 世紀中期的認知心理學(xué)家利用這張著名的鴨兔圖像來研究人類的感知能力
隨著計算模型的激增,研究活體動物的神經(jīng)科學(xué)家也越來越確信,大腦已經(jīng)學(xué)會了推斷感官輸入背后的原因。大腦是如何做到這一點的?研究者尚不清楚其中的具體細節(jié),但總體思路正變得越來越清晰。
知覺中的無意識推論
一開始,“預(yù)測性處理”似乎是一種與直覺相悖的復(fù)雜感知機制,但由于缺少其他有力的解釋,科學(xué)家長期以來一直都對其青睞有加。甚至在一千年前,阿拉伯天文學(xué)家和數(shù)學(xué)家哈桑?本?海什木在他的《光學(xué)書》(Book of Optics)中就提出了該機制的一種形式,從各個方面對視覺進行了解釋。19 世紀 60 年代,德國物理學(xué)家、生理學(xué)家兼醫(yī)生赫爾曼?馮?亥姆霍茲提出,大腦會推斷感官輸入信息的外部原因,而不是根據(jù)這些輸入信息“自下而上”地構(gòu)建感知。
亥姆霍茲闡述了“無意識推論”的概念,來解釋雙穩(wěn)態(tài)(或多穩(wěn)態(tài))知覺;在這種知覺中,大腦可以用不止一種方式感知同一個圖像。例如,當(dāng)看到那幅廣為人知的鴨兔圖像時,我們的知覺就會在這兩種動物圖像之間來回切換。也就是說,圖像可以通過兩種方式來看,或是鴨子或是兔子。通過諸如此類的例子,亥姆霍茲斷言,由于眼睛視網(wǎng)膜上形成的圖像并沒有改變,因此這種感知必然是一個自上而下的無意識推理過程的結(jié)果。
在 20 世紀,認知心理學(xué)家繼續(xù)通過案例來說明感知是一個積極構(gòu)建的過程,利用了自下而上的感覺和自上而下的概念輸入。1980 年,英國心理學(xué)家理查德?蘭頓?格里高利發(fā)表了一篇頗具影響力的論文,題為《作為假設(shè)的感知》。文中認為,感知錯覺本質(zhì)上是大腦對感官印象成因的錯誤猜測。同一時期,計算機視覺科學(xué)家在沒有“生成”模型作為參考的情況下,試圖使用自下而上的重建方式使計算機能“看到東西”。但他們的努力遇到了挫折。
試圖在沒有生成模型的情況下理解數(shù)據(jù)注定會失敗 —— 人們所能做的就是對數(shù)據(jù)中的模式做出陳述。
然而,盡管研究者對“預(yù)測性處理”的接受程度有所提高,但關(guān)于它如何在大腦中實現(xiàn)的問題仍未解決。目前有一個頗受歡迎的模型,稱為“預(yù)測編碼”,認為大腦中存在信息處理的層級結(jié)構(gòu)。最高層級代表最抽象、最高級的知識(比如感知到陰影中有一條蛇)。該層級通過向下發(fā)送信號來預(yù)測下一層級的神經(jīng)活動;下一層級則將其實際活動與上一層級的預(yù)測進行比較。如果不匹配,該層級將產(chǎn)生流向上層的誤差信號,以便較高層級更新其內(nèi)部的表征結(jié)果。
在每一對連續(xù)的層級之間會同時發(fā)生這一過程,一直到最下面接收實際感覺輸入的層級。從外界接收到的信息與預(yù)期信息之間的任何差異都會產(chǎn)生一個誤差信號,并將其傳回層級結(jié)構(gòu)。最終,最高的層級會更新其假設(shè)(發(fā)現(xiàn)陰影中其實不是一條蛇,而是一條繩子)。
總的來說,預(yù)測編碼的概念是指大腦基本上由兩個神經(jīng)元群構(gòu)成,尤其是當(dāng)這一概念被應(yīng)用到大腦皮層時。一個神經(jīng)元群負責(zé)對當(dāng)前感知信息的最合理預(yù)測進行編碼,另一個則負責(zé)發(fā)出預(yù)測中的誤差信號。
1999 年,計算機科學(xué)家拉杰什?拉奧和達納?巴拉德(當(dāng)時分別在索爾克生物研究所和羅切斯特大學(xué)任職)建立了一個強大的預(yù)測編碼計算模型,其中具有明確用于預(yù)測和糾錯的神經(jīng)元。他們模擬了靈長類動物大腦視覺處理系統(tǒng) —— 由負責(zé)識別面孔和物體的層級組織區(qū)域組成 —— 的部分通路,并表示該模型可以重現(xiàn)靈長類視覺系統(tǒng)的一些不尋常行為。
不過,在這項工作完成時,現(xiàn)代深層神經(jīng)網(wǎng)絡(luò)還沒有出現(xiàn)。深層神經(jīng)網(wǎng)絡(luò)有一個輸入層和一個輸出層,以及夾在這兩層之間的多個隱藏層。到 2012 年,神經(jīng)科學(xué)家開始使用深層神經(jīng)網(wǎng)絡(luò)來模擬靈長類視覺皮層的腹側(cè)流。但幾乎所有這些模型都是前饋網(wǎng)絡(luò),信息都只從輸入端流向輸出端。大腦顯然不是一個純粹的前饋機器,大腦中有很多反饋信息,基本上與前饋信號一樣多。
因此,神經(jīng)科學(xué)家轉(zhuǎn)向了另一種模型:循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,又稱遞歸神經(jīng)網(wǎng)絡(luò),簡稱 RNN)。這些神經(jīng)網(wǎng)絡(luò)具有一些使其成為模擬大腦“理想基質(zhì)”的特征。循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)元之間既有前饋又有反饋連接,而且它們有獨立于輸入的持續(xù)活動。在很長一段時間 —— 基本上可以說是永遠 —— 之內(nèi)產(chǎn)生這些動態(tài)的能力,正是這些網(wǎng)絡(luò)隨后可以被訓(xùn)練的原因。
▲ 基于預(yù)測的感知。在解釋大腦的感知機制時,“自下而上”的感知模型(左)并不如“自上而下”的模型,后者具有由神經(jīng)元組成的層級結(jié)構(gòu),使大腦能對即將接收到的感官刺激做出預(yù)測
預(yù)測可以節(jié)能
循環(huán)神經(jīng)網(wǎng)絡(luò)引起了哈佛大學(xué)科學(xué)家的注意。2016 年,研究團隊展示了一個學(xué)會預(yù)測視頻序列中下一幀的循環(huán)神經(jīng)網(wǎng)絡(luò)。他們將其稱為“PredNet”。這個循環(huán)神經(jīng)網(wǎng)絡(luò)的設(shè)計原理與預(yù)測編碼是一致的,是一個 4 層的層級結(jié)構(gòu),每一層都會預(yù)測來自下一層的輸入信息,如果不匹配,就會向上層發(fā)送誤差信號。
然后,他們用安裝在車載攝像頭拍攝的城市街道視頻訓(xùn)練該網(wǎng)絡(luò)。PredNet 學(xué)會了持續(xù)預(yù)測視頻序列中的下一幀,這非常酷。
他們的下一步是將 PredNet 與神經(jīng)科學(xué)聯(lián)系起來。2020 年,研究團隊撰文稱,PredNet 顯示了猴子大腦對意外刺激做出反應(yīng)時的行為,包括一些在簡單前饋網(wǎng)絡(luò)中難以復(fù)制的行為。
這是一項了不起的工作,無論是拉奧和巴拉德的模型,還是 PredNet,都明確加入了用于預(yù)測和糾錯的人工神經(jīng)元,以及能做出自上而下的準(zhǔn)確預(yù)測以抑制錯誤神經(jīng)元的機制。但如果沒有明確指定這些神經(jīng)元會如何呢?研究人員想知道,所有這些加進去的構(gòu)造約束是否真的有必要,或者我們是否可以通過更簡單的方法把它們?nèi)サ簟?/p>
▲ 哈佛大學(xué)的威廉?洛特和他的博士論文導(dǎo)師共同創(chuàng)建了 PredNet,這是一個循環(huán)神經(jīng)網(wǎng)絡(luò),在結(jié)構(gòu)設(shè)計上可用于執(zhí)行預(yù)測編碼
首先能到想的是,神經(jīng)通信是十分耗能的,畢竟大腦是身體中消耗能量最多的器官。因此,保存能量的需要可能會限制生物體中任何正在進化的神經(jīng)網(wǎng)絡(luò)行為。
研究人員決定試一下,看看在需要用盡可能少的能量完成任務(wù)的循環(huán)神經(jīng)網(wǎng)絡(luò)中,是否會出現(xiàn)預(yù)測編碼的計算機制。他們認為,在神經(jīng)網(wǎng)絡(luò)中,人造神經(jīng)元之間的連接強度(也被稱為“權(quán)重”),可以作為突觸傳遞的代理,而突觸傳遞是生物神經(jīng)元消耗大量能量的原因。如果能減少人工單元之間的權(quán)重,就意味著你能用更少的能量交流,這等同于將突觸傳遞最小化。
然后,研究團隊用多個升序并頭尾相接的連續(xù)數(shù)字序列來訓(xùn)練 RNN,包括 1234567890、3456789012、6789012345 等等。每個數(shù)字都以 28×28 像素的圖像形式顯示給循環(huán)神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)學(xué)習(xí)了一個從序列中任意位置開始預(yù)測下一位數(shù)字的內(nèi)部模型,但被要求以最小的單元權(quán)重來完成這一任務(wù),類似于生物神經(jīng)系統(tǒng)中低水平的神經(jīng)活動。
在這些條件下,這一循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)會了預(yù)測序列中的下一個數(shù)字。它的一些人工神經(jīng)元充當(dāng)了“預(yù)測單元”,代表一個預(yù)期輸入的模型。其他神經(jīng)元則充當(dāng)“誤差單元”,當(dāng)預(yù)測單元尚未學(xué)會正確預(yù)測下一個數(shù)字時,它們最為活躍;而當(dāng)預(yù)測單元開始正確做出預(yù)測時,這些誤差單元就被抑制住了。至關(guān)重要的是,該網(wǎng)絡(luò)之所以能形成這一結(jié)構(gòu),是因為它必須盡量減少能量消耗。它只是學(xué)會了人們通常明確內(nèi)置于系統(tǒng)中的那種抑制機制,系統(tǒng)是即開即用的,將其作為一件緊急事務(wù)來做,并達到高效節(jié)能。
▲ 當(dāng)研究人員向 PredNet 展示視頻序列時(上),這個具有預(yù)測編碼結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)會了預(yù)測下一幀圖像(下)
因此,研究人員得出的結(jié)論是:最大限度減少能耗的神經(jīng)網(wǎng)絡(luò)最終將實現(xiàn)某種預(yù)測性處理。這反過來也說明了,生物大腦可能也在做著同樣的事情。
這是一個非常好的例子,說明了自上而下的約束,如能耗最小化,會如何間接地導(dǎo)致某個特定的功能,比如預(yù)測編碼。循環(huán)神經(jīng)網(wǎng)絡(luò)中特定誤差單元和預(yù)測單元的出現(xiàn),是否可能是網(wǎng)絡(luò)邊緣的神經(jīng)元接收輸入的意外結(jié)果。如果輸入信息遍布整個網(wǎng)絡(luò),你不會發(fā)現(xiàn)誤差單位和預(yù)測單位之間有什么區(qū)別,但你仍然會發(fā)現(xiàn)預(yù)測活動。
大腦行為的統(tǒng)一框架
盡管從這些計算研究中獲得的見解看起來很有說服力,但最終,只有來自活體大腦的證據(jù)才能證明大腦中確實存在預(yù)測處理過程。布萊克?理查茲是加拿大麥吉爾大學(xué)和魁北克人工智能研究所的神經(jīng)科學(xué)家兼計算機科學(xué)家,他和同事們提出了一些明確的假設(shè),描述了大腦在學(xué)習(xí)預(yù)測意外事件時應(yīng)該“看到”什么。
為了驗證這些假設(shè),他們求助于美國西雅圖艾倫腦科學(xué)研究所的研究人員,后者在小鼠身上進行了一些實驗,同時監(jiān)測它們大腦中的神經(jīng)活動。特別讓研究者感興趣的是,大腦新皮層中的某些錐體神經(jīng)元,被認為在解剖學(xué)上很適合進行預(yù)測處理。它們既可以接收來自附近神經(jīng)元的自下而上的感覺信號(通過向它們的細胞體輸入信號),也可以接收來自更遙遠神經(jīng)元的自上而下的預(yù)測信號(通過它們的頂樹突)。
▲ 大腦中的錐體神經(jīng)元似乎在解剖學(xué)上很適合進行預(yù)測性處理,因為它們可以分別整合來自鄰近神經(jīng)元的“自下而上”信號,以及來自較遠神經(jīng)元的“自上而下”信號
研究人員向小鼠展示了許多加博爾光斑(由明暗條紋組成)序列,每個序列中的 4 個光斑都有大致相同的朝向。小鼠逐漸適應(yīng)了這些序列,然后,研究人員插入了一個意外事件:第 4 個加博爾光斑隨機旋轉(zhuǎn)到另一個方向。一開始,這些小鼠顯得很驚訝,但隨著時間的推移,它們也開始期待驚喜。實驗期間,研究人員一直在觀察小鼠大腦的活動。
研究人員發(fā)現(xiàn),許多神經(jīng)元對預(yù)期和意外刺激的反應(yīng)是不同的。至關(guān)重要的是,在實驗的第一天,這種反差在局部的、自下而上的信號中非常強烈;但在第二天和第三天,反差就減弱了。這表明,在預(yù)測性處理的背景下,隨著刺激變得不那么令人驚訝,新形成的自上而下的預(yù)期開始抑制對傳入感覺信息的反應(yīng)。
與此同時,頂樹突的情況恰好相反:它們對意外刺激的反應(yīng)差異隨著時間的推移而增強。神經(jīng)回路似乎正在學(xué)習(xí)更好地表征這些意外事件的性質(zhì),以便更好地預(yù)測下一次事件。這項研究進一步支持了這樣一種觀點,即新大腦皮層正在進行著預(yù)測學(xué)習(xí)或預(yù)測編碼。
有時,對神經(jīng)元活動或動物行為的個別觀察結(jié)果也可以用其他大腦模型來解釋。例如,神經(jīng)元對相同輸入的反應(yīng)減弱,可能只是一個適應(yīng)過程,而不必解釋為誤差單元受到抑制。不過,這最后可能會導(dǎo)致你要對許多不同現(xiàn)象一一做出解釋。相比之下,預(yù)測性處理提供了一個統(tǒng)一的框架,可以一次性解釋許多現(xiàn)象,因此是一個很有吸引力的大腦工作理論。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。