讀古今文學網 > 驚人的假說 > 3 >

3

第14章 視覺覺知[116]

宇宙就像一部展現在我們眼前的偉大的著作。哲學就記載在這上面。但是如果我們不首先學習並掌握書寫它們所用的語言和符號,我們就無法理解它們。

——伽利略

現在讓我們總覽一下到目前為止我們所涉及的領域。本書的主題是“驚人的假說”,即我們每個人的行為都不過是一個擁有大量相互作用的神經元群體活動的體現。克裡斯托弗·科赫(Christof Koch)和我認為探索意識問題的最佳途徑是研究視覺覺知,這包括研究人類及其近親。然而,人們觀看事物並不是一件直截了當的事情,它是一個具有建設性的、複雜的處理過程。心理學研究表明,它具有高度的並行性,又按照一定的順序加工,而“注意”機制處於這些並行處理的頂端。心理學家提出過若干種理論試圖來解釋視覺過程的一般規律,但沒有一種更多地涉及腦中神經元的行為。

腦本身是由神經元及大量支持細胞構成的。從分子角度考慮,每個神經元都是一個複雜的對象,常具有無規則的、異乎尋常的形狀。神經元是電子信號裝置。它們對輸入的電學和化學信號快速地作出反應,並將它們的高速電化學脈衝沿軸突發送出去,其傳送距離通常比細胞體直徑還要大許多倍。腦中的這些神經元數目巨大,它們有許多不同的類型。這些神經元彼此具有複雜的連接。

與大多數現代計算機不同,腦不是一種通用機。在完全發育好以後,腦的每一部分完成某些不同的專門任務。另外,在幾乎所有的反應中,都有許多部分相互作用。這種一般性觀念得到了人腦研究結果的支持,這些研究包括對腦損傷者的研究以及使用現代掃瞄方法從頭顱外進行的對人腦的研究。

視覺系統的不同的皮質區的數目比人們預料的要多得多。它們按一種近似等級的方式連接而成。在較低級的皮質區,神經元到眼睛的連接最短,它們主要對視野中一小塊區域中的相對簡單的特徵敏感,儘管如此,這些神經元也受該區域所處的視覺環境影響。較高級皮質區的神經元則對複雜得多的視覺目標(如臉或手)有反應,對該物體在視野中的位置並不敏感。(目前看來)似乎並不存在單獨的皮質區域與視覺覺知的全部內容相對應。

為了理解腦如何工作,我們必須發展出描述神經元集團間如何相互作用的理論模型。目前的這些模型對神經元進行了過分的簡化。儘管現代計算機比其上一代在運算速度上快得多,但也只能對數目很少的一群這類簡化神經元及其相互作用進行模擬。儘管如此,雖然這些不同類型的簡化模型仍顯得原始,卻經常表現出一些令人吃驚的行為。這些行為與腦的某些行為有相似之處。它們為我們研究腦所可能採取的工作方式提供了新的途徑。

以上闡述的是背景知識。在此基礎上,我們著手解決視覺覺知問題,即如何從神經元活動的角度來解釋我們所看見的事物。換句話說,視覺覺知的“神經關聯”是什麼?這些“覺知神經元”究竟位於何處?它們是集中在一小塊地方還是分散在整個腦中?它們的行為是否有什麼特別之處?

讓我們首先回顧一下第2章曾概述的各種觀點。視覺覺知究竟包括哪種心理學處理過程呢?如果我們能夠找出這些不同的處理過程在腦中的確切位置,或許會對定位我們所尋找的覺知神經元有所幫助。

菲力普·約翰遜—萊爾德認為,腦和現代計算機一樣,具有一個操作系統。該操作系統的行為與意識相對應。他在著作《心理模型》(Mental Models)一書中,在更加廣闊的背景下提出了這一思想。他認為,有意識和無意識過程的區別在於後者是腦中高度的並行處理的結果。正如我已在視覺系統中描述的那樣,這種並行處理就是大量的神經元能夠同時工作,而不是序列式一個接一個地處理信息。只有這才能使有機體有可能進化成具有特殊的、運轉快速的感覺、認知及運動系統。而更為序列式的操作系統對所有這些活動進行全局控制,這樣才能夠快速、靈活地作出決定。粗略地打個比方,這就好像一個管絃樂隊的指揮(相當於操作系統)控制著樂隊所有成員同時演奏一樣。

約翰遜—萊爾德假定,雖然這個操作系統可以監視它所控制的神經系統的輸出,它能利用的只是它們傳遞給它的結果,而不是它們工作的細節。我們通過內省只能感覺到我們腦中所發生的情形的很少一部分。我們無法介入能產生信息並傳給腦的操作系統的許多運作。因為他將操作系統視為主要是序列式的,所以他認為“在內省時,我們傾向於迫使本來是並行的概念進入序列式的狹窄束縛中”。這是使用內省法會出現錯誤的原因。

約翰遜—萊爾德的觀點表達得很清楚,又很有說服力。但是,如果我們希望從神經的角度理解腦,還必須要識別該操作系統的位置和本質。它不一定與現代計算機的許多特性相一致。腦的操作系統可能並不是清晰地定位於某一特殊位置上。從兩層意義上說,它更像是分佈式的:它可能涉及腦中相互作用的若干分離的部分,而其中某一部分的活動信息又會分散到許多神經元。約翰遜—萊爾德對腦的操作系統的描述使人多少想起丘腦,但是丘腦的神經元太少了,以至於無法表達視覺覺知的全部內容(雖然這是可以驗證的)。似乎更有可能的是,在丘腦的影響下新皮質的部分神經元(而不是全部神經元)可以表達視覺覺知。

我們尋找的覺知的神經關聯會處於腦功能等級的哪個階段呢?約翰遜—萊爾德認為,操作系統處在處理等級的最高層次,而雷·傑肯道夫認為覺知與中間層次有更多聯繫。究竟哪種觀點更合理呢?

傑肯道夫關於視覺覺知的觀點[117]是基於戴維·馬爾(David Marr)的2.5維圖而不是三維模型的思想的(大致說的是第6章所描述的以觀察者為中心的可見表面的表象)。這是由於人們直接感受到的只是視野中物體呈現的那一側;物體後面看不見的部分則僅僅是推測。另外,他相信對視覺輸入的理解(即我們感覺到的是什麼)是由三維模型和“概念結構”(conceptual structure,即思維的另一種堂皇的說法)決定的。以上就是他的意識的中間層次理論。

下面的例子有助於理解這個理論。如果你看見一個背對著你的人,你只能看見他的後腦勺,而看不見他的臉。然而,你的腦會推斷出他有一張臉。我們會這樣進行推理,因為如果他轉過身來,表明他的頭的正面並沒有臉,你會感到十分驚訝。以觀察者為中心的表象是與你所看見的他的頭的後部相對應的。這是你所真實感覺到的。你的腦所作出的關於其正面的推斷是從某種三維模型表象得到的。傑肯道夫認為你並不直接察覺這個三維模型(就此而言,同樣你也沒有直接察覺你自己的思想)。正如一句古語所說:未聞吾所言,安知吾所思?

由於初讀傑肯道夫的著作[118]時不容易理解他的語言,我把他的理論的倒數第二種說法放在腳注中。[119]如果我對他的理論的理解正確的話,他的觀點應用於視覺即“形態上的差異”(包括一個視覺目標的位置、形狀、顏色、運動等)是與一種短時記憶有關(或由它引起/支持/投射)的表象,這種表象是一種“勝者為王”機制(一種選擇機制)的結果,而注意機制的作用使它更加豐富。

傑肯道夫的觀點的價值在於,它提醒我們不要假設腦的最高層次必定是視覺覺知中涉及的唯一層次。我們面前的場景在腦中的栩栩如生的表象可能涉及了許多中間層次。其他層次可能不夠生動,或者如他所推測,我們可能根本不能察覺它們(的活動)。

這並不意味著信息僅僅是從表面表象流向三維表象:幾乎可以肯定雙向流動是存在的。在上面的例子中,當你想像一張臉孔的正面時,你所感覺到的正是由無法感知的三維模型產生的可感知的表面表象。隨著這一主題的發展,兩種表象之間的區別或許還需進一步明確,但它對我們試圖解釋的問題給出了一種最初的、粗略的看法。

目前尚不清楚這些層次在皮質中的準確位置。就視覺而言,它們更可能對應於腦的中部(如下顳葉及某些頂區),而不是腦的額區。但是傑肯道夫所指的究竟是視覺等級系統(圖52)中哪個部分,仍有待於探索(第16章將就此進行更詳細的討論)。

在看了一些心理學家對這個問題的觀點之後,我們現在再從那些瞭解神經元、它們的連接以及發放方式的神經科學家的角度來看這個難題。與意識有關(或無關)的神經元的行為的一般特徵是什麼?換句話說,意識的“神經關聯”是什麼?從某種意義上說,神經元的活動對意識是必不可少的,這看起來是合理的。意識可能與皮質中某些神經元的一種特殊類型的活動有關。毫無疑問它具有不同的形式,這取決於皮質的哪些部分參與了活動。科赫和我假設其中僅有一種(或少數幾種)基本機制。我們認為,在任意時刻意識將會與瞬間的神經元集合的特定活動類型相對應。這些神經元正是具有相當潛力的候選者的集合中的一部分。因此,在神經水平上,這個問題為:

·這些神經元在腦中位於何處?

·它們是否屬於某些特殊的神經元類型?

·如果它們的連接具有特殊性,那其特殊性是什麼?

·如果它們的發放存在某些特殊方式,那其特殊方式是什麼?

怎樣去尋找那些與視覺覺知有關的神經元呢?是否存在某些線索暗示了與這種覺知相關的神經發放的模式呢?

正如我們已經看到的,心理學理論對我們有若干提示。某些形式的注意很有可能參與了覺知過程,因而我們應當研究腦選擇性注意視覺目標的機制。覺知過程很有可能包括某些形式的極短時記憶,因而我們還應探索神經元儲存和使用這種記憶時的行為。最後,我們似乎可以一次注意多個目標,這對覺知的某些神經理論提出了問題,因此我們從論述這個問題開始。

當我們看見一個物體時,腦子裡究竟發生了些什麼呢?我們會看到的可能存在的、不同的物體幾乎是無限的。不可能對每個物體都存在一個相應的響應細胞(這種細胞常被稱為“祖母細胞”)。表達如此多具有不同深度、運動、顏色、朝向及空間位置的物體,其可能的組合多得驚人。不過這並不排除可能存在某些特異化的神經元集團,它們對相當特定的、生態上有重要意義的目標(如臉的外貌)有響應。

似乎有可能的是,在任意時刻,視野中每個特定的物體均由一個神經元集團的發放來表達。[120]由於每個物體具有不同的特徵,如形狀、顏色、運動等,這些特徵由若幹不同的視覺區域處理,因而有理由假設,看每一個物體時經常有許多不同視覺區域的神經元參與。這些神經元如何暫時地變成一個整體同時興奮呢?這個問題常被稱為“捆綁問題”(binding problem)。由於視覺過程常伴隨聽覺、嗅覺或觸覺,這種捆綁必然也出現在不同感覺模塊之間。[121]

我們都有這種體驗,即對物體有整體知覺。這使我們認為,對於已看見的物體的不同特徵,所有神經元都產生了積極的響應,而腦通過某種方式相互協調地把它們捆綁在一起。換句話說,如果你把注意力正集中在與你討論某個觀點的朋友身上,那麼,你腦中有些神經元對他的臉部運動反應,有些對臉的顏色反應,聽覺皮質中的神經元則對他講的話有反應,還可能挖掘出儲存這張臉屬於哪個人的那些記憶痕跡,所有這些神經元都將捆綁在一起,以便攜帶相同的標記以表明它們共同生成了對那張特定的臉的認知(有時候腦也會受騙而作出錯誤的捆綁,比如把聽到的口技表演者的聲音當作被模仿物發出的)。

捆綁有若干種形式。一個對短線響應的神經元可以認為把組成該直線的各點捆綁在一起。這種神經元的輸入和行為最初可能是由基因(及發育過程)確定的,這些基因是我們遠古的祖先的經驗進化的結果。另一種形式的捆綁,如對熟悉物體的識別,又如熟悉的字母表中的字母,可能從頻繁的、重複性的體驗中獲得,也就是說,是通過反覆學習得到的。這或許意味著參與某個過程的大量神經元最終彼此緊密地連接。[122]這兩種形式的相當永久的捆綁可以產生一些神經元群體,它們作為整體可以對許多物體(如字母、數字及其他熟悉的符號)作出反應。但腦中不可能有足夠多的神經元去編碼幾乎無窮數目的可感知的物體。對語言也是如此。每種語言都有大量的但數目有限的單詞,而形式正確的句子的數目幾乎是無限的。

我們最為關心的是第三種形式的捆綁。它既不是由早期發育確定的,也不是由反覆學習得到的。它特別適用於那些對我們而言比較新奇的物體,比如說我們在動物園裡看見的一隻新來的動物。在多數情況下,積極地參與該過程的神經元之間未必有較強的連接。這種捆綁必須能夠快速實現。因此它主要是短暫的,並必須能夠將視覺特徵捆綁在一起構成幾乎無限多種可能的組合,只不過也許在某一時刻它只能形成不多的幾種組合。如果一種特定的刺激頻繁地出現,這種第三種形式的瞬間的捆綁終將會建立起第二種形式的捆綁即反覆學習獲得的捆綁。

遺憾的是,我們並不瞭解腦如何表達第三種形式的捆綁。特別不清楚的是,在集中注意的覺知時,我們究竟每次僅僅感知一個物體,還是可以同時感知多個物體。表面上看,我們每次能感覺的絕不僅一個物體,但這是否可能是錯覺呢?腦真的能如此快速一個接一個地處理多個物體的信息,以致它們好像同時出現在我們腦海中嗎?也許我們每次只能注意一個物體,但在注意之後,我們可以大致記住其中幾個。因為我們並不確切知道真相,所以我們必須考慮所有這些可能性。讓我們先假設腦每次只能處理一個物體。

究竟哪種類型的神經活動可能與捆綁有關呢?當然,意識的神經關聯可能僅包含一種特殊類型的神經元,比如某個特殊皮質上的一種錐體細胞。一種最為簡單的觀點是,當這個特殊神經元集團的某些成員以一個相當高的頻率發放(比如大約400或500赫茲),或維持一段適當長時期的發放,此時覺知便出現了。這樣,捆綁僅對應於皮質神經元中相當小的一部分,它們在皮質中若幹不同的區域同時高頻發放(或都發放很長一段時間)。看起來這會有兩個結果:這種快速或持續性的發放將增強這個興奮的神經元集團對所投射到的神經元的影響,而這些被影響的神經元對應於此時腦所覺知的物體的“意義”。同時,這種快速的(或持續的)發放將激活某種形式的極短時記憶。

然而,如果腦能同時精確地覺知不只一個物體,那麼這種觀點就不能成立。即便腦每次只處理一個物體,它也必須區分目標和背景。為了理解這一點,不妨想像在一個視野中靠近視覺中央的地方,恰好有一個紅色的圓和一個藍色的方塊。那麼,對應於覺知的某些神經元將會快速發放(或持續發放一段時間),有些標識紅色,有些標識藍色,其他一些標識圓,當然還有一些標識方塊。腦又怎樣知道哪種顏色與哪種形狀相互搭配呢?換句話說,如果覺知僅僅對應於快速(或持續)的發放,腦多半會將不同物體的屬性混在一起。

有許多方法可以解決這個困難。或許只有當腦注意某個物體時才會形成對它的生動的覺知。或許注意機制使對被注意的物體反應的神經元的活動增強,同時削弱對其他物體反應的神經元的活動。倘若如此,腦只能隨著注意機制從一個物體跳躍到另一個物體,一個接一個地進行處理。畢竟,當我們轉動眼睛時,情形是這樣的。我們先注意視野中的一部分區域,然後轉而注意另一區域,如此下去。由於我們不動眼睛就能同時看見多個物體,故注意機制的速度必須比上述情況要快,並能在眼的兩次轉動之間工作。

另一種替代的解釋是,注意機制以某種方式使不同的神經元以多少不同的方式發放。此時的關鍵在於相關發放。[123]它基於這樣一種觀點,即重要的不僅僅在於神經元的平均發放率,更是每個神經元發放的精確時間。簡單起見,讓我們僅考慮兩個物體。對第一個物體的特徵反應的神經元都在同一時刻以某種模式發放,相應於第二個物體的神經元也都同時發放,但發放的時間與第一個神經元集團不同。

用一個理想化的例子可以把這個問題講得更清楚。假設第一集團中的神經元發放很快,或許它們還會再次發放,比如說是在100毫秒以後。同樣,在第二簇發放後過100毫秒又再次發放,如此下去。假設第二群神經元也同樣每隔大約100毫秒發放一簇高速脈衝,但是只在第一群神經元處於靜息狀態的時候才發放。這樣,腦中的其他部分不會把這兩群神經元的發放混在一起,因為它們從不會同時發放[124](圖57)。

圖57 時間軸上每根短的豎線表示一個神經元在某一時刻的發放。第一條水平線顯示了標識“紅色”的神經元的發放,下一條線則是標識“圓”的神經元的行為,等等。因為表示紅色的神經元和表示圓的神經元大致在相同時間發放,而它們與表示藍色的神經元的發放時間相差很大。腦因此可推斷出圓是紅色的而不是藍色的。這種情況常被說成表示“紅色”和“圓”的神經元的發放是相關的(表示“藍色”和“方塊”的神經元也是如此),而互相關(比如“紅色”和“方塊”之間)為0(為了說明問題,這個例子被大大地簡化了)

此處的基本觀點是:同時到達一個神經元的許多脈衝將比不同時刻到達的同樣數目的脈衝產生更大的效果。[125]其理論要求是同一群神經元的發放有較強的關聯,同時不同群的神經元之間關聯較弱,甚至根本沒有關聯。[126]

讓我們回到主要問題上,即定位“覺知”神經元並揭示使它們的發放象徵著我們所看見的東西的機制是什麼。這就像試圖偵破一個神秘的謀殺案。我們瞭解受害者(覺知的本質)的一些線索,還知道可能與犯罪有關的許多雜亂的事實。哪方面進展看來最有希望呢?由此下一步又該怎麼做呢?

最直接的線索將是在現場捉住嫌疑犯。我們能否發現那些行為一直與視覺覺知有關的神經元呢?一種可能的辦法是設置一種環境[如第3章描述過的觀看內克(Necker)立方體]使進入眼睛的視覺信息保持不變,但知覺會發生變化。當知覺改變時,哪些神經元會改變其發放,或改變發放的方式,而哪些神經元不會改變?如果一個特定神經元的發放不隨知覺改變,這就提供了一個“它不在現場”的證據。另外,如果它的發放確實與知覺有關,我們還需確定它是“真兇”還是“從犯”。