機器能否追憶逝水年華?-科學人雜誌
人工智慧

機器能否追憶逝水年華?

2021/08/06 柯霍 ( Christof Koch )
我們有生之年就可以見到 和人類能力相當的人工智慧。但是它們能不能 有意識地感受這個世界?

重點提要

  1. 電腦即將展現和人類相當的能力。
  2. 專家目前仍不知道電腦是否會產生意識。
  3. 因為即使是最精密的模擬人類大腦,都不太可能產生有意識的感受。


電腦的思考能力即將追上人類,而且我們很快就會見證這樣的未來。日益強大的機器學習演算法,讓人類備感壓力。在接下來的幾十年內,機器就會擁有與人類旗鼓相當的智能,它們可以說話和推理,並且會對經濟和政治貢獻良多,無可避免也會涉及軍事戰略。人工智慧(AI)的誕生將會深刻影響人類的未來,甚至包括人類究竟有沒有未來。


以下摘錄的文字,就是很好的例子:

“From the time the last great artificial intelligence breakthrough was reached in the late 1940s, scientists around the world have looked for ways of harnessing this ‘artificial intelligence’ to improve technology beyond what even the most sophisticated of today’s artificial intelligence programs can achieve.”(「自1940年代晚期人工智慧發展的最後一次大突破之後,世界各地的科學家開始尋找方法來操控所謂的『人工智慧』,以改善科技來達成目前最先進的人工智慧所做不到的事。」)

“Even now, research is ongoing to better understand what the new AI programs will be able to do, while remaining within the bounds of today’s intelligence. Most AI programs currently programmed have been limited primarily to making simple decisions or performing simple operations on relatively small amounts of data.”(「即使是現在,科學研究仍在我們有限的智能範圍內,試圖進一步理解新型態人工智慧的能力。目前大多數人工智慧計畫只局限在使用相對少量的資料來提出簡單的決策或執行簡易的動作。」)


上述兩段文字是2019年夏天我測試語言機器人GTP-2時,由它撰寫出來的。GTP-2由美國聖地牙哥的機構OpenAI所研發,該機構致力推廣對社會有益的人工智慧。GTP-2採用機器學習去計算一個看似呆板的作業:當它接收到某個隨意的起始句子時,必須預測下一個字是什麼。GTP-2沒有被教導以人類的方式「理解」文字,相反地,它在訓練時只是不斷改變模擬網路中的內部連結,以預測出下一個最可能出現的字(以及再下一個字等後續文字)。經過來自800萬個網頁上的文字訓練後,GTP-2總共產生了超過10億個類似突觸(連結神經細胞的接觸點)的連結。當我輸入上述兩段文字開頭的幾句話之後,GTP-2就輸出了這些內容,看起來有點像大學部新生試圖回想,自己心不在焉修習機器學習基礎課程時給出的簡述。這些內容的用字遣詞都正確,的確相當不錯!而且當我再次輸入相同的起始語句,GTP-2還會產生不一樣的內容。

未來新一代的這類機器人將會產生許多「深度造假」(deep fake)的產品評論和新聞故事,讓網際網路的資訊更加混亂。於是,機器人除了能操控即時戰略遊戲星海爭霸、進行翻譯、為個人推薦書和電影,以及在照片和影片中辨識人們的身分,現在又有一項我們原本以為只有人類才有的能力,機器人也具備了。

雖然機器學習仍需更加精進才能寫出像普魯斯特(Marcel Proust)《追憶逝水年華》(In Search of Lost Time)那樣細膩連貫的鉅作,但一切指日可待。還記得以前的電腦操控電玩、進行翻譯和電腦語音都非常笨拙且遭人鄙視,因為它們明顯缺乏技巧且功能粗糙。但是深度神經網路(deep neural network)的發明以及科技業大規模的計算基礎設施支援,讓電腦無止盡快速進步,人類再也笑不出來。在圍棋、西洋棋和撲克牌,我們已看到這些演算法擊敗人類,而當下我們原本的訕笑轉變成驚愕。我們是否就像歌德(Goethe)筆下的魔法師學徒,已召喚出無法掌控的強大精靈?


人工意識誕生?

雖然專家對於智慧(無論是自然或人工)的定義尚有爭論,但是大多數人都認為電腦遲早會具備所謂的通用人工智慧(artificial general intelligence,譯註:和人類能力相當的人工智慧)。關於機器智慧(machine intelligence)的研究讓我們對一些問題充滿好奇:具有通用人工智慧的機器人會不會有任何感受?可程式化的電腦究竟有沒有意識?

這裡說的「意識」,我指的是任何一個經驗中的內在質感,例如巧克力榛果醬的可口味道、蛀牙時的尖銳刺痛、無聊時的緩慢時間感或是競賽開始前的衝勁與焦躁。根據哲學家納格爾(Thomas Nagel)的說法,如果某個系統(事物)會有某種感受,那該系統(事物)就有意識。

比方說,當你在社交場合失禮而覺得不好意思時,原本想要講笑話卻變成羞辱對方時,電腦能否經驗到這種不安的情緒?當你在電話一端等了好幾分鐘,然後聽到了「抱歉讓您久等」的合成語音時,那個產生語音的軟體是否真的因為對你服務不周而感到愧疚?

一般認為人類的智慧與經驗是大腦自然的運作結果,而不是什麼超自然現象。這個假設在過去幾世紀來,對人類探索世界並推動科學進展大有助益。重約1.4公斤、看似豆腐的人類大腦是目前已知宇宙中最複雜的生物組織,儘管如此,人類大腦仍然必須遵循物理定律,就像狗、樹和恆星等事物一樣,沒有任何事物是例外。目前仍不清楚大腦的因果力(causal power)從何而來,但是我們每天都會經驗到這些大腦活動:當你看見顏色,大腦皮質中會有一群神經細胞活化,當你感到快樂,另一腦區的神經細胞會激發。當神經外科醫生在這些神經細胞植入電極並給予刺激,受試者就會看見顏色或發出笑聲。相反地,當大腦因麻醉而關機時,這些經驗就會消失。

那麼根據這些廣為接受的基本假設,真實的人工智慧在演化之後,究竟是否會出現人工意識(artificial consciousness)?


思考這個問題之後,我們必然面臨一個岔路,分別通向兩個在本質上迥異的終點。從《銀翼殺手》、「雲端情人」和「人造意識」等科幻小說和電影中,我們可以看到這個時代的精神體現:真實的智慧機器將堅決往具有意識的方向邁進,它們能說話、推理、自我監控並內省,也因此它們將有意識。

「全腦工作平台」(global neuronal workspace theory, GNW)是直接表明未來世界將通往此方向的最佳代表理論,也是目前受歡迎的意識科學理論之一。這個理論以大腦為出發點,主張腦中的某些特定結構特徵就是產生意識的基礎。

此理論可追溯至1970年代電腦科學中的「黑板架構」(blackboard architecture):有專門的程式會擷取「黑板」或「中央工作平台」(一種共享資訊庫)中的訊息。心理學家認為,這種訊息處理方式也存在人腦中,而且是人類認知的關鍵核心,它的容量很小,因此每個時刻只能容納單一知覺、思想或記憶,新訊息會和舊訊息競爭並取而代之。

法國法蘭西公學院認知神經科學家狄昂(Stanislas Dehaene)和分子生物學家尚則(Jean-Pierre Changeux)認為,GNW的神經基礎可能就存在於大腦皮質結構中,也就是灰質最外層。大腦皮質是兩片被擠壓在頭顱中受到保護的高度皺褶組織,左右腦各有一片,體積和厚度就和14吋披薩差不多。狄昂和尚則主張,中央工作平台是由一群錐體神經元(pyramidal neuron)所形成的神經網路和遠端的皮質區相連而成,特別是前額葉、頂顳葉以及位於中線的扣帶聯合皮質區。


有許多局部的大腦活動並不經由中央工作平台,因此不會被意識察覺到,例如控制凝視方向的模組(我們幾乎不會注意這項活動),或是調控身體姿勢的模組。但是當一個或多個腦區中的活動超過了門檻,例如當我們看到一罐巧克力榛果醬的照片時,就會啟動神經反應,然後一連串的神經活動會傳遞至中央工作平台並傳遍整個大腦中的相關腦區。這樣的訊息處理結果會讓許多相關的認知歷程(包括語言、計畫、報償回饋、長期記憶提取以及短期記憶緩衝儲存)也能擷取其中的資訊。這種全腦廣播的方式就是訊息進入意識狀態的關鍵。巧克力榛果醬讓我們產生獨特意識經驗的歷程,就是訊息先由錐體神經元傳向動作計畫腦區,接著促使我們去拿湯匙挖取,同時其他的腦區模組則送出訊息讓我們開始期待報償,因為我們即將吃下巧克力榛果醬的高脂肪和高糖份而產生大量的多巴胺。


意識經驗就是工作平台演算法在處理相關感官輸入、動作輸出,以及各種與記憶、動機和預期有關的內在變因時產生的。全腦訊息處理就是產生意識的關鍵。GNW敞開雙手擁抱幾近無止盡運算能力的當代神話:只需在計算時加入某些巧妙設計,意識就會浮現。


遵循物理定律的內在因果力

另一條路則是「整合訊息理論」(integrated information theory, IIT),透過一種較為基礎的方式來解釋意識。



美國威斯康辛大學麥迪遜分校的精神科醫師兼神經科學家托諾尼(Giulio Tononi)是IIT的主要創建者,我和其他人也有一些貢獻。此理論從意識經驗出發,進一步探討突觸迴路的活動如何決定一個意識經驗的「感受」。整合訊息是一種數學計算結果,可用來量化某一機制擁有多少「內在因果力」。例如神經細胞透過動作電位來影響經由突觸所連結的下游神經細胞,這就是一種型式的機制;由電晶體、電容、電阻和電線所構成的電子迴路也是。


內在因果力並非虛無縹緲的事物,任何一個系統的內在因果力都可被精確計算出來。一個系統當下狀態涉及越多因(輸入)與果(輸出)時,因果力就越高。


IIT主張,任何擁有內在因果力(其狀態會受過去影響並可改變未來)的機制都有意識;而一個系統的整合訊息量越大,該系統的意識程度就越高。整合訊息量用希臘字母Φ來表示(唸做fi,可以是零或正值),如果某個系統沒有內在因果力,其Φ值就是零,就不會有任何感受。


由於大腦皮質中的神經細胞彼此差異大,而且輸入和輸出的連結高密度重合,因此整合訊息量很大。IIT已經讓研究人員產生了「意識測量儀」的想法,並正在臨床上加以測試,這個方法將可用來判定植物人、處於最小意識狀態的病人、麻醉下的受試者或閉鎖(locked-in)症候群的病人是否有意識但只是無法溝通,或只「剩下軀殼」。當我們分析可程式化數位電腦的因果力時,發現其硬體部件(電晶體、電線和二極體等用來計算的物理元件)的內在因果力和Φ值很低。此外,電腦的Φ值與處理器上正在執行的軟體無關,不論是在計算稅金還是模擬大腦都沒有差別。


確實有證據支持IIT:就算兩個網路擁有同樣的輸入和輸出,但只要兩個網路的結構不同,Φ值就會不同;其中一個網路可能Φ值為零,另一個卻可能具有很高的Φ值,雖然表面看來兩個網路的反應都一樣,但是一個網路有感覺,另一個卻像殭屍一樣沒有任何感覺,差別其實是隱藏在檯面下的,也就是存在於網路的內在連結中。簡言之,意識和存在(being)的本質有關,而與你做了什麼(doing)無關。


這兩個理論的差異在於,GNW強調以人腦的功能來解釋意識,IIT則認為大腦的內在因果力才是真正的關鍵。


透過大腦中的神經連結組(connectome),也就是整個神經系統中確切的突觸連結方式,我們就可以進一步發現兩個理論的預測差異。解剖學家已繪製了一些蠕蟲的神經連結組,現正繪製果蠅的神經連結組,未來10年內將挑戰小鼠。或許未來將有機會,在一個人死後以極精細的方式掃描其腦中約千億個神經細胞和千兆個突觸,然後利用量子機器等先進電腦進行模擬。如果模擬的真確度夠高,我們將看到它醒來,而且行為就像已故之人的數位活動模型:它能說話、提取記憶、有欲望、恐懼以及其他各種特質。


GNW主張,模擬大腦的功能就足以產生意識,若真如此,上述的模擬人類就有意識,等於是在電腦中重新轉生。在許多科幻題材中,我們都可以看到這種把神經連結組上傳到雲端,好讓人類能透過數位型式來延續生命。

IIT則對此情境提出了全然不同的詮釋:上述數位活動模型的內在感受,其實和花俏日式馬桶上的軟體程式差不多,兩者都不會有任何感受經驗。它的行動和人類很像,但不會有任何內在感受,它就是一個殭屍(但不會想吃人)。這是一種極致的深度造假。

若要產生意識,就需要有內在因果力。這些因果力無法模擬,只能存在於物理系統的部件與機制中。

如果想知道為什麼模擬仍不足以產生意識,你可以思考一下,為什麼模擬暴雨天氣的電腦系統中不會下雨?或是為什麼天文物理學家可以模擬強大的黑洞重力,卻不用擔心電腦周圍會出現時空扭曲並吞噬一切?答案就在於:模擬並不具有因果力,所以不會產生降雨,也不會造成時空扭曲。不過原則上來說,我們應該可以超越模擬,並根據神經系統的真實結構來建造類神經的硬體以產生意識。

關於上述的模擬爭論,兩個理論還有一些差異。對於大腦皮質中究竟哪些區域會產生特定意識(例如意識的核心位置應該在皮質前方還是後方),兩個理論有不同預測。來自美國、歐洲和中國的六個實驗室剛剛獲得鄧普頓世界慈善基金會500萬美元的資助,科學家將透過大型合作計畫來測試這些不同的理論預測。

機器究竟能否產生意識,將衍生重要的道德議題。如果電腦可以透過自己的感官來經驗世界和生命,那它們就不再只是人類眼中的實用工具。它們本身的存在就有意義。

GNW認為,這些模擬機器人將從物體轉變成主體,每個主體都將以擁有自我觀點的「我」的方式存在。在電視影集「黑鏡」和「西方極樂園」中,我們看到了發人省思的兩難情境:當電腦的認知能力追上人類時,就會產生強大動機去爭取法律和政治權利,包括資料不被刪除、記憶不被抹滅,以及不受苦和不受屈辱。相較之下IIT則認為,電腦將只是極度精緻的機器,宛如遊蕩的空殼,永遠不會擁有我們最重視的事物:對於生命的感受經驗。

# 關鍵字:人工智慧神經科學意識AI NEXT
更多文章
活動推薦更多
追蹤科學人