人在地毯上溜冰、奶牛變得透明,連六歲小孩都知道荒謬的事情,電腦能做出正確判斷嗎?盡管處理數據速度極快,但計算機對外界的感知與人類(lèi)的意識一樣嗎?如何判斷一臺機器是否具備了這種難以言傳的意識知覺(jué)?
在前不久的世界機器人大會(huì )上,各種能跑會(huì )跳、能說(shuō)會(huì )道、能與人溝通互動(dòng)的智能機器人紛紛亮相,它們的聰明勁兒讓媒體驚呼“機器人時(shí)代離我們有多遠”。
計算機技術(shù)正節節逼近擁有高級智慧的人類(lèi)。幾年前,IBM的機器人沃森在美國智力競賽節目“危險邊緣”中力挫該節目史上最出色的兩位選手而奪冠便是明證。然而,絕大多數人至今仍懷疑電腦是否真的“看清”了攝像頭前形形色色的真實(shí)世界,或者通過(guò)麥克風(fēng)“聽(tīng)懂”了一個(gè)問(wèn)題,盡管計算機處理數據的速度極快,但計算機對外界的感知與人類(lèi)的意識一樣嗎?
那么,如何判斷一臺機器是否具備了這種難以言傳的意識知覺(jué)的稟性?弄清有意識的機器具備哪些特性,能讓我們了解自己的大腦是如何運作的。另外,它甚至還可能幫助我們回答哲學(xué)家已經(jīng)糾結數百年的終極問(wèn)題:什么是意識?
真人還是假人?
長(cháng)期以來(lái),哲學(xué)家一直在思考,人造模擬裝置有沒(méi)有感覺(jué)?
1950年,英國數學(xué)家阿蘭·圖靈發(fā)表了一篇論文,宣告人工智能正式登上歷史舞臺。該文建議用“能否打造出一類(lèi)機器,當你和它用電傳打字機交流時(shí),你無(wú)法區分它是不是人類(lèi)”這個(gè)更為實(shí)際的問(wèn)題,來(lái)代替“機器能否思考”這個(gè)籠統的問(wèn)題。
如今的圖靈測試是讓測試者用“自然語(yǔ)言”(即我們平時(shí)交流所用的語(yǔ)言)通過(guò)電腦屏幕與某人或某款軟件互動(dòng),互動(dòng)內容可涉及任何話(huà)題。一定時(shí)間后,如果測試者無(wú)法確定對方是不是人類(lèi),那么該對象就算通過(guò)了圖靈測試,它的智力水平至少可以說(shuō)與人不相上下。這些年來(lái),聊天機器人——即用來(lái)模擬智能閑聊的對話(huà)式程序——一開(kāi)始偶爾也會(huì )騙過(guò)測試者,但要不了多久就會(huì )被識破。
神經(jīng)生物學(xué)家對自愿者的大腦或神經(jīng)障礙者的大腦進(jìn)行了掃描,通過(guò)腦電圖記錄他們的腦電波,逐步鎖定了所謂的意識神經(jīng)相關(guān)因子,即一種最基本的大腦功能結構。它們共同作用是足以引起任何特定的有意識感覺(jué),例如欣賞絢麗的夕陽(yáng)美景。然而目前這個(gè)研究領(lǐng)域仍然缺少一種普適性理論,要靠這種理論從原則上來(lái)評估大腦受損患者、胎兒、老鼠乃至芯片等能否體驗到有意識的感覺(jué)。
測測電腦芯片“整合度”
“意識的整合信息理論”提供了應對上述挑戰的途徑。該理論認為,意識信息是一個(gè)整體。當你意識到朋友的臉龐時(shí),你不可能遺漏了她正在呼喊并且戴著(zhù)眼鏡這兩個(gè)細節。無(wú)論是什么樣的場(chǎng)景,只要被意識到,它就始終是一個(gè)整體,不能被分解成若干可以單獨被感受到的互相獨立的成分。
日本軟銀集團類(lèi)人機器人Pepper擔任一家銀行的迎賓員迎接顧客
意識的這種整體性源自于大腦各部分之間的多種互動(dòng)關(guān)系。如果大腦各部分之間的聯(lián)系中斷(例如在麻醉和深度睡眠中),意識就會(huì )削弱,甚至消失。
因此,具備意識的,必須是一個(gè)單一的、經(jīng)過(guò)整合的實(shí)體,有大量可區分的狀態(tài)——這正是信息的定義。一個(gè)系統的整體信息容量,也就是意識容量,可以用該系統的信息量與它各組成部分擁有的信息總量相比超出多少來(lái)衡量。
要想使一個(gè)系統具有較高的意識級別,它的各個(gè)組成部分就必須是專(zhuān)業(yè)化的,并且整合充分,即各部分協(xié)同工作比各自單獨運行效果更佳。對于大腦的某些部位,例如大腦皮層,它的神經(jīng)元之間存在大量連接,這個(gè)數值則相當高。
這個(gè)衡量系統整合度的指標也可以用來(lái)評估電腦芯片。對電腦來(lái)說(shuō),只要各晶體管以及存儲單元之間的連接足夠復雜,那么它就同人腦一樣可以達到很高的整合信息水平。
用信息集成“考考”機器人
除了根據機器的連接狀況測量意識容量以外(這非常困難),我們怎么知道一臺機器是不是有意識呢?什么測量方法可行?
一種測試機器的信息集成度的方法是,讓機器來(lái)做一個(gè)6歲小孩也能完成的題目:“這幅畫(huà)里有什么地方不對勁兒?”要解決這個(gè)簡(jiǎn)單的問(wèn)題,就得擁有海量背景知識,比現今高檔電腦在執行識別人臉、追查信用卡欺詐之類(lèi)任務(wù)時(shí)所依靠的那點(diǎn)知識,不知多了多少倍。
計算機在分析圖像中的信息是否合理時(shí),必須依靠強悍的處理能力,這種能力遠遠超過(guò)了對數據庫進(jìn)行簡(jiǎn)單語(yǔ)言查詢(xún)的級別。說(shuō)起玩高級游戲,電腦可以讓人甘拜下風(fēng),但如果問(wèn)電腦一張照片有些什么問(wèn)題,它就無(wú)計可施了。雖然最新電腦中的硬盤(pán)容量遠遠超出了我們畢生所能記憶的東西,但硬盤(pán)上的信息依然是未整合的,系統中的每一單元同其他元素基本沒(méi)有關(guān)聯(lián)。
同樣的整合過(guò)程甚至能讓六歲小孩知道許多不協(xié)調的畫(huà)面是荒謬的,比如人在地毯上溜冰,奶牛變得透明等等。而確定一臺電腦是否有意識的關(guān)鍵也正在此處。這些明顯跟日常生活體驗背道而馳的現象,證明了人類(lèi)擁有精深的知識,知道哪些事件和物體可以同時(shí)出現,而其他絕大多數則不行。
我們依賴(lài)于這樣一種認識:只有具備意識的機器才能主觀(guān)描述普通照片里的場(chǎng)景是“對”還是“錯”。這種綜合判斷照片內容的能力是構成意識思維的一種基本屬性,比如看見(jiàn)大象蹲在埃菲爾鐵塔頂端,就能夠知道這不合情理。但現在機器尚不具備這種能力:即使是讓滿(mǎn)滿(mǎn)一房間的IBM超級電腦聯(lián)手上陣,也無(wú)法判斷畫(huà)面中哪些內容合乎情理。
如何測試電腦“讀圖”
測試電腦如何解讀圖像,并非必須采用向機器輸入測試問(wèn)題這樣的傳統的圖靈測試法。其實(shí)你只須在網(wǎng)上隨便找幾幅圖,沿垂直方向將每幅圖的中間涂黑,并用剪刀剪開(kāi),然后隨機將左、右兩部分拼合起來(lái)。這些合成圖像一般都左右不匹配,只有個(gè)別圖片的左右兩部分都來(lái)自同一張圖。電腦面臨的挑戰,就是要把左右匹配的圖片找出來(lái)。
把圖像中央涂黑,是為了防止電腦使用如今那些低級的圖像分析技巧,比如說(shuō)考察被拆散的各部分圖像之間的紋理或色彩是否相配。這種基于拆分圖像的測試方法要求電腦具備先進(jìn)的圖像解讀技術(shù),并能夠推斷圖像各部分的搭配是否和諧。
另外一種測試則是將若干物體放進(jìn)幾幅圖像中,使得所有圖像看起來(lái)都還正常,只有一幅圖像有問(wèn)題。接受測試的電腦必須找出這個(gè)異類(lèi)。比如計算機前面放著(zhù)鍵盤(pán)也理所當然,但如果是盆栽植物,那就不合適了。
許多計算機算法是通過(guò)收集顏色、邊緣或紋理之類(lèi)圖像特征,并采用低層次統計數據進(jìn)行匹配。這些方法或許還能應對單一測試,但在多種不同圖像測試面前,就無(wú)能為力了。這些測試方法離真正實(shí)用還有一段距離,但是,在應用這些方法后,我們發(fā)現,人類(lèi)的意識感知功能涉及海量的整合知識,而相比之下,機器視覺(jué)系統的知識實(shí)在是太過(guò)狹窄和專(zhuān)業(yè)化。
想擁有意識要“學(xué)學(xué)”大腦結構
了解這些后,我們近期可以期待些什么呢?如果某項任務(wù)可以獨立出來(lái),不與其他任務(wù)有牽連,那么它可以由機器來(lái)承擔。高速算法能夠飛快的在龐大的數據庫中進(jìn)行搜索,并在國際象棋比賽和“危險邊緣”節目中戰勝人類(lèi)選手。復雜的機器學(xué)習算法經(jīng)過(guò)訓練后,可以完成面部識別或者偵測行人等工作,效率比人類(lèi)更高。
我們可以輕松地想出許多場(chǎng)合,讓機器人去完成日益專(zhuān)業(yè)化的任務(wù)。先進(jìn)的計算機視覺(jué)系統日臻成熟,不出十年,一種可靠的、基本上自主的駕駛模式將成為可能。但我們估計,這類(lèi)機器視覺(jué)系統還無(wú)法回答與汽車(chē)前方景象相關(guān)的簡(jiǎn)單問(wèn)題,仍然不會(huì )有意識地感受到出現在它前面的場(chǎng)景。
但我們也可以設想另一類(lèi)機器,它可以把世上各種事物間無(wú)數錯綜復雜的關(guān)系,整理成知識并納入高度整合的單一系統中。如果問(wèn)這類(lèi)機器“這幅圖有什么地方不對勁兒?”,它會(huì )自動(dòng)給出答案,因為圖中任何與現實(shí)不符的地方都不可能滿(mǎn)足系統中的內在約束條件。
這類(lèi)機器或許可以從容應對那些不能輕而易舉分解為若干獨立任務(wù)的事情。由于具備整合信息的能力,它應該會(huì )有意識地感知某一場(chǎng)景。在我們看來(lái),為了實(shí)現高度的信息整合,它們不妨借鑒哺乳動(dòng)物的大腦結構。這類(lèi)機器在接受上述各種測試時(shí)將輕易過(guò)關(guān),從而能與我們共享意識這個(gè)大自然賜予人類(lèi)的最神秘禮物。