資訊科技

人機共處的新世界

未來的人機合作,是讓電腦去處理它擅長的事,讓人類繼續處理自己擅長的事。

撰文/翁千婷

資訊科技

人機共處的新世界

未來的人機合作,是讓電腦去處理它擅長的事,讓人類繼續處理自己擅長的事。

撰文/翁千婷


2006年,當加拿大多倫多大學機器學習研究室的辛頓展開深度學習計畫時,人工智慧(AI)幾乎已淪為科幻名詞,他們是連研究生都招不太到的團隊。10年後,微軟研究院首席科學家霍維茲直言:「資訊科技業界的下一個戰場是人工智慧。」今年春天,臉書(Facebook)執行長祖克柏在公司開發者大會F8上發表,要在未來10年全力發展人工智慧與虛擬實境。一星期後,Google執行長皮蔡(Sundar Pichai)也跟進,在公司第一季財務會議上表示:「運算世界的重點將從行動優先(mobile first)走向人工智慧優先(AI-first)。」


當年參與深度學習的團隊成員今日已在學界與業界各據山頭。美國史丹佛大學的吳恩達先在2011年進入Google,成立專門研究深度學習的Google Brain計畫,並在2014年擔任百度首席科學家,領導百度深度學習研究院。紐約大學的拉昆與辛頓則學產兩棲,拉昆擔任臉書人工智慧研究室負責人,辛頓加入Google。


放眼這三年來資訊科技龍頭公司推出的服務與產品,幾乎全看得到深度學習的身影。Google語音助理Google Now、蘋果語音助理Siri、微軟Windows 10與手機平台的語音助理Cortana、亞馬遜的語音控制喇叭Echo等交談式機器人問世、Youtube的自動字幕、蘋果iOS最新的語音留言轉文字等,皆得力於深度學習訓練出來的語音辨識模型。臉書相簿更精確的人臉辨識、Google地圖的街景分析、自動駕駛系統的障礙物偵測分析等,是機器視覺大幅改善的成果。讓圍棋程式下棋功力一舉進步10年的AlphaGo,也是得到深度學習的加持,以4:1的比數擊敗世界頂尖的圍棋選手。


走出科幻世界、步入我們日常生活的人工智慧,首先引起了科學界的擔憂。


2014年在BBC新聞的訪談中,物理學家霍金首先開砲,認為完全成熟的人工智慧可能發展出自我演化的能力,甚至超過生物的演化速度,最終導致人類毀滅。微軟創辦人比爾蓋茲一方面讚賞人工智慧帶來的便利與商機,也不諱言能力強過人類的機器可能導致大量失業,人類最終可能無法控制機器。特士拉與SpaceX計畫執行長馬斯克不但諄諄告誡「人工智慧是人類生存最大的威脅」,更在2015年底與志同道合者成立非營利組織OpenAI,確保人工智慧的發展不會威脅到人類安全。


深度學習到底有何能耐,引發科學界這麼大的回響?人工智慧是人類的好幫手,還是披著羊皮的狼,伺機佔領人類世界?


此人工智慧非彼人工智慧


說到人工智慧,第一時間躍我們入腦海的,通常是涂林測試與機器人。涂林測試是人工智慧學者一直想要摘取的聖杯,機器人的種類更是多樣,諸如「星際大戰」系列中鋼皮鐵骨的R2D2與C3PO、「2001:太空漫遊」中非人形的電腦哈兒(HAL)、「魔鬼終結者」系列以毀滅人類為目標的機器人大軍、「銀翼殺手」中短命卻能力超強的生化人、「A.I.人工智慧」中真假難辨的仿生機器人大衛、「機械公敵」引人津津樂道的畫畫機器人,甚至到最近「人造意識」裡引誘工程師以幫助自己脫困的人造美女。


電影工業創造的機器人形象,模糊了我們對人工智慧的認知。研究自然語言處理、長期任職資訊科技業的林玉柱指出,膾炙人口的科幻電影如「機械公敵」、「A.I.人工智慧」中的用語雖然是機器人(robot)、人工智慧,講的其實是仿生機器人(android),兼具人類外形與智慧內在。社會大眾自然而然把這些概念混在一起,聽到「鴻海要用機器人取代工人」,腦海浮現的是仿生機器人,聽到「人工智慧」,也是想到仿生機器人。其實人工智慧的重點,是電腦運算的設計展現「智慧」,而非科幻電影裡機器人的「人模人樣」。即使長得不像人,甚至沒有長相(例如聊天軟體),也是人工智慧的展現。


中央研究院資訊科學研究所所長許聞廉從學術角度來看,他認為人工智慧的研究始於對人的關心,希望用電腦系統模擬人腦的運作,協助科學家了解人如何解決、思考問題。能夠達到這種目標的系統稱為「強人工智慧」,但是它需要對人腦有更多理解,目前認知科學對人腦的理解與神經運作過程的認識還很淺薄,難以在強人工智慧的研究上有所進展。在此困境下,人工智慧學者開始往「弱人工智慧」靠攏,不強求電腦能有「像人類一樣思考的智慧」,而是善用電腦的快速運算與記憶能力來達成「看似有智慧」的任務,例如下棋、翻譯。弱人工智慧只要電腦表現的行為或能力跟人類一樣就好,並不需要使用與人類相同的方式來完成目標。


深度學習是應用類神經網路發展出來的統計式機器學習演算法,在多項語音辨識與機器視覺競賽中,能夠把機器判斷的正確率提高10~25%,進入實用範圍。台灣大學資訊工程學系教授林守德認為,深度學習儘管看似潛力無窮,還是在弱人工智慧的範圍。電腦要變成完全人的智慧,在短時間內幾乎不可能。


真正的敵人是自己


機器覺醒統治人類的戲碼儘管不會在現實世界上演,人工智慧研究的成果卻早已滲透我們的生活,林玉柱說:「產業界擁抱人工智慧,著重在開發新應用,提升生產力與獲利。」Google應用機器學習演算法在Google AdSense廣告服務上已經10年了,亞馬遜產品的配送、倉儲流程,是經由機器學習演算法計算出來,而非人工安排;微軟網站上的產品支援頁面也是機器翻譯的成果。除非完全不碰資訊產品,不然可說只要用到電腦就會用到機器學習。更多的產品,只是擴大人工智慧應用的層面,讓我們更貼近Google的皮蔡所說的AI-first,也就是對人工智慧的依賴超過對行動裝置的依賴。


面對人工智慧,我們要擔心的不單是機器在近期內發展出來的智能,而是機器可能永無止盡地藉由自動學習增強自己的能力。與其列舉諸如客服、理財專員、組裝人員、技術手冊翻譯等預期將由機器取代的工作,不如從本質來看機器學習。許聞廉指出,機器學習是由人類控制,電腦只有計算速度與記憶體,全看人類怎麼使用這些模型。以這個角度來講,如果掌握某項特定技巧,與這個技巧相關的知識又可以做成模型,加上機器學習演算法輸入的資料越多、學習成果越好的特色,苦練之後就可以勝過人類。這樣的機器,理解力可能連三歲兒童都不如,卻可以在特定工作上贏過人類,是勤能補拙的最佳榜樣。


面對這樣強大的職場競爭者,許聞廉認為,工作被取代是一定會發生的。人們要思考的是做什麼工作比較不容易被取代。應付這種結構性失業的問題,是政府的工作,教育體系不是去訓練固定的技術性能力,而是訓練獲取新知識的能力。林玉柱強調,人的創意、探索未知事物的動機與好奇心,是人工智慧難以實現的。林守德指出,電腦的強項就是記憶力與計算能力超好,可以做很特定的工作,但不表示有全面的智慧,例如生活智慧就是電腦很難掌控的部份。人類的強項是可以即時接收不同種類的訊息,根據收到的訊息即時反應,對於電腦而言,凡是需要長時間與人互動、溝通的任務,會造成它的「搜尋空間」過大,以致無法找出最佳的做法。


人機合作的世界,是讓電腦去處理它擅長的事,人類繼續處理自己擅長的事。


學術界的挑戰


與業界不同,人工智慧研究人員追求的目標,在於找出人可以做、機器不能做的事情,並讓機器可以做到。


林玉柱說:「人工智慧與機器人學的發展中遭遇一個現象,稱為『莫拉維克弔詭』(Moravec's paradox),就是人類認定的高等智慧能力(例如推論)只需要很少的計算就可以完成;而幼兒就能完成的事情,例如到處爬、辨識物品、學習語言、把玩具拿起來丟人,要在機器上實現卻非常困難。」


以讓深度學習在學界奠定地位的大規模視覺辨識競賽(Large Scale Visual Recognition Challenge, ILSVRC)來說,就算是系統配備了高速圖形處理器(GPU),要看超過120萬張事先用人工標示好類別的圖片、建出分類影像的模型,也得花上一個星期的時間。


2012年,吳恩達帶領的Google Brain深度學習系統計畫,從YouTube影片中擷取了1000萬張沒有標示類別的圖片輸入給Google Brain,三天後系統可以自行把圖片分類成人臉、人體、貓。Google Cultural Institute計畫的系統更進一步到把700萬張藝術收藏品,分成4174個類別。林守德解釋,在深度學習以前,機器視覺的做法是從圖片的像素找出特徵,把特徵放進系統加以訓練並建出模型,之後由模型去分類影像,但是深度學習不需要這個步驟,就會自己找出特徵並分類影像。


換句話說,深度學習演算法造就機器學習速度與效率上的突破,讓某些過去認為人類可以做、但是機器做不到或做得很差的事情,現在不但機器可以做,而且做得比人類更好了。


人工智慧研究社群一方面探索深度學習可以應用的層面與限制,同時也繼續開發其他學習方法,甚至挑戰更多人類不能做的事情。


在機器學習應用的部份,研究人員與不同領域的專家合作,把特定領域的資料輸入到深度學習模型裡,讓系統從資料中找出特徵或規則。林守德表示,機器學習與不同領域專家的合作是在前期,也就是把資料輸入電腦之前的這段期間。林守德的團隊與法律學者合作,希望讓系統可以讀懂判決書進而自行產生判決結果,這時就會需要法律專業上的協助,標出判決書中重要的內容,以便從文本中擷取有助於產生判決的知識。


深度學習模型擅長從抽象底層的資料中擷取出有用的特徵,在搜尋範圍小、輸入的資料本身對人類而言較難判讀的領域中表現得特別好,例如影像、圖片、聲音,其基本組成元素是比較底層的像素或是聲波。但是當資料本身具有特定意義,要系統再去擷取出抽象意義,效果就不一定會好。林守德的團隊曾經想要利用電腦判斷某些研究計畫的申請是否會被接受,他們輸入了研究計畫的內容、計畫申請者的背景與研究記錄等,發現利用深度學習系統來學習這樣的判定,結果並不會比利用一般機器學習的方法好。


開發出自然注音輸入法、長期鑽研自然語言處理的許聞廉直言,所有的統計式機器學習模式都有個共同缺點,就是出錯的時候沒有辦法解釋。他說:「我們認為是語意的運算,在統計模型都變成了參數的運算。統計式模型在學習過程是調整參數。用白話講,我們訓練了一個辨識狗的模型,如果輸入一張狗的照片,機器認不出來,統計式模型無法告訴我們為什麼機器認得出其他照片裡的狗,卻認不出這張照片裡的狗。AlphaGo下棋很厲害,但它靠的是從無數高手下的棋譜中統計出勝率,而不能像圍棋高手一樣說出自己為什麼要這樣下。」他理想中的機器不是光會做一個題目,而是要能夠教人怎麼做。


美麗新世界


在許聞廉看來,電腦的計算能力雖然早已遠遠超過人腦,卻因為看不懂文字題目,連小學的數學應用題都算不出來。他目前最主要的研究方向是讓電腦可以幫人讀書,因為研究工作要讀很多新的研究論文,人自己讀這些文章要很久,機器雖然可以讀得很快,但是理解得不好。領導Google人工智慧研究的詹南德雷亞(John Giannandrea),在回答《麻省理工科技評論》(MIT Techonology Review)舊金山分部主編西蒙奈特(Tom Simonite)詢問「如果現在是人工智慧的春天,那人工智慧的夏天何時到來?」時,也給出類似的回答。他認為,機器翻譯是把一個句子用另一種語言表達出來,但機器理解是機器能夠讀進一個句子,用同樣的語言換個方式說出來,要等到那個時候,才有可能說是人工智慧的夏天到來。


林守德也不諱言,深度學習雖然在機器視覺上大勝以往的學習方法,但是在機器翻譯等自然語言處理上,以深度學習為基礎的系統,仍比不過以往機器翻譯提出的最佳方法。這幾年來,研究學者也在思考怎麼把人類的知識建入機器學習系統裡,如果能夠在統計為主的方法上,放進去相對應的知識,便有機會突破統計式學習的瓶頸。


對於人工智慧研究的未來,林守德跳脫人腦與電腦的比較,認為人工智慧在未來最大的貢獻,不是模仿人類可以做到的事,而是做出人類做不到的事情。例如:發現新元素、合成新藥、快速交易等,這些是人的智慧做不到的事。他研究的方向不是機器學習,而是機器發明:讓電腦能夠發現人類還沒有發現的新東西,例如破解密碼、從社群網路偵測人與人之間的關係、找出恐怖份子等。這並不是讓電腦學習,而是應用電腦的計算能力與記憶能力,做出超越人類智力可及的工作。他相信唯有解放人工智慧,讓人工智慧不再局限於模擬或追趕人類智慧,人工智慧方能達到新的境界。


會讀書、考試、寫作、合成新藥的機器人─科學家的目標彷彿又把我們帶回科幻的機器人世界。然而也就是這樣不放棄探索的決心與毅力,讓辛頓與其研究同仁,以及無數科學研究工作者可以熬過研究長期不見進展的低谷,終於創造出革命性的突破。