資訊科技

AI影像真假難辨

人工智慧的新技術已能製作唯妙唯肖的假照片。

撰文/格內麥爾(Lawrence Greenemeier)
翻譯/甘錫安

資訊科技

AI影像真假難辨

人工智慧的新技術已能製作唯妙唯肖的假照片。

撰文/格內麥爾(Lawrence Greenemeier)
翻譯/甘錫安


假照片和攝影技術的歷史差不多同樣久遠,花仙子和尼斯湖水怪的照片就是著名例子。Photoshop軟體把影像處理帶進了數位時代,現在人工智慧(AI)讓影像變造技術更上一層樓。人工神經網路可分析數百萬張真人和景物影像,並以此做出幾可亂真的偽造影像。


受到人類大腦構造所啟發,人工神經網路是由許多人工神經元互相連接所構成。多年來,Google、臉書等公司都使用人工神經網路協助其軟體辨識出影像中的人。有種新方法稱為「生成對抗網路」(GAN),其中包含產生影像的生成(generator)網路和評估影像真實程度的鑑別(discriminator)網路。總部位在美國西雅圖的艾倫人工智慧研究所執行長伊茲奧尼(Oren Etzioni)說:「人工神經網路需要用幾百萬張範例影像來學習,GAN這種新方法則可自動產出這類範例。」


GAN也可以快速產生逼真的假影像。生成網路經由機器學習去研究大量影像,可製作出唯妙唯肖的虛構影像,接著把這些影像送往鑑別網路。鑑別網路能夠辨識出影像中的人,並可評估生成網路產出影像的真實程度。經過一段時間,生成網路變得更擅長製作假影像,鑑別網路也更擅長判定,這種網路因而稱為「對抗網路」。


GAN之所以能稱為AI的重大突破,在於它經過初步訓練後就可繼續學習,不需要人類監督。現任職於Google大腦(該公司的AI計畫)的研究科學家古德費洛(Ian Goodfellow)在2014年的論文裡介紹此方法,他是第一作者。此後,全世界許多研究人員嘗試把GAN用於機器人控制或語言翻譯等方面。


開發這類無人監督的系統是一大挑戰。GAN有時不會隨著時間而精進,如果生成網路無法產出越來越真實的影像,鑑別網路也無法持續進步。


晶片廠商輝達(Nvidia)已開發出訓練GAN的方法,有助於避免GAN學習受阻。這種方法的要點是同時漸進訓練生成網路和鑑別網路:先輸入低解析度影像,再隨訓練進程逐步加入新的像素層,添加高解析度細節。輝達的研究人員於今年4月的國際AI研討會上發表論文指出,這種漸進式的機器學習策略可縮減一半的訓練時間。研究團隊展示這項技術的方法是,以20多萬張名人影像的資料庫來訓練GAN,GAN產出完全虛構但栩栩如生的高解析度臉部影像。


GAN並不知道製作的照片是否逼真。參與此計畫的輝達研究人員雷提農(Jaakko Lehtinen)說:「我們選擇臉孔當成主要範例,原因是人類可以輕易判斷AI生成模型的成效。我們天生具有辨識臉孔的神經機制,生活中又不斷訓練及學習辨識臉孔。」這項挑戰在於如何讓GAN模仿人類的直覺。


臉書公司認為鑑別網路可依據使用者的過往行為,協助臉書更準確預測使用者想看的內容,終極目標是創造具備常識的AI。該公司AI研究院院長楊立昆(Yann LeCun)和研究工程師欽塔拉(Soumith Chintala)表示,他們理想中的系統「不僅要能辨識文字和影像,還要具有推論、預測和計畫等較高階的功能,足以比擬人類的思考和行為。」楊立昆和欽塔拉測試該公司生成網路的預測功能時,輸入影片前四幀(frame)畫面,由生成網路產生接續兩幀,最後合成出連續動作的影片,例如人在行走或擺頭的動作。


對需要低成本內容的製片人和遊戲創作者而言,栩栩如生的AI生成影像和影片極具價值。AI研究公司OpenAI研究人員拉德福(Alec Radford)評論道,即使GAN能產出「貌似真實」的影像,但要做到毫無瑕疵仍需努力。拉德福於2016年在國際AI研討會上發表的論文正是臉書目前工作的基礎,他是該文的第一作者。他補充道,要製作出高品質AI生成影片,還早得很。


人們是否會把AI產生的影像或影片用在線上惡搞等不當行徑上,還待觀察。此刻,大眾越來越懷疑線上內容的真實性,這類技術的問世恐怕只會雪上加霜。


更多相關文章

2018年8月198期跨越量子 走進現實 雜誌訂閱

本期最新文章