中研院-挑戰卓越系列

用愛研發「好東西」-廖弘源沉浸多媒體的繽紛世界

撰文/中央研究院

中研院-挑戰卓越系列

用愛研發「好東西」-廖弘源沉浸多媒體的繽紛世界

撰文/中央研究院


2000年,中央研究院的椰林大道上徐風吹拂,資訊科學研究所研究員廖弘源漫步思索,剛好巧遇院長李遠哲,李遠哲問他,對這一生的研究有什麼願景?正值不惑之年的廖弘源志向遠大,他說:「這一生要研發五樣好東西。」近20年時光過去,今日廖弘源已是資訊所特聘研究員,五樣好東西已達成三樣。他說,特聘研究員70歲才退休,還有時間,他和他的團隊始終努力著。


良品好物不勝枚舉


其實這些年來,在廖弘源與團隊投入的多項研發中,不乏產學界認為的「好東西」。例如去年他就以研發人臉辨識、雞尾酒浮水印、影像修復等多媒體視訊處理技術的成就,榮獲第23屆東元獎。


人臉辨識技術是廖弘源從身分證上的大頭照獲得靈感。當時相關系統都使用大頭照來訓練辨識器,並把照片中每一個像素當成有效資料,但他疑惑,辨識人臉不是應該由觀看「五官」來決定嗎?於是1999年他和當時的博士生陳麗芬經由機率統計理論驗證,若使用大頭照來執行人臉辨識,由於五官只佔20%面積、其他部分佔了80%,系統會以「非人臉」部分主導整個辨識過程;他們是首度用量化方法證明此事的實驗室。這結果使得全世界所有使用統計方式執行人臉辨識的系統都必須更改他們的人臉資料庫,此研究也被學界認為是該領域入門必讀的20篇論文之一。


1990年代中期後,透過網際網路傳輸數位資料益發普遍,保護這些數位多媒體的需求應運而生。1999年廖弘源以組合多種抗愛滋病毒藥物的雞尾酒療法為發想,與博士後研究員呂俊賢研發同時嵌入兩個功能互補的浮水印,使它們在承受攻擊時互相掩護,當其中一個遭破壞時,另一個仍可存活;當兩者同時受到不同的嚴重攻擊,資料就會被摧毀,想盜取也徒勞無功。這項成果成為當時世界上最強健(robust)的數位浮水印之一,並獲得多國專利。


網路搜尋在此時期也蓬勃發展,其中視訊內容的搜尋當屬難度最高,關鍵在於如何從龐雜的視訊資料中抽取出具高鑑別率的特徵。廖弘源從電影拍攝去思考,在同一個鏡頭(shot)下的影片,一致性高,能夠自動偵測兩個相鄰shot的變化(或稱換景)是技術關鍵。而對觀者來說較不具突兀感的慢換景(gradual transition)是拍片者最常用的手法,其中又以溶解式慢換景(一邊影像慢慢淡出、一邊漸趨清晰)最常見。2000年代初期他與當時的博士生蘇志文正確定義出溶解式慢換景下的像素移動,有效分開視訊中的「運動」及「換景」兩件事,大為提高視訊檢索的可行性。


除了從生活中找研究題材與靈感,廖弘源也借師其他學門的專業知識。他把知名美國認知心理學家畢德曼(Irving Biederman)、霍夫曼(Donald D. Hoffman)等人所提出,人類辨識物體時並非完整看完物體後才確認,而是由物體具特徵性的某些部位判別其屬性或種類,這樣的概念應用在三維物體辨識,打破了在資訊科學領域,要電腦辨識物體必須詳加描述的根深柢固想法。這類認知心理學理論視物體的突出程度、相關大小,以及主體與邊界強度等特徵為該物的「重要部位」,2000年代初期,他與當時的博士生林學憶以資訊科學驗證這樣的概念,並將其轉化成電腦程式。


2006~2013年廖弘源接下了「數位典藏與數位學習國家型科技計畫」技術研發分項總主持人,負責因應並解決在判讀、註解、搜尋、擷取、儲存、保護乃至修復這些國家級數位典藏資料時的種種技術需求。其中,影像修復是重責大任之一。老照片的影像品質不佳,主要出自低對比區域,由於灰階值變化小,影像便顯得模糊。廖弘源和研究助理蕭敦育研發的版調調整(tone reproduction)技術,讓系統自動找尋照片中的低對比區域,接著在雜訊不被人類視覺察覺的前提下,適度放大對比值,最後還需處理有經調整與沒有調整的影像邊界,使其平順自然。


模糊可變清晰,但無中可生有嗎?老膠卷常因發霉、蟲蛀而有影像缺損的狀況,廖弘源與清華大學電機系教授林嘉文、資工系教授許秋婷以及他實驗室的博士後研究員譚家棟、當時的博士生凌誌鴻共同研發視訊篡改術(video inpainting),讓珍貴的歷史影像得以重現。所謂篡改並不是憑空捏造,而是讓電腦自動擷取缺損處周邊完好的影像資訊,並運用內插像素的方式重建消失的影像。此技術在2011年技轉給國家檔案管理局。


之後廖弘源與凌誌鴻進一步挑戰動態影像的修補。由於人類動作屬於高維度的肢體運動,電腦計算起來相當複雜,廖弘源團隊採用稱為ISOMAP的技術把人的姿態轉化成空間中的一點,連續動作則轉變成點的軌跡,中間斷續之處便可用預測軌跡的方式接續,當軌跡填補完成,最後再把人物合成回去。


此外,廖弘源的研發也獲得產業界肯定。2008年,廖弘源與博士後研究員陳敦裕、孫士韋及曾易聰協助桓基科技公司,在三個月內開發出在電視牆前看廣告的人數計算系統,準確率達90%,此技術也獲得當年度經濟部中小企業創新研究獎等獎項。2010年代初期,廖弘源與資訊科技創新研究中心副研究員林彥宇及實驗室的博士後研究員翁明昉、譚家棟以這項技術為基礎,擴大偵測範圍,經由精算人群面積與相互遮蔽面積,開發出能處理任何視訊中的人數計算系統,例如,計算戶外紛雜的走動人群,未來可應用在公共場域依人數調控各項設施例如燈光、空調。。



另一項奠基於人數計算系統但難度更高的技術,是搜尋或擷取視訊中具特定動態條件的片段。他們利用Kinect體感技術建構人體的深度及三維骨架動作資料庫,用來比對視訊中人物的連續姿勢,也就是執行動作辨識,這項技術可應用於有效搜尋數位典藏龐雜的影像資料以及行為分析。


要做注重人、懂思考的科學家


目前廖弘源有超過50篇論文刊登於知名學術期刊,例如電機電子工程師協會(IEEE)系列期刊,其中更有多篇被引用超過上百次,並有多項技轉技術,但他都謙稱這是「在研究做不出來時陪他一同跑步、跑不動就大吃一頓」的實驗室「寶貝們」的功勞。從他平時與學生的相處中,也可看出他是重感情的人。廖弘源說:「愛是父母給我最大的資產。我也常告訴學生,要懂得愛別人、關懷別人,貪名利、只求快速成功,無法走得長遠。」


他也常勉勵學生,要做科學家、不要只做工程師;前者用系統化方法解決長遠問題,後者只用既有方法解決當下問題。他以寫論文為例,如果研究做得很好,但論文引言寫不出來,就表示其實沒有充份思考過;論文是傳達知識的工具,必須把知識藏在裡面並交代研究脈絡。


保護智慧財產、守護珍貴史料、社會安全應用、使人們的生活更加便利……廖弘源始終朝「研發好東西」的路上走,而引領他的,是一顆愛人的心。


更多相關文章

2017年12月190期記憶之網 雜誌訂閱

本期最新文章