科學人雜誌
網路不打烊

請電腦看圖說故事

2016-02-01 陳煥宗
結合視覺和語言,人工智慧邁向新旅程。
現今社會對人工智慧懷有複雜的情愫:一方面對Siri宛如真人的對話系統、在電視機智問答中勝過真人的IBM華森嘖嘖稱奇;但對於無人汽車可能取代人類駕駛造成大規模失業,也不免忐忑不安。這些和人類未來息息相關的人工智慧研究涵蓋層面廣泛,其中「自然語言處理」和「電腦視覺」是實現人工智慧不可缺少的兩項關鍵技術。自然語言處理技術讓電腦透過文字和語言,解析人類想表達的意涵,進而與人溝通;而電腦視覺處理,則讓電腦藉由影像感知周遭人、事、時、地、物的狀態。這兩個研究領域各自發展了數十年,近年來技術漸漸成熟,成果已應用在日常生活中,例如自動翻譯、輔助寫作、人臉辨識、車輛與行人偵測等。既然兩項技術漸趨成熟,學者專家便開始嘗試結合這兩者,邁向更全面的人工智慧。例如2016年8月將於德國柏林舉辦的機器翻譯會議,就納入了多模式機器翻譯(multimodal machine translation)這個跨領域新議題的共同研究任務--同時提供照片與英文圖說,由電腦把圖說翻譯成德文。其特色在於要電腦系統既有語言能力,也要能辨識照片傳達的視覺資訊,使得翻譯更加精準。面對這項任務,機器語言學專家和電腦視覺專家一定要密切合作,...

登入會員以閱讀更多精彩內容

# 關鍵字:名家專欄網路不打烊
更多文章
活動推薦更多
追蹤科學人