聊聊科學人

讓資料對你說真心話──陳昇瑋

- 一年一度的台灣資料科學年會在今年7月登場,各方資料科學愛好者即將蜂擁而至。年會的發起人陳昇瑋期望,台灣政府與企業都能夠擁抱巨量資料,讓資料為我們所用,成為解決問題與創造價值的利器,讓台灣社會更有效率及競爭力。

撰文/洪志良

聊聊科學人

讓資料對你說真心話──陳昇瑋

- 一年一度的台灣資料科學年會在今年7月登場,各方資料科學愛好者即將蜂擁而至。年會的發起人陳昇瑋期望,台灣政府與企業都能夠擁抱巨量資料,讓資料為我們所用,成為解決問題與創造價值的利器,讓台灣社會更有效率及競爭力。

撰文/洪志良


今年6月1日中午12點,有一位男子緊盯著手機螢幕,一副蓄勢待發之姿,彷彿即將與數十萬歌迷搶購知名歌手演唱會的門票。不過他的神態自若,似乎胸有成竹,難道他早已透過特殊管道取得票??沒錯,他手中確實掌握所有的門票,那是第三屆「台灣資料科學年會」的票?,而他正是這場年會的總召集人──陳昇瑋。


陳昇瑋的另一個身分是中央研究院資料科學研究所的研究員,在繁重的研究工作之餘,身兼台灣資料科學年會總召集人,可不是徒有其名。他不僅一手促成這個年會,更是年年舉辦的核心推手。陳昇瑋談到2014年創立的初衷,緣由其實很簡單:因為台灣社會面對「巨量資料」(big data)的態度十分冷淡,好像巨量資料是國外發生的事,是各家媒體用來塞版面的外電新聞,與我們無關。


巨量資料浪潮已來


回顧2009年,巨量資料已經在國外大顯神通,網路巨擘Google的幾位工程師展現了巨量資料的價值。那時一種名為H1N1的新型流行性感冒病毒可能即將迅速蔓延,引發大規模感染,全球公共衛生組織都憂心這種新型流感。但是公衛機關是透過疾病通報來了解疫情分佈,無法即時掌控真實情況。Google的工程師藉由美國人最常搜尋的關鍵字,比對美國過往流感傳播資料,他們的想法是感染流感的人很可能會上網搜尋「流感」的相關資訊。結果,這些工程師確實猜對了。他們利用關鍵字與數學模型分析而得到的資訊,與真正的流感疫情正好吻合。在2009年H1N1疫情爆發時,公衛機關運用Google提供的資訊,有效控制疫情。


其實這些工程師在H1N1危機發生之前,就在著名期刊《自然》發表了他們的研究,預測美國即將再度遭遇流感大流行;那時電腦科學社群開始廣泛討論這篇論文。後來,越來越多人知道巨量資料的威力,巨量資料的聲勢便水長船高,不少人都對這個新興的名詞瘋狂,似乎一旦使用了巨量資料,面對任何困難的問題都能迎刃而解。


在一些先進國家中,巨量資料逐漸深入各個領域,開始發揮強大的影響力。舉例來說,我們每天上網搜尋資料,查詢便宜機票、飯店,或到購物網站挑選商品,這些看似尋常的行為都已經成為巨量資料的一部份。如果你上網時注意到網頁廣告的內容,你會發現廣告內容與你瀏覽過的某些資訊有關,這就是巨量資料在廣告界造成的衝擊,也是影響全世界的熱潮。2012年,《紐約時報》更在一篇文章提到:「歡迎來到巨量資料時代。」可惜台灣政府與企業似乎沒有看到這股浪潮,台灣社會並沒有引進巨量資料。


在那之後,每隔一段時間,有人從國外回到台灣,宣稱他們眼見巨量資料如何改變世界,台灣企業應該也要跟進。在他們眼中,巨量資料就只是口號,每個人都在喊,卻沒有人願意推行。


2014年,先進國家已經引入巨量資料好幾年了,台灣社會明顯落後。台灣政府與企業仍然把巨量資料當成國外新聞,例如加拿大森林大火,不是出現在我們生活周遭的事。陳昇瑋認為,台灣政府與企業面對巨量資料的態度不應該如此,其實透過資料科學可以讓我們的產業更有競爭力,讓我們的政府更有效率。


基本上,台灣社會沒有所謂的巨量資料思維,做事太重視個人經驗,認為只要有適當的人做事,就可以改變現況。雖然在過往時期,有經驗是很重要的事,但在巨量資料時代,數據、事實與經驗應該並重,個人經驗其實非常有限。而且台灣一向缺少分享的文化,陳昇瑋覺得一定要改變這種現象。再者,引進巨量資料固然重要,但如果我們缺少分析工具,徒有再大量的資料也用處不多。因此透過資料科學,有系統地分析資料,讓資料對我們「說話」,台灣社會就能擁抱巨量資料,把許多事做得更好、進步得更快。


「沒有人」推廣


今天回想起來,陳昇瑋似乎是推廣資料科學最合適的人選。若從政府來看,公家機關經常被法令、政策與經費束縛,窒礙難行;如果交由產業界來做,因台灣向來較少開放分享的文化,他人可能會起疑,認為該企業一定是在利益驅使下才這麼做,缺少公信力。然而學術界,每位研究人員初期都背負升等的壓力,就算免去升等壓力,基本上,不是繼續專心進行研究,就是開始轉做行政管理職務。所以這個人既要熟悉資料科學領域,同時又沒有升等壓力,剛好也沒有行政管理職務的負擔。


陳昇瑋從博士班開始,與「資料」這個夥伴已同行了十多年,雖然嚴格來說沒有待過產業界,但也熟悉學術界與產業界,累積了相當的人脈,更有熱情。而且他的學術生涯算是順利,取得博士學位不到九年,就升等為研究員。他笑說:「升等壓力當然很大,不過該做的事咬著牙也得做。」在各方面條件都算齊全的情況下,陳昇瑋覺得捨我其誰,當「沒有人」做這件事時,他就來當這個「沒有人」。於是他捲起袖子,聯絡各方人馬,從企劃、贊助、找場地各種大小事情都親力親為。


當陳昇瑋著手處理年會各項事務時發現,其實大家都希望有人來推廣資料科學,每個人都知道這件事的重要性,只是沒有人開始做。而且產業界有著很強烈的人才需求,卻沒有適當或適合的管道。因為實際上台灣很少有企業知道該怎麼提出這類職缺。所以當陳昇瑋聯絡企業尋求贊助時,不少企業都希望獲得年會票?,並到現場發送徵才傳單,甚至在年會擺攤或進行人才媒合。


因此陳昇瑋打定主意,要提供台灣做資料分析的人一個舞台,一個可以分享及交流經驗的平台。他的想法是,「期待資料分析在台灣不再是口號,而是大家手邊隨時可用來解決問題及創造價值的工具。」他表示,推廣資料科學的過程中得到許多企業的熱情協助,大家都認同資料科學的潛力及未來性,同時也求才若渴,因此尋求這三屆年會的贊助堪稱順利,十分感激所有支持年會的朋友。


雖然每屆年會都有許多演講場次,但陳昇瑋嚴格控管演講內容的品質。他會篩選年會演講者,先聽過演講者的(錄影)或看過演講簡報,確定內容及表達能力有一定水準且深入淺出,能達到推廣資料科學的目的,才安排演講者上台。他說,不論是誰,若無法事先確認演講風格及內容,絕不能直接上場演講。「即使你是贊助商,我很感謝你,我會邀請你來參加,但要上台給演講,一定還是要符合年會對於演講者的規則,絕不能辜負聽眾的信任及期待。」


分享交流才是重點


6月1日過晌,第三屆台灣資料科學愛好者年會的主議程門票早已販售一空。陳昇瑋看著手機滿意地點頭,但是仍帶著一絲感慨。原因在於,購買交流晚宴套票的人數並不多。


即使已經連續三屆舉辦這樣的年會,但大家對於參與交流晚宴還是不太踴躍。陳昇瑋覺得十分可惜,他說交流晚宴應該才是主角,參與交流晚宴是整場年會最重要的事。晚宴的目的不是吃飯,而是認識各方人馬,學到許多只聽演講學習不到的知識與技術, 這在學術界早就是眾所皆知的事。學術研討會的論文可以在會後詳細研讀,演講是聆聽演講者分享看法,但最重要的還是研討會期間的交流。當你認識演講者後,就有機會請教論文中沒有寫明的事,而且有很多第一手經驗與觀察可能無法以演講或論文這種方法表達。第一屆年會的晚宴門可羅雀,所幸今年,午後不到一個小時,第三屆交流晚宴的所有套票也全都售出。


今年台灣資料科學年會一張主議程的門票售價是超過4000元,但每年都會調整,票價調整的主要原因是目前年會仍然仰賴企業贊助。陳昇瑋說,他希望日後的年會透過售票就能夠維持運作,也能邀請來自國外具有第一手經驗的資料科學家來進行分享,讓政府與產業界真正動起來。


陳昇瑋表示,他更希望政府與產業界的主管及高層都能來這個年會聽講、參與,能了解資料科學不只是工程師的責任。因為如果我們只是期望自己實力變強,只想著個人好,可是整體環境不好,社會還是不會改變;唯有整體環境改變,身處其中的個人才會更好。這應該是所謂的正向循環,也是陳昇瑋心中的期望。


最終,回歸陳昇瑋的目標:建立一個分享、交流的平台,讓做資料科學的人都能善用手邊的工具,隨時與其他人進行交流,或者透過小型的工作坊,以各式各樣的方式推廣資料科學,如此一來,才會更凸顯這個年會舉辦的意義。雖然今年的台灣資料科學年會是在7月中旬舉辦,但陳昇瑋已經開始著眼明年的規劃,他期望明年的會議人數至少是今年的兩倍,讓更多的資料科學愛好者有個舞台可以發光、交流,讓更多人能夠參與,也讓台灣真正進入資料科學的時代。


更多相關文章

2017年12月190期記憶之網 雜誌訂閱

本期最新文章