科學史沙龍

一頭栽進巨量資料大觀園

科學背景的黃一農,近年投入巨量資料與紅樓夢研究,希望在快速變遷的時代,提供文史研究新方向。

撰文/高英哲

科學史沙龍

一頭栽進巨量資料大觀園

科學背景的黃一農,近年投入巨量資料與紅樓夢研究,希望在快速變遷的時代,提供文史研究新方向。

撰文/高英哲


台灣大學科學教育發展中心自2014年10月開始,舉辦「科學史沙龍」系列講座,邀請不同領域學有專精的老師,來跟聽眾分享科學史上的有趣故事,或是別出心裁的另類觀點。以「沙龍」為名,希望有別於傳統演講的嚴肅印象,聽眾能在宛若文藝沙龍的輕鬆氛圍下,自在跟講者交流。「科學史沙龍」通常一次邀請兩位講者,針對相關主題各自主講大約40分鐘。然而當我們邀請清華大學歷史研究所教授黃一農來談巨量資料的紅學應用時,黃一農卻希望把整個下午的時間都留給他,因為他有太多東西可講。


黃一農的學習背景一直都是理科:在台灣讀完物理系,出國取得天文學博士;然而,他在回國後卻進入歷史研究所,從事科技史研究,近四、五年來更全心浸淫在《紅樓夢》的世界。有聽眾問到黃一農為何如此頻繁轉換領域,黃一農說除了他生來遊戲人間,覺得什麼好玩就一頭栽進去,最主要希望從《紅樓夢》這個原本全然陌生的領域,證明現在對於文史研究者來說,是一個最特殊的時代。這怎麼說呢?


「兩星沉速」之謎


原因是短短不到十年,上百億字的清代文獻已可提供線上檢索。也就是說,現在可以運用巨量資料的觀念,幫我們解決文史研究的一些疑難雜症。


黃一農以《紅樓夢》第四十三回為例:賈寶玉要買香,婢女茗煙提醒不需要買,他的小荷包裡常有散香,找一找說不定就有,於是寶玉從衣襟裡拉出荷包,摸了一摸,「竟有兩星沉速」。這個「兩星」是什麼意思?


歷來研究紅學的人對此莫衷一是,有人主張是「兩小塊」,也有人認為「星」是單位。像這種沒有定論的問題,即使上網輸入關鍵字,也很難爬梳出個頭緒。現在有了巨量資料就比較有機會,但不是說有個現成的維基百科可以輕鬆找線索。應用巨量資料的好處是,可以找到一些可能藏有答案的文典,這些文典若依傳統研究方法,絕對風馬牛不相及、不會想到可用來尋找答案。


黃一農指出,要用巨量資料來做文史研究,首先要知道怎麼問問題。如果你認為「星」可能是一種計量單位,那就要用「一星」、「兩星」去搜尋,因為這才是「星」做為一種計量單位時,可能出現的詞彙。然後你就會在資料庫裡,找到以下資料:「每歲仲秋各捐金三星」、「送去白紙一幅、潤筆銀三星」、「每車不過銀三星餘」、「每石值銀三星」、「一栽之直,當銀五星」、「每石值銀三星」。


從上述文句的脈絡,幾乎可以斷定,「星」的意思絕對不是「幾小塊」,而是中國古代的一種精確重量單位。接下來你自然會問:一星究竟多重?同樣可以用巨量資料搜尋,答案就藏在一般文史研究者沒事絕對不會翻閱、多達上千卷的《欽定大清會典則例》,書中記載各種量器的單價:「星,每箇銀九分九釐九毫。」


進一步追問,一星要用什麼工具稱量?答案是「戥(讀音ㄉㄥˇ)子」。可別小看這個不查字典、大概沒有人會唸的量秤工具,黃一農說像是「零星」、「平等」、「等量其觀」等詞語,其實都源自戥秤的使用方式。《紅樓夢》第五十一回裡就有一段,婢女麝月跑到寶玉房裡翻箱倒櫃,找到幾塊碎銀和一把戥子,便拿了一塊銀子,提起戥子來問寶玉:「那是一兩的星兒?」


麝月這個問題是什麼意思?這表示戥子上面有刻度,但麝月不知道哪個刻度表示一兩。如果是20年前,科學史研究者別無他法,只能向收藏戥子的博物館借出來瞧瞧。現在,除了拜Google大神以外,還可以上購物網站搜貨。黃一農就真的把購物網站上某個價位的戥子全部買回來,成為全台灣最大的戥子收藏家。每個戥子上刻度各有不同,只有熟悉的人才知道怎麼使用,這就是為什麼麝月會問寶玉那個內行人才曉得的問題。


用巨量資料考證八卦


黃一農再舉清史上最大的八卦,說明巨量資料在歷史研究上的應用:福康安到底是不是乾隆的私生子?即使現在有了資料庫,直接問「福康安是不是乾隆的私生子」只會查到稗官野史,因此必須構思切中要點的問題。


黃一農決定從這個問題下手:福康安的子女是否跟愛新覺羅氏婚配?透過巨量資料,黃一農在記錄清代皇室族譜的宗人府小玉牒中,發現福康安的獨子與兩個女兒都跟愛新覺羅氏婚配。福康安若是乾隆的私生子,就等於是堂姑姪與堂兄妹婚配。然而,婚事有沒有可能在乾隆不知情的情況下發生?細查福康安子女婚配年份都是在乾隆年間,照常理推論,乾隆即使沒來得及阻止第一樁親事,也絕對不會允許亂倫接二連三發生。這樣應該足以說服你,福康安不可能是乾隆私生子。


那麼為何福康安從小生養於宮中,一生備極榮寵?一查下去,黃一農居然查出或許是中國宮廷史上最淒美的愛情故事。民初爆料書籍言之鑿鑿,乾隆和孝賢皇后弟弟傅恆之妻私通生下福康安;但史料顯示的卻是乾隆對孝賢皇后的情深意重,愛屋及烏寵愛傅恆及福康安父子。黃一農也意外發現傅恆跟曹雪芹還有相當近的姻親關係。曹雪芹要聽到大觀園的種種,確實滿容易的。


黃一農透過巨量資料的應用例子,指出現代文史研究者最大的挑戰,不是在浩瀚的資料庫裡「盲搜」,而是如何整合傳統跟數位的研究方式。有聽眾提問要如何培養這種整合的功力,黃一農認為傳統的基本功還是要做足,才能問對問題,再利用巨量資料的新工具,獲致傳統研究難達到的成果,才不會被時代拋在後頭。

黃一農最後以「行行出狀元」勉勵大家,只是解讀的方式跟傳統不太一樣:每一行都只有一個狀元,所以關鍵並不是「狀元」,而是在「行行」──如何能跳脫傳統的框架,創造出一個你能夠出類拔萃的「行」。在巨量資料時代能夠做到這點的機會,遠比以前來得大多了,就看你懂不懂得運用這個新時代的利器。


更多相關文章

2017年10月188期這不只是女性議題 雜誌訂閱

本期最新文章