網路不打烊

甲骨文研究的數位福音

一度要費時半天的甲骨文字形查詢,現在只需一秒就能完成。

撰文/陳穎青

網路不打烊

甲骨文研究的數位福音

一度要費時半天的甲骨文字形查詢,現在只需一秒就能完成。

撰文/陳穎青

這幾年業餘研究甲骨文,投入不菲,買了好幾套重量級的工具書,例如一套十三巨冊的《甲骨文合集》、九本裝的《甲骨文字集釋》等,雖然都是在二手市場買的,但這些書跟普通書有個明顯不同的地方,就是定價都很硬,有些竟然是用原價賣,需要的人還是非買不可。

這些書部頭巨大,搬動不易,檢索起來也很困難,尤其因為不是正規字典,經常缺少注音檢索功能,更增查詢難度。注音檢索因為字音組合多(400多個音加上四聲變化,總數可達1300個組合),每個同音字組合收字最多不超過數十字,檢索起來簡單;而漢字筆畫總共就是1~24畫(25畫以上的字已經非常少),其中絕大部份又集中在5~20畫之間,這10幾個筆畫分類動不動就要收字數百,茫茫數百字中要找一個特定字,真是困難無比。再加上有些漢字筆畫不是那麼容易精確計算,查詢起來格外費心。

但這兩年,一個線上查詢工具解決了所有這些麻煩。

由中央研究院史語所和資訊所,加上台灣大學中文系共同開發的「小學堂文字學資料庫」(xiaoxue.iis.sinica.edu.tw),建站時間約在2013年,運作兩年來,解救了無數文字學研究者的惡夢。站上建置了許多古文字學的字形、字音、字義資料,字形資料包含「甲骨文、金文、戰國文字、小篆及楷書」,聲韻資料則涵蓋上古音、中古音、近代音、現代音,以及「晉語、吳語、徽語、贛語、湘語、閩語、粵語、平話、客語、其他土話」等資料庫。

這個系統還包括線上已經出版的辭典工具書,例如教育部重編國語辭典、異體字字典、CNS全字庫、開放康熙字典等。只要在字形欄輸入要查詢的字,就可以得到這些資料的所有連結。

這些資料庫本來是各自獨立的,因為它們本來就是不同學問,但透過關聯式資料庫的概念,就可以用一個共同的交集串聯在一起—那就是「字頭」,也就是各辭典、資料庫裡面做為條目字的那個單字。

每個漢字都有讀音,這是聲韻學資料庫的東西,每個漢字都有從甲骨文以來的字形,這是字形資料庫的東西,它們透過共同的那個漢字,忽然變成了一體。這是電腦資料庫強大的地方,過去我們為了找一個字,要在一套一套大部頭的工具書間查找,自行跨工具書整合所有查詢結果,光是「查詢」這個工作就要耗掉半天,現在則縮短到了一秒之間。


更多相關文章

2018年12月202期睡眠學習不是夢 雜誌訂閱

本期最新文章