從國語辭典到多語辭典-科學人雜誌
網路不打烊

從國語辭典到多語辭典

2015-05-01 葉平
萌典的演化,正是政府開放資料造就的美好民間服務。

報載行政院院長毛治國今年2月5日在行政院會宣佈正式啟動「Open Data深化應用元年」。筆者2013年4月在這個專欄寫過〈開放資料拯救政府網站服務〉一文,提到「萌典」這個以教育部字典的資料開放打造出來的非營利網站和手機應用程式,兩年多來,教育部和萌典都有很大的進展。

過去這幾年以來,教育部有不少資料逐漸採用「創用CC姓名標示–禁止改作3.0台灣」或類似的開放授權,讓想要使用的人不再需要擔心是否侵權。在現行著作權法、政府採購法等法規框架下,能走出這一步,要向教育部承辦人員和各級主管喝采!

萌典彙整了教育部辭典、閩南語、客家語、筆順、真人發音等資料,讓想要學習這些語言的人可以一覽無遺,無需穿梭於多個網站中搜尋;除此之外,還引入了甲骨文、金文篆書等歷代字體,在一個應用程式裡,交互參考無比容易,只要一個點擊就能查詢細節。

萌典成形後不久,就引起學習中文的外國人注意,感到非常受用,也一同來響應,於是中英、中法、中德的翻譯字典出現了。這就是開放資料的威力。

在萌典之前,這些寶貴的資料原本各自存在於不同網站,各有各的查詢介面,彼此互不相連。剛學會一個詞,想知道這個詞閩南語怎麼唸?必須找到「台灣閩南語常用詞辭典」的網頁入口。想知道筆順怎麼寫?必須找到「常用國字標準字體筆順學習網」。想多了解這個詞在古籍中的使用方式?必須找到「重編國語辭典修訂本」。這樣的學習過程和在圖書館查紙本辭典本質上沒什麼差別,只是省了搬辭典磚頭書而已,非常不符合網路時代的學習方式。

人們習得新知的方法,本就是組合已知來構建新知。網頁超連結的設計,就非常適合套用在字典上。萌典取得資料、重新設計應用、把資料互連,每個詞和例句中用到的詞,都連結到對應的定義。忽然之間,知識之間的無形聯繫落實為有形的超連結,辭彙生動了起來。再加上發音、歷代書法字體、閩客英法德語,彷彿看到知識在眼前閃閃發光!


更多文章
活動推薦更多
追蹤科學人