資訊科技

電腦評比歷史事蹟

人工智慧判斷重要歷史事件的效力,比人類稍微好一點。

撰文/哈森(Matthew Hutson)
翻譯/鍾樹人

資訊科技

電腦評比歷史事蹟

人工智慧判斷重要歷史事件的效力,比人類稍微好一點。

撰文/哈森(Matthew Hutson)
翻譯/鍾樹人


2019年底,各大媒體不斷發表年度最重要的新聞,但是到了2039年,人們可能不記得這些報導之中的任何一條。一項新研究顯示,要預測哪些事件會寫進歷史,其實非常困難。


哲學家丹托(Arthur Danto)在1965年指出,即使最見多識廣的人(理想的編年史家)也無法判斷近期事件在歷史上的重要性,因為這要視後續發生的連鎖反應。美國賓州大學資訊社會科學家沃茨(Duncan Watts)一直想要測試丹托的假設,終於有了機會。哥倫比亞大學歷史學家康納利(Matthew Connelly)提議分析200萬封發送時間在1973~1979年且已解密的美國國務院電報,和一份由歷史學家在幾十年後編撰並收錄其中0.1%電報的摘要,這0.1%電報後來證實是歷史上最重要的電報。


康納利、沃茨和同事首先根據後設資料(例如電報所評定的緊急與秘密程度),計算每封電報的「感知同期重要性」(PCI)。他們在2019年9月《自然.人類行為》的論文指出,這個分數跟摘要所收錄的內容並沒有太高的關聯:分數最高的電報後來收錄到摘要中的比率,只比分數最低的電報高出四個百分點。最常見的預測誤差是偽陽性:有些電報得到高分,但後來證實並不重要。康納利說:「我真的認為人們對當前時空有某種自戀。運動迷說了無數次:『這一定是歷史上的重要時刻。』我一直對此感到訝異。」


接下來為了模擬理想的編年史家,沃茨等人決定「建立最強大且最高級的機器學習模型,然後輸入所有的後設資料與內容。」結果這個人工智慧(AI)演算法在表現上明顯勝過人類在當時的判斷。沃茨等人以統計方式測量AI演算法辨別歷史上重要電報的效力:分數「1」表示沒有錯誤的納入或排除,而AI演算法的分數是0.14,PCI的分數是0.05。研究人員指出,雖然演算法的表現遠遠稱不上完美,但這樣的「AI檔案管理人員」能為後代摘錄重要事件。針對這個目的調整AI演算法後,他們的模型剔除了96%的電報,剩餘電報裡有80%最終出現在摘要中。


耶魯大學社會學家艾瑞克森(Emily Erikson)並未參與這項研究,她評論雖然研究使用的資料並不完美(例如摘要所收錄的內容是根據少數歷史學家的主觀判斷),這項研究仍提供了實用的工具,並且證實丹托的假設。她說:「看到有人以機器學習實際測試這道概念難題,不但很令人興奮,而且認真思考起來也很有意思。」