生命科學

Google與我交換記憶

現代資訊技術改變了搜尋引擎的面貌與角色,只要一個點擊動作,搜尋引 擎就會為我們的生活提供一定程度的協助,成為我們不可或缺的夥伴。

撰文/張俊盛

生命科學

Google與我交換記憶

現代資訊技術改變了搜尋引擎的面貌與角色,只要一個點擊動作,搜尋引 擎就會為我們的生活提供一定程度的協助,成為我們不可或缺的夥伴。

撰文/張俊盛

重點提要
■現代人的生活大小事已少不了搜尋引擎的協助與記憶,「查詢Google」成為許多人每日必做之事,而Google也持續推出令人驚奇的服務與功能,便利大眾的生活。
■Google把知識圖譜定位為通俗、實用且簡潔的百科全書,與維基百科收錄的專業語詞條目有所區別,並利用圖書資訊的詞學概念有效連結各式資料。
■經由記錄網路上的巨量文字資料,Google搜尋引擎可用來檢查文法錯誤,透過研究Google語料庫能協助建立數位化詞彙索引典。人們與搜尋引擎交換的不只有記憶,還有語言知識。

記憶就像貨品與服務,可以拿來和別人交易,用最少的心力獲取更多的經驗與收穫。記憶也可以透過集體編輯、儲存、擷取,更有效地分享運用,這是36頁〈Google效應——搜尋引擎如何改變你的心智?〉作者之一韋格納(Daniel M. Wegner)早在1985年提出的交換記憶概念。此概念讓我想起許多世界史(例如麥克尼爾父子所著的《文明之網》)都會提到文明起源於城市,就是因為城市的密集互動,讓人們更容易進行專業分工與互助。人們不只是在勞務和工藝上能互助,知識與記憶也能有所交換,而文字的發明,更讓這樣的互助與交換超越時空,無遠弗屆,歷久不衰。

而今,網路的發展顛覆了人類長久以來的交換記憶。我們開始和虛擬世界的網路服務做交易,也相當依賴搜尋引擎,人與人之間的互動減少了,取而代之是「去查Google」!

每一個Google服務都是交換記憶的夥伴

其實,我們交換記憶的對象不只是搜尋引擎,還有Gmail、Google行事曆(Google Calendar)、Evernote、Google學術搜尋(Google Scholar)、Google學者側寫(Google Scholar Profile)、Facebook、Stackoverflow等。搜尋引擎幫忙我們記憶公共領域的知識、Google行事曆記憶個人行程、Evernote記憶筆記或帳號密碼。Google學術搜尋會幫忙記住學者發表的論文和論文下載位置(,Google學者側寫則幫忙更新學者的論文發表清單(當然,Google學者側寫張冠李戴、清單中誤植同名作者的論文時,還需自行檢查加以排除)。我們曾享受的那道美味、曾經歷的那場溫馨聚會,有勞Facebook幫忙我們日後得以回味那一刻。為了解決各種程式設計的疑難雜症,程式開發者之間的密集提問與回覆,則有勞社群問答網站Stackoverflow幫忙記憶。這些網站儼然成為個人與社群集體記憶的延伸,改變了現代網路使用者與網路社群的行為模式。

除了記憶較單純的資訊,交換者(不論機器或真人)還可以更善解人意,能夠懂得查詢者表達的涵義,或提供資訊所衍生的推論與知識。其實Google正在打造越來越人性化的搜尋引擎,透過自然語言處理技術分析我們輸入查詢時所用的模糊、片段語言,猜測我們的意圖,伺機提供整理後的知識。現在,Google搜尋網頁的右上角,原本保留給為Google日進斗金的關鍵詞廣告已經移走,悄悄換上了2012年底上線的「知識圖譜」(Knowledge Graph)。

知識圖譜可說是幫助網路使用者博學強記的新夥伴,利用關鍵字查詢後,螢幕一角就會列出百科式精簡資訊,使用者只需向右一瞥,便能一目了然看得到類似維基百科式的資訊,不需像過去還要用滑鼠「多此一擊」。知識圖譜正在開創搜尋引擎服務的新境界,當然也造就Google和Yahoo!的新戰場。

然而知識圖譜不等於維基百科。例如,李泰祥、吳寶春兩人皆有維基百科條目,但是都沒有知識圖譜條目;胡金銓、李安兩人則維基和知識圖譜條目都有。一般普通名詞,不論物品或概念,例如奶粉、麵包、甜甜圈、紫藤、貴賓狗,大都既有維基、又有知識圖譜。不過,查詢許多知名球隊、樂團、餐廳都會自動跳出知識圖譜資訊,但維基百科卻大都不收錄。

看起來,Google把知識圖譜定位為通俗、實用且簡潔的百科全書,維基所收錄的專業術語,如「向量、向量空間、向量支撐機」等,知識圖譜大部份都不收錄。知識圖譜提供的資料簡單明瞭,如同維基百科的首段或資訊框,但是也有密集方便的維基式連結,例如「知識圖譜到知識圖譜」或「知識圖譜到維基」的連結,而且偶爾還會出現「其他人也查詢以下的連結」(類似亞馬遜「買這本書的人也買以下這些書」功能),更添方便性。有時候知識圖譜會列出廣義詞、狹義詞的連結(例如,從「紫藤」可連結到更廣的「蝶形花亞科」或更特定的「多花紫藤」,甚至是「紫藤廬餐廳」);有時,則列出相關詞(例如由「胡金銓」連結到他執導的「龍門客棧」、「俠女」)。有時,還會連結到Google的其他服務,如新聞、地圖、在地服務等。而廣義、狹義、相關詞的概念,都是圖書資訊界認為可以有效協助讀者搜尋資料的好方式。

知識圖譜起源於詮網公司(Metaweb)在2007年推動的Freebase計畫,透過社群協力製作全球共享的知識庫。Freebase知識庫的資料全部源自於網路上的半結構化文字,包括維基百科、維基辭典。2010年7月Google悄悄併購了詮網,但仍繼續開發Freebase,並保持開放與各界分享資源。

【欲閱讀更豐富內容,請參閱科學人2014年第146期4月號】