資訊科技

從社群網路看資訊流動

社群網路已深入現代社會,在其中傳播的資訊如何影響我們的生活?

撰文/李政德

資訊科技

從社群網路看資訊流動

社群網路已深入現代社會,在其中傳播的資訊如何影響我們的生活?

撰文/李政德

重點提要
■資訊擴散的相關研究已經發展了十幾年。早在社群媒體普及之前,就已經有商業公司藉由分析人際網絡,發展行銷策略。
■研究資訊擴散,首先要考慮兩個問題:人們接收資訊的模式為何?選擇哪些人才能讓資訊更廣為人知、發揮最大影響?
■數位時代來臨、人工智慧興起,這個領域的研究方向變得更加多元,各式各樣的功能也應運而生,對人類社會的影響將日益擴大。


臉書、Line與Instagram,是你我生活中不可或缺的社群媒體。2018年底台灣九合一大選期間,大家或多或少曾在社群媒體上看見朋友對候選人的正反意見。當你評論或分享一則貼文,甚至只是按讚,這則資訊便透過你的帳號往你的好友圈擴散了。然而,你是否注意到特定意見的資訊總會出現在你的塗鴉牆上?2016年的美國總統大選期間,川普的競選團隊便透過數據分析公司「劍橋分析」(Cambridge Analytica)設計的演算法來分析社群媒體用戶,進而投放具特定立場的內容,左右選民投票傾向,藉此讓有利於自己的資訊廣為流傳。


人與人的相互影響,在資訊科學領域被稱做「資訊擴散」(information diffusion)。相關研究並非近年才出現,早在社群網路興起之前,人與人之間便已經藉由無形的人際網絡相互影響決策,最顯而易見的例子是,人們容易受到朋友的推薦而購買商品,人們的投票傾向也可能受朋友影響。分析社群網路能夠了解資訊如何擴散,且能應用於電子商務、流行病學與環境保護上,其中最為人所知的,就是病毒式行銷(viral marketing)。


擴大影響力


病毒式行銷在1995年第一次被提出,是Sony互動娛樂第一代PlayStation遊戲機的行銷策略──讓商品資訊如同病毒般擴散,以求讓更多人獲知商品資訊。歷經六個月的病毒式行銷,第一代PlayStation的推廣獲得前所未有的成功,成為當時熱銷排行榜的第一名。在社群網路的研究領域中,病毒式行銷被稱為「影響力最大化」問題:若店家想行銷特定商品,但試用品或折價券數量有限,在眾多使用者中該挑選哪些人做為最初的意見領袖,才能使得最終購買商品的人數最多?


影響力最大化在數學計算上非常耗時。試想當一社群網路使用人數為一萬人,平均每人有100位朋友,則總朋友關係數為100萬。若店家想挑選10位使用者做為最初的意見領袖,那麼窮舉所有可能的組合,將會有1033種,這個天文數字在行銷應用上難以實現。為提高挑選意見領袖的效率,美國康乃爾大學的電腦科學家克萊柏格(Jon Kleinberg)在2003年率先提出貪婪演算法和經驗法則,成為資訊科學領域研究資訊擴散與影響力最大化的濫觴。


克萊柏格根據每個人容易被影響的程度,以及不同類型資訊的影響型式,歸納並程序化兩個最重要的影響力傳播(influence propagation)模型(參見左頁〈影響力如何傳播?〉)。當社群網路中有n位使用者,總共要挑選k位意見領袖,貪婪演算法每次挑選一位:根據所選定的影響力傳播模型,從尚未被挑選的使用者中,找出一位能使影響力邊際效益最大的使用者。貪婪演算法符合直覺,且由於影響力具有邊際效益遞減的特性,經數學證明貪婪演算法能確保所挑選的k位意見領袖之影響力至少達到最佳解的63%。


貪婪演算法雖然比窮舉法還要來得有效率,但有時依然無法應用在現實情況中。經驗法則不考慮資訊擴散的影響力,單純考量使用者於社群網路的朋友關係,做為挑選意見領袖的依據,例如挑選朋友數最多的k位使用者,此經驗法則稱為「度值中心度」(degree centrality);另一種經驗法則為「接近中心度」(closeness centrality),指的是一個人在社群網路中與其他人的平均距離越近,可被這個人影響的人就越多。貪婪演算法與經驗法則各有時間效率與影響力效果上的優缺點,有許多學者提出各種改進做法。


數據的力量


早期社群網路資訊擴散的議題與應用,多以影響力傳播模型為基礎,直到2013年第三波人工智慧興起,機器學習的各種演算法為資訊擴散帶來嶄新的思維與應用;同時,社群網站的分享與留言等功能,讓資訊擴散變得容易以數位化型式儲存,記錄資訊被分享的時間、地點、管道,以及瀏覽的使用者。我們擁有資訊擴散的巨量資料,電腦程式就可以學習資訊在人與人之間傳播的模式、預測受影響人數的演變,以及識別不同類型的資訊擴散。


如今相關程式已能根據資訊擴散源頭是誰、擴散經過了哪些人以及社群網路結構,預測特定主題在一個月後是否會形成熱門議題;也能根據資訊本身的內容(例如文字、圖片或影音)、被分享的貼文資訊、初期擴散結構與社群網路,預測哪些人在未來會進一步轉貼該資訊。相關應用還包含:根據使用者的屬性和興趣、曾經分享過的資訊、擴散結構,以及資訊內容本身,為使用者推薦可能感興趣的內容;甚至是根據資訊擴散結構、貼文內容和轉貼評論,以及分享的使用者屬性,預測該資訊是否為假新聞或謠言。


知名社群媒體分析公司Intuit創辦人庫克(Scott Cook)說:「(社群媒體的)品牌形象不再是由公司告訴客戶,而是由客戶彼此間的資訊交流所定義。」社群網路資訊擴散反映出人們的集體行為與群眾智慧,更是真實世界人際互動的縮影。資訊的意義在擴散過程中被重新詮釋,我們也得以分析使用者在網路資訊傳遞中扮演的角色,進一步了解人性,並延伸開發各種應用。當我們能夠透過廣義的網路,來描繪各種類型資訊互動的情形,再輔以資訊擴散的巨量資料,以及當前的人工智慧技術,現存於社會中各領域的問題,將有機會獲得全新角度的解答。


李政德
成功大學數據科學研究所助理教授,於2013年取得台灣大學資訊工程博士。研究領域為資料探勘、機器學習、社群網路與推薦系統。近期獲科技部年輕學者殊榮(MOST Young Scholar Fellowship)與潘文淵考察研究獎。