巨量資料驅動城市-科學人雜誌
編輯推薦

巨量資料驅動城市

2013-12-01 潘特蘭(Alex“Sandy”Pentland)
我們每天留下的數位足跡,遠比我們所知道的透露出更多個人訊息。這有可能成為隱私夢魘,但也有可能為更健康、更繁榮的社會打下基礎。

重點提要
■今日的城市與政府仍然根據兩個世紀以前,工業革命時期發展出來的原則在運作。要解決人口爆炸性成長及氣候變遷等21世紀的問題,我們需要新的思維。
■巨量資料能促成這樣的思維。我們日常生活所留下的數位麵包屑,比我們選擇表達自己的任何東西都透露更多個人訊息,是追蹤社會問題的有力工具。
■然而這類資訊確實有被誤用的疑慮。在資料探勘促成更健全、更繁榮的社會之前,我們需要資料新政,讓個人擁有遠比現在更多的個人資訊掌控權。

19世紀中葉,工業革命帶動城市快速發展,引發了危急的社會與環境問題。因此,城市建立了集中式網絡來供應乾淨的水、能源與安全的食物,以發展商業、促進交通並維持秩序,提供人們醫療照護和健康活力。如今,這些一個多世紀前的解決方案越來越不夠用了。

有許多城市交通阻塞,政府制度陷入僵局,此外還面臨了一大堆新挑戰──最明顯的是,要提供食物與住處給即將增加的20億人口,同時避免全球暖化的嚴重衝擊。這類21世紀特有的問題,需要21世紀的思維。然而許多經濟學家和社會科學家仍然以市場或階級這類啟蒙時代的觀念來思考社會系統,以簡化的模型把社會互動削減為社會規則或運算法則,而忽視人類的個體行為。我們必須更深入探討,把社會互動的精密細節納入考量。現在,我們可以運用一種稱為「巨量資料」(big data)的工具來達成。

數位科技讓我們能研究數十萬筆關於人們交流創意、金錢、商品或流言蜚語的個別記錄。在美國麻省理工學院裡,我的研究團隊正在用電腦分析這些交流記錄中的數學模式。

我們已經開始能為原本神秘難解的現象提出解釋,例如金融崩潰、政治動盪、流感爆發等。資料分析可以促成穩定的金融系統、運作良好的政府、有效率且負擔得起的醫療,以及其他好處。首先,我們得澈底認識巨量資料的力量,並建立架構來妥善使用它。能夠追蹤、預測,甚至控制個人與群眾行為的能力,就如同水能載舟、亦能覆舟。

數位麵包屑的預測能力

我們的日常活動會留下一些虛擬麵包屑,亦即我們聯絡誰、去哪裡、吃什麼和買什麼之類的數位記錄。這些麵包屑比我們選擇來表達自己的任何東西,都更能精確傳達我們的生活故事。我們的臉書動態和推特傳達的是我們選擇告訴他人的資訊,是根據世俗標準修改過的。相較之下,數位麵包屑記錄的是真實發生的行為。

我們是群居動物,我們的行為從來就不像我們認為的那麼獨一無二。你打電話、傳簡訊、花時間相處的人,甚至是你認得但從未正式自我介紹的鄰居,都可能在各方面跟你很像。我和學生能檢視你常上的館子和常來往的朋友,分辨你是否可能患有糖尿病。我們能用同樣的資料,預測你可能買什麼款式的衣服,或者清償貸款的可能性。我們生病時行為會改變,會到不同的地方、買不同的東西、聯絡不同的人、在網路上搜尋不一樣的關鍵字,因此現在已經可用資料分析,建構出一張不斷更新的地圖,預測任何時刻城市裡的居民在哪裡最有可能染上流感。

巨量資料裡最能洞悉社會運作的數學模式,出現在人與人之間的想法及資訊交流。我們藉由研究社會互動模式(當面談話、電話交談、社交網絡訊息),以及評估個人購買模式(由信用卡資料得知)或移動模式(由GPS軌跡得知)裡的新穎性和向外探索程度,來觀察他們的交流。對於了解社會而言,想法交流是極為重要的,不只因為即時資訊對效率系統至關緊要,也因為想法的散佈和整合是創新的根基。拒絕和社會其他群體往來的社群,很可能會變得死氣沉沉。

我和學生發現最令人驚訝的事情之一,是想法交流的模式(以購買行為、移動方式或通訊來衡量)與生產力成長及創意產出有直接關係。互動密切並往社交圈外探索的個人、組織、城市甚至整個社會,會有更高的生產力、更棒的創意產出,甚至更長壽、更健康的生活。我們看到所有的群居動物,甚至是蜜蜂,都有類似的模式。想法交流似乎是每個健全社會的基礎。

我們把公司和政府當做「想法機器」(idea machine)加以分析。這些機器主要是藉由個體互動來蒐集並散佈想法。有兩個數學模式可當做想法交流的健全度指標。第一個是「參與度」(engagement),我們定義為「工作團隊內人與人之間每日交流的比例」。參與度和生產力的關係很單純:參與度高,團隊生產力就高,幾乎與團隊工作,或成員人格特質無關。第二個是「探索度」(exploration),這是把「團隊成員從外界帶回多少新想法」化為數字,探索度對於創新與創意產出都是好的預測指標。

我和學生到全球各家公司進行實地實驗,請員工配戴能追蹤人際互動的電子社會計量識別證(socionetric ID badge),藉此測量參與度和探索度。我們發現增加團隊裡的參與度可以大幅提升生產力,同時降低壓力。比方說,我得知電話客服中心通常把休息時間安排成每個時段只有一個人之後,就勸美國銀行的客服中心經理把休息時間排在一起,以提高員工之間的參與度。單是這項改變,就使每年的生產力提高了1500萬美元。

我們也發現探索度(建立新的人際連結)是創新與創意產出的絕佳預測指標:豐富的溝通管道,尤其是面對面的互動,比電子通訊管道更有影響力;換句話說,電子郵件絕對無法完全取代會議與對話。

我們也發現探索度和團隊參與度的來回振盪模式(人們參與團隊,然後去找新資訊、帶回來,再重複這個過程),總是與更好的創意產出有關。我的同事已能夠在成熟的研究組織裡,測量面對面互動中的這類模式,並且用這些數值準確找出研究者最有創意的日子,這種方法也適用於成員分散各地的工作團隊。

類似的資訊交流模式也能預測整個城市或社區的產出。社區內參與度及社區外探索度甚至能預測社會表現,例如預期壽命值、犯罪率和新生兒死亡率。資訊隔離的社區表現就和真實的隔離區一樣糟,而彼此交流並與鄰近社區有聯繫的社區往往較為健全繁榮。

# 關鍵字:編輯推薦資訊科技
更多文章
活動推薦更多
追蹤科學人