不可勝數

統計是謊言嗎?

2012-09-01 黃文璋
- 不當呈現或解讀統計資料,將降低整個調查的參考價值,甚至造成誤導。


今年6月5日,前衛生署長楊志良投書媒體,他說:「我主張單身的朋友多繳一些稅……。等到這些單身的人步入老年……,當年他們幫忙養育,後來長大成熟的下一代,就成了有能力的人,回過頭來付出、回饋……,讓年老的單身朋友可以安心養老。」聽起來不無道理。但提議要某一族群多繳稅,總是傷感情,至少得先有些科學依據。幾天後的一則新聞,卻讓楊志良的論點有些站不住腳。


6月16日內政部公佈去年單身者平均死亡年齡為53.68歲,而有偶者平均死亡年齡為70.12歲。有些媒體便以〈國人壽命有偶比未婚多16歲〉為新聞標題。平均活不到54歲,固然令人驚心,但如此一來,單身者豈還需擔心養老的問題,願意在年輕時多繳稅,以待年老後能獲得照顧?楊志良的苦口婆心,看來是一廂情願。


只是單身者真的比有偶者少活16年?這似乎違反我們的經驗,環顧周遭單身的親友,並不像如此短命。內政部的統計可靠嗎?「這趨勢從過去就是如此,國外也有相關研究指出,單身者可能較乏人照顧,心理、環境因素都會影響,才會導致平均餘命比較短。」內政部戶政司長給出解釋,雖言之鑿鑿,但仍令人存疑。再細看該則新聞,內政部統計處長亦出來說明,指出因納入15~30歲者的死亡數據,而該年齡層大多未婚,遂拉低單身者平均死亡年齡。這才令人恍然大悟。


同樣也是內政部的統計,2011年的平均初婚年齡,新郎為31.8歲,新娘為29.4歲。近年來台灣年輕人傾向晚婚,30歲以下大抵是單身,這是統計處長那樣說明的原因。猜測內政部可能是對死亡者做各種狀態的統計,婚姻為其中一項,如今卻被拿來當做單身與有偶者死亡年齡的比較,真是過度解讀了。若想做此比較,至少要排除30歲以下那些大部分為單身者的資料。


無獨有偶,在一項對國內大學教育現況調查的報告裡,其中學生打工時數,得到大一生每星期平均打工8.56小時的結果。大一通常修習學分數較多、課業較重,每週還能花這麼多時間打工?且初進大學,人生地不熟,又如何能找到那麼多打工機會?看到此數據,有些家長難免會擔心孩子在校的學習狀況。再度,情形其實並非那麼嚴重,該項統計圖表下方有行小註「此時數為有打工者之平均時數」。原來如此!如果也納入未打工者(打工時數為0),則大一生的平均打工時數可預期將大幅降低,這項結果便沒那麼聳動了。為免誤解,此報告至少要明顯標示大一生有打工者的比率。


統計是做決策的一項重要依據。從一開始資料的收集便要很謹慎,如果是偏差或不適宜的樣本,將無法對母體做出正確的推論。而資料經分析整理後,如何呈現及解讀,更是一大學問。不當呈現或解讀,將降低整個調查的參考價值,甚至造成誤導。


必須特別一提的是,兩變數的因果關係,非藉由統計方法所能判定。對上述第一例而言,就算單身平均壽命的確較短,跟單身會導致短命完全是兩回事。這並不難理解。例如,若統計顯示,當冷飲銷售量較高時,醫院腸胃科就診人數亦較多,並不能率爾得到喝冷飲對腸胃不好的推論。有可能因天氣炎熱使冷飲需求量上升,而天氣較熱也使食物易腐敗,遂易吃壞肚子。另外,尚有著名的辛普森詭論(Simpson’s paradox),由於另一變數的介入,使兩變數的關係反過來。


總而言之,統計推論要極謹慎,以免落入「有三種謊言:謊言,可惡的謊言,及統計」之譏。


# 關鍵字:名家專欄不可勝數
更多文章
活動推薦更多
追蹤科學人