其他

懂得看人臉色的鮭魚

了解統計的真實意義!

撰文/席夫 ( Charles Seife )
翻譯/宋宜真

其他

懂得看人臉色的鮭魚

了解統計的真實意義!

撰文/席夫 ( Charles Seife )
翻譯/宋宜真


倘若你想說服全世界,有條魚可以感知你的情緒,你須提出一項統計量數:p值。


p值是一項萬用量數,科學家通常會拿它來決定一項實驗是否具備「統計學上的意義」。不幸的是,有時測試結果不如預期,因為研究人員會把原本可能毫無價值、偶然的觀測事件,賦予過多意義。


例如你對心臟病的新藥進行科學實驗測試,然後比較服用新藥與服用安慰劑的結果。瞧,服用新藥病患的心臟病發次數,果然比服用安慰劑者還少。成功!此藥有效!


嗯,可能未必如此喔。大概會有一半的可能是,新藥就算完全無效,服用此藥的病患情況還是會比服用安慰劑的好。(畢竟,總有一組情況會比較好,哪組勝出不過是機率問題。)


而所謂p值,就是給這種隨機效應一個數值。即便你的假設錯誤,但依舊有一半的或然率會出現正面的實驗結果。在許多科學領域中,有一項存在已久的慣例,就是實驗結果的p值只要低於0.05,那這項結果就被視為具有統計學意義。但這是一項武斷的判斷,而且常常是錯的。當你在比較無效的新藥和安慰劑時,只要實驗20次,通常就會獲得具有統計學意義的結果。而倘若你在科學期刊上放了這20組對照實驗,平均來說就會得到一個p值小於0.05的結果,即便新藥一點效果都沒有。


許多科學論文都會放上20、40、甚至上百組的對照實驗。在這種情況下,研究人員即使沒有把p值調校在0.05的標準門檻,也幾乎能保證得到具有統計學意義的結果──即便實際情況不過是不具統計意義的偶然事件。今年2月《美國臨床營養期刊》刊登了一篇論文,研究中測試了數十種化合物,最後結論是,從藍莓中萃取出的成份能夠降低罹患高血壓的風險,p值為0.03。然而研究人員查看了許多化合物,並做了50次以上的對照實驗之後,他們幾乎可以確定一件事:論文中某些p值,不過是碰巧低於0.05。


同樣的情況,也可以運用到一項一度廣為人知的研究:神經科學家所做的鮭魚實驗。他們拿出有喜怒哀樂各種情緒表情的人臉照片,放在鮭魚面前,結果鮭魚腦中某個區域會出現反應。實驗結果的p值低於0.001,具有統計學意義。然而,研究人員表示,有太多種可能模式可以保證得到具有統計學意義的結果,所以該結果毫無意義。因此儘管有p值掛保證,鮭魚還是可能根本對人類情緒毫無反應。那隻魚在進行魚腦斷層掃描時,也不巧死掉了。


更多相關文章

2018年12月202期睡眠學習不是夢 雜誌訂閱

本期最新文章