SCIENCE書摘

巨量資料如何改變教育?

巨量資料未來將無所不在,教育也離不開它,有助於研究分析學習過程。

撰文/編輯部

SCIENCE書摘

巨量資料如何改變教育?

巨量資料未來將無所不在,教育也離不開它,有助於研究分析學習過程。

撰文/編輯部


不論外表或行為,馮安(Luis von Ahn)就像是個典型的美國大學生。他愛打電動、愛開著一輛藍色跑車四處奔馳,也像是《湯姆歷險記》那個湯姆的現代版,老愛叫別人幫忙做事。但可別被他的外表騙了。馮安其實是全球頂尖的資訊工程教授,而且可說有10億人都曾經幫他做過事。


10年前,他還只是個22歲的研究生,就參與創造了一套圖片驗證機制「CAPTCHA」(Completely Automated Public Turing Test to Tell Computers and Human Apart,意指「能夠分辨電腦和人的完全自動化公共涂林測試」):網路使用者如果想要註冊免費電子郵件之類,就得先輸入圖片上幾個歪歪曲曲的文字,證明自己是人類,而不是垃圾訊息機器人(spambot)。後來,馮安讓這個機制升級成「reCAPTCHA」,賣給了Google,從此網路使用者要辨別、輸入的字,不再是純粹為了驗證刻意設計的扭曲文字,而是「Google圖書掃描計畫」裡機器無法辨識的英文字。這種使用資料的方法太帥了,完全是一石二鳥:既能完成線上註冊程序,又能協助Google辨識文字。


在這之後,馮安這位卡內基美倫大學的教授還是繼續尋找這種一石二鳥的做法,由使用者來提供可以擔綱兩種用途的資料。他的想法在2012年搖身一變,成為新創公司「Duolingo」,推出網站和智慧型手機的App,能夠協助使用者學習外語(這點馮安深有體會,畢竟他小時候住在瓜地馬拉,英語也不是他的母語),但是不同之處在於,這套教學背後有一個絕妙的設計。


這家公司把文章切成一個一個短句,再請使用者翻譯,或是評估和修正別人的翻譯。一般翻譯練習用的都是人工設計的句子,但Duolingo的句子來源都是實際需要翻譯的文件,而且他們也會從中收取翻譯費。等到有足夠的使用者都把某個短句翻譯了,或評定某個翻譯版本為最佳譯法之後,系統就會接受這句譯文;最後再把所有最佳譯文集合成完整的文件。


現在,有些媒體公司,像是CNN和BuzzFeed,都已經成為Duolingo的客戶,用以翻譯海外新聞的內容。就像reCAPTCHA,Duolingo也是一種愉快的「雙贏」設計:學生能夠免費學習外語,而且同時產生經濟價值。


好處還不只如此。所有使用者和網站間的互動,都會產生「資料廢氣」(data exhaust)這種副產物,這個網路術語講的是網路使用者的某些動作,包括:游標滑過哪裡、點擊哪裡、在同一頁面停留多久、輸入了什麼字等。而Duolingo把這些資料廢氣蒐集起來,就會知道像是:使用者要花多久時間,才能夠在某種語言的某方面達到精熟?多少的練習量最理想?如果漏了幾天課會如何?馮安了解到,只要把這些資料進一步處理,就能看到什麼是最好的學習方式。這在非數位環境下可不是一件容易做到的事。然而,光是在2013年,Duolingo每天就有大約100萬名使用者上線使用、每次停留超過30分鐘,所以他已經擁有了巨大的研究母體。


目前馮安最重要的一項發現就是,以下這個問題根本就問錯了:「學生該怎麼學習才是最好的學習方式?」因為關鍵不在於「學習方式」,而是「學習者是哪種人」。在馮安看來,目前對於外語的理想教學方式,很少是基於實證研究。雖然有很多理論,像是有人就主張應該先教形容詞、再教副詞,但背後並沒有具體的資料佐證。馮安也提到,就算真的有資料背書,常常也只是幾百名學生的小規模研究,要拿來推論整體情況實在有點危險。如果能用上千萬名學生多年學習的資料來得到結論,不是更好嗎?有了Duolingo,這個夢想正在成真。


更多相關文章

2018年1月減重手術也能治糖尿病 雜誌訂閱

本期最新文章