PTT評價

[心得] 《數據的假象》現代公民的人生必修課

看板book標題[心得] 《數據的假象》現代公民的人生必修課作者
wackynoteis
(Waki瓦基)
時間推噓10 推:10 噓:0 →:15

《數據的假象》讀後心得:現代公民的人生必修課
深度偽造時代最重要的思辨素養,聰明決策不被操弄

圖文好讀 https://readingoutpost.com/calling-bullshit/

數位時代最重要的能力之一,或許就是看懂誰在胡說八道。哲學家 John Alexander
Smith 曾對牛津大學的新生演講說道:「各位將來在求學過程中學到的,沒有一樣對你將來有用,只除了:若你勤勉認真,在智識上你將能發現誰在亂說話,我個人認為,這就算不是教育的唯一目的,也算得上是最主要的。」而辨識數據的能力,是需要被教育的。

為什麼要讀這本書?

不知道你有沒有過這種經驗:在 LINE 或 Facebook 看到別人傳來的圖片或貼文,內容的文字和數據非常聳動,可是你一眼就識破那是假訊息?或者,你看完某則訊息之後覺得有異狀,透過可靠的工具和搜尋方式查找一番之後,確認了這是一則假新聞?

為什麼有些人能夠辨認、質疑和查證這些資訊?有些人卻毫無招架之力,成了假訊息的幫兇?

我認為,人隨著年紀增加,跟著增強的是偏見和概括,而不是識讀力。識讀的能力和年紀沒有絕對的正相關,而是和我們如何質疑、分析、判斷資訊的真偽和來源有關。可是,卻似乎從來都沒有人教過我們該怎麼做?

現在,終於有兩位專家將「反駁鬼扯」這門華盛頓大學的熱門課程的內容出版成書。

《數據的假象》作者是演化生物學家卡爾.T.伯格斯特姆(Carl T. Bergstrom)和資訊學家杰文.D.威斯特(Jevin D. West),他們透過這本書教我們如何識破數據假象。我們必須學會在不實或誤導資訊充斥的當今社會,如何提高對假數據的防禦能力,還有學會辨別數據的真偽、查證數據的來源。

這本書的內容,就是每個現代公民——每個暴露在大量資訊和數據的人——的人生必修課


數字是鬼扯消息的最佳載具

人們對文字和數字有不同的感受。文字是主觀的,我們知道有人會利用文字扭曲真相、模糊事實。數字就顯得客觀許多,意味著精準度,代表科學手法。但實際上,數字卻很容易被有心人士操弄。

很諷刺的是,懷疑論者會說自己「只想看數據資料」,或強調大家要「讓量測值替自己說話」。很多人都喜歡說「數據資料不會騙人」,但這種說法才真正潛藏危險。數字或量測值即便正確,有人還是可能利用它編織鬼扯。我們要記得,往往誤導人們的也是數據資料。

例如有一家飲料公司推出一款即溶式的熱巧克力,包裝上面標示著「99.9% 不含咖啡因」,你覺得睡前喝下這杯熱巧克力,你還睡得著嗎?有趣的是,星巴克的滴濾式濃咖啡,咖啡因含量大約佔總重的 0.075%,它也能稱自己是 99.9% 不含咖啡因。

看到一個簡單數字,往往不代表全貌。你可以進一步探詢,它的分母是什麼?它的數量級可以跟誰比較?它在時間尺度拉長之後會變成怎樣?小心那些沒有任何根據的主張,尤其是簡單的數字和統計數據特別容易被傳播開來,這些數據資料往往罔顧脈絡背景。

當心濫用數學的表示方式

「濫用數學」指的是那些「看起來」很像是數學公式的表達方式,但是背後卻缺乏邏輯的一致性和實際數學的嚴格要求。小至「成功」或「快樂」的公式,大至「醫學中心品質方程式」都有這種濫用數學的情形。

例如作者就舉知名心理學家 Martin Seligman 提出的快樂方程式:H = S + C + V(快
樂 = 先天的快樂趨向 + 個人的環境條件 + 自主控制的生活方面)。這個公式看起來真有這麼一回事,可是卻完全禁不起考驗。這三個項目的單位是什麼?為什麼可以彼此相加?

用數學公式呈現說法,其實是濫用數學的手法美化自己的論述。因為數學公式總是給人一種「可信度」很高的錯覺。作者認為,如果 Seligman 主張「快樂是由先天快樂趨向、環境條件,以及個人能自主控制的生活方面等三者組成的函數」,這樣還比較洽當。但直接聲稱快樂是這三者的數學總合,就是濫用數學。

數據資料視覺化的隱憂

「數據資料視覺化」在最近十分流行,而且聽起來好像很客觀。可是我們必須留意,圖表的設計者對於圖表傳達的內容有很大的掌控權。就算使用的數據資料都是正確,還是有相當大的操弄空間。這些刻意呈現出來的圖表,很可能誤導我們去相信某一些相關性,或者刻意放大了群體之間的微小差異。

就是社群媒體上互動數最高的貼文型態之一:圖文圖表懶人包,就屬於一種用數據資料視覺化說故事的呈現方式。這種呈現方式讓人一眼秒懂,理論上應該是很好的方式啊?可是在有心人士或團體的操弄下,懶人包呈現出來的資訊往往會失真,或者刻意強調了某些意識形態的訊息。

我們可以試著找答案:圖表圖文的資料來源是什麼?來源可信或有特定立場嗎?這份懶人包是由誰(或團體)製作的?愈是沒有附上資料來源的數據,愈是要豎起懷疑的心。因為背後意圖愈是不安好心的圖文,就愈不希望你自己去查證資料來源。

當人們只透過懶人包去認識世界的同時,也漸漸失去了自己識讀數據的能力。

後記:何時忽視、何時認真

我相當享受這本書的閱讀體驗,作者們巧妙地融合了辨別數據的知識和幽默,也用很多實際的範例來解說背後的觀念。《數據的假象》書中描述的假新聞、不實資訊和扭曲數據,有點像是社會愈趨極端和人們愈不講理的「因」,而另一本書《反智》就是這個現象導致的「果」。如果要對這個議題有全貌性的瞭解,這兩本書搭配服用可以起到很好的效果。

閱讀這兩本書之後,給我帶來了諸多收穫,但如果要說一個最重要的關鍵,那就是「資料來源很重要」。我統整我過去數個月以來,自己吸收資訊的做法如下:

沒有任何來源的:直接忽視。
有附上來源,我沒興趣的內容:直接忽視。
有附上來源,我有興趣的的內容,不可靠的來源:直接忽視。
有附上來源,我有興趣的的內容,陌生的來源:先查核來源,若查不到就忽視。
有附上來源,我有興趣的的內容,可靠的來源:閱讀內容。

我發現,不曾因為忽視了「缺乏來源」或「不可靠來源」的資訊,而對自己造成傷害的。而我相信未來也不會有。或許,辨識數據的能力並不是要我們查核每一則資訊(誰有那時間?),而是懂得什麼時候忽略(不要助長假資訊),什麼時候認真(看有可靠來源的資訊)。

最後,我很喜歡譯者沈聿德在譯者後記寫下的這段話:「對立,不見得出於惡意,而是辨識鬼扯的能力不足;分裂,不見得是刻意使然,而是意外助長錯誤訊息散播的結果。」若我們想降低對立、減少分裂,靠的不是心靈喊話和好言相勸,而是讓更多人一起培養辨識數據和資訊的能力。

--
書評部落格「閱讀前哨站」 https://readingoutpost.com/|一個愛書人的閱讀筆記
Podcast「下一本讀什麼?」 https://readingoutpost.com/podcast/|我的說書頻道

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.77.95 (臺灣)
PTT 網址

skyhawkptt08/09 22:30感謝推薦分享

tenchun08/10 07:32非常適合 現今閱讀的好書..

Alcatraz66608/10 08:51感謝推薦~

jyekid08/10 10:12現代資訊技術龐雜 其分工太細緻了 不可能什麼都懂得的

jyekid08/10 10:13即使知道數據及其製圖可能迷惑人心也難以防範

jyekid08/10 10:16最佳方法是精進專業 與信得過的人組團 涉及他們專業領域

jyekid08/10 10:17完全信任之 比起看新聞 政治宣導 幾本書 更可能接近真相

psion08/10 11:10原po大概是沒接觸過頂級的假新聞 連諾貝爾得主都牽連進去

psion08/10 11:12說實話 平常上班族 下班能有餘力進修者有多少? 就靠著唸書

psion08/10 11:13時的那些教科書知識背景想要破解假資訊? 那網軍薪水拿假的?

psion08/10 11:14不講政治這種敏感度高的 光是健康生醫資訊 有醫生背書的 能

psion08/10 11:15信的有多少? 或說超過95%可信度的有多少?

applewarm08/10 19:26確實

emile122408/10 23:48感謝推薦

direk877108/11 10:28其實多數的假新聞假資訊的目標並非頂尖專家,而是普羅

direk877108/11 10:30大眾,也因此其實邏輯並不嚴密,甚至多數只需細思,稍

direk877108/11 10:31微查找就有相對正確的資訊可供參考

direk877108/11 10:32甚至退一步說,就算一般人沒能真的完全識破所有假訊息

direk877108/11 10:33,光是能讓人對於獲得的資訊是否正確而付出多些時間跟

direk877108/11 10:36心力查找資訊,逐漸培養起分辨資訊的敏銳度,才算是這

direk877108/11 10:36種書籍真正的價值

castlewind08/11 19:12看完「南山的部長們」後 突然想到 對岸五毛 會沒想到

castlewind08/11 19:12偽裝台派來敗壞台派風評嘛......

banana108/11 21:18樓上,當然是現在進行式。不過就跟一般間諜的做法一樣

banana108/11 21:19在地協力者很多根本不知道自己在做的事情跟間諜目標一致