試閱 1/2

康乃爾最經典的思考邏輯課:大數據時代,你一定要避開的自以為是

第一章  無中生有:對隨機資料的錯誤知覺與錯誤解讀

「人類往往假定自然界的種種現象乃是有條有理,但事實並非如此。許多現象獨一無二且漫無規則,人類偏偏想從中找出通例,覓得關連,這無非緣木求魚。」——培根,《新工具》

哲學家斯賓諾莎在一六七七年有句描述物理現象的名言:「自然界憎惡真空。」三百年過去,這句話似乎也能解釋人的天性。人類生性厭惡空白,想建立各種模式,從中尋覓規律、發現意義,結果時常徒勞無功,混亂處處可見,意義無處可尋。我們生來渴望意義,想預測事物的結果,反倒因此從無序中「看見」秩序,從雜亂無章中看見規律模式。 

我們凝望毫無規律可言的天體,從月球表面找出一張人臉,從火星表面看見各種紋路。父母倒著聽十來歲子女的音樂,堅稱從混亂噪音中聽見撒旦的訊息。某位男子替重病纏身的兒子祈禱以後,望向病房的木門,從此堅稱他在門板上看見耶穌的臉,如今每年仍有數百人造訪那間病房,對此神蹟嘖嘖稱奇。賭徒聲稱在擲骰子之際會感到熱流或冷顫,據此改變押注目標。

斯賓諾莎的那句話十分吻合人類天性。自然界並不「憎惡」真空,不會有「憎恨厭惡」之情,也沒有根深柢固的喜好。人類的天性大致也是如此。我們往往沒來由的尋求秩序,雖然並不「想要」從月球表面看見人臉,這種錯覺毫無好處,但我們就是看見了。

我們傾向替模糊事物硬找規律,只是因為我們用來理解世界的認知機制正是如此。這也許是演化的結果,有助人類適應環境:規律事物容易加以運用,隨機事物則否。我們傾向於尋找模式與關連,從而發展與進步,但問題在於這種傾向太過強烈,近乎直覺反射,導致我們有時會看見壓根不存在的規律。

這牽涉本書會反覆提起的一個主題。許多扭曲判斷的機制其實源自基本認知過程,而認知過程有助我們準確感受並理解世界。確實發現規律的正面例子不勝枚舉,例如婦產科醫師塞麥爾維斯(Ignaz Semmelweis)發現罹患產褥熱的孕婦常是由剛替他人開完刀的醫師接生,生物學家達爾文觀察出加拉巴哥群島不同雀鳥的分布規律,提出物競天擇與進化論。

尋求規律與模式的天性大有助益,尤其最好在發現規律以後,能進一步嚴加分析驗證,塞麥爾維斯與達爾文就屬佳例。然而,我們往往不把觀察結果當作假設,反而當作既定事實,沒有詳加查證,導致我們會相信其實並不存在的現象。

為求了解這種天性如何害我們弄巧成拙,不妨仔細檢視一個出自體壇的具體例子,不熟體育的讀者無須擔心,這例子很簡單易懂,即使對運動一無所知也能理解,明白其中的通俗道理。

◎對隨機事件的錯誤知覺

當我打得順的時候,會油然升起信心……你覺得好像沒有人擋得住你。進第一球很重要,最好是空心球,然後你會進第二球……你感覺自己無所不能。

——沃爾德.B.弗里

弗里是一名NBA選手,他這句話反映幾乎每一位球員與球迷對「手感」的認知。手感是指在籃球場上進球(或不進),並因此得以持續進球(或不進)。一般認為,球員在連進幾球以後會精神放鬆,湧起信心,「打得很順手」,接下來更有辦法進球得分。反之,接連不進以後,球員會「手感變冷」,精神緊繃,遲疑猶豫,接下來幾球也難以命中。

這其實源自社會各界對於「成功會帶來成功」與「失敗會導致失敗」的認知。在某些方面,確實如此。比方說,如果資本雄厚就有許多賺錢手段,因此財務成功以後,往往變得更加生財有道。藝術作品本質飄渺,在藝壇成名能大幅影響世人對作品的評價,因此成功以後,聲勢往往扶搖直上。然而有些地方(賭場立刻浮現心頭)同樣盛行這個說法,卻不過是無稽之談。至於籃球場又是如何?真有手感發燙這一回事?

我跟學院同仁做過一系列研究探討這個問題。第一步照例是把手感化為可供驗證的假設,如果球員的手感有冷有熱,進球以後該比較容易再進下一球,沒進以後則較難投進下一球,亦即有一陣子很常進球,有一陣子很少進球,不是常態分布。我們訪問一百位老球迷,想了解我們對手感的解讀是否正確,結果獲得正面肯定:其中九一%的球迷認為「球員連續投進二或三球以後,下一球會比較容易投進,但如果連續二或三球沒進,下一球也比較容易不進。」我們假設有某位球員的投籃命中率是五○%,他們估計他「剛投進一球以後」,下一球的命中率是六一%,而「剛落空一球以後」,下一球的命中率是四二%。最後,八四%的球迷認為「最好把球傳給才剛連續投進好幾球的那位球員。」

為了探究球員是否確實有一段一段的進球區間,我們取得費城七六人隊在一九八○至八一年整個球季的投籃紀錄(就我們所知,只有七六人隊會依序記錄球員每次的投籃狀況,而非單純加總總數)。我們依照數據分析球員是否在某幾段區間較常進球,詳細數據請見下頁表1.1。分析結果與受訪球迷的看法相左,球員在投進一球、二球或三球以後,下一球並不會更容易投進,而在錯失一球、二球或三球以後,下一球也不會更容易失手。事實上,如果上一球並未投進,下一球投進的機率反倒稍微提高。如果上一球有投進,下一球的進球率是五一%,如果上一球沒有投進,下一球的進球率是五四%;如果前二球有投進,下一球的進球率是五○%,如果前二球沒有投進,下一球的進球率是五三%;如果前三球有投進,下一球的進球率是四六%,如果前三球沒有投進,下一球的進球率是五六%。整套數據完全否定「成功會帶來成功」的說法,球員不會比較容易接連進球或接連落空。

我們也檢視每位球員連續進球的比例是否偏高,或者每次投籃之間其實互不相關。比方說,連續投進四球、五球或六球的比例是否高於正常概率?是否高於硬幣連續擲出四次、五次或六次正面的概率?然而,數據顯示並非如此。我們另外做了許多更複雜的分析,得到的結果依然一模一樣:球員每次投球的命中率與先前表現無關。有趣的是,七六人隊的八名球員在該年度受訪時自認較常連續進球。 

我們該怎麼解釋為何許多人相信「手感」一說,統計數據卻證明沒這回事?多數人的第一個反應是寧願相信確有手感,認為數據並不可靠。他們堅稱手感確實存在,只是並未反映於這份數據而已,也許手感正旺的球員會挑戰更高難度的射籃,或面臨更加嚴密的防守,結果手感再好也徒勞無功。換言之,也許其他負面因素抵消掉手感的作用。為了驗證這一套說法,勢必得比較相同的投籃難度與防守強度下的球員表現,而最直接的做法是檢視「罰球」數據:每兩記罰球的難度相等,而且都無人防守。要是真有手感這回事,如果第一罰投進,第二罰的命中率會較高,如果第一罰未進,第二罰的命中率則較低。可是數據並非如此。我們分析波士頓賽爾蒂克隊兩個球季的罰球數據,發現前後兩次罰球的命中率並不相干。平均而言,無論第一罰是否投進,第二罰的命中率同樣是七五%。

有些人依然不願相信,認為也許我們沒有完全弄懂手感的意思(儘管根據的球迷訪談證明我們的理解無誤)。他們指出也許球員連續進球的概率不會高於硬幣連續擲出正面的概率,但兩者的不同點在於球員可以事先預測下一球的投進機率。換言之,也許手感其實是指球員可以預測下一球是否會進,而不是指球員會連續進球。 

我們也推翻了這個說法。我們請一組大學籃球員沿著一條跟籃框等距的弧線投一百球,每次投球之前,他們必須預測這一球是否會進。結果他們相信自己會連續進球,當前一球投進時,他們傾向認為下一球也會順利投進,但前一球不進時,他們對下一球的預估較趨保守。然而,實際情況是每次投籃之間依然互不影響,進球預測與實際結果是兩回事。換言之,球員既不會連續進球,也無法預測準度,這一套修正過的定義並不成立。

◎球員似乎會連續進球的原因

值得注意的是,儘管連續進球的機率並未高於正常概率,並不表示球員的表現取決於機率。進球與否取決於許多因素,其中最重要的是攻守雙方的球技高低,但有一個因素確實不會影響進球,或者說沒有可見的影響,那就是先前一球或數球的進球狀況。這是我們的研究結果。

撇開我們的研究不談,明明手感並不存在,為何許多人卻信以為真呢?我們想到至少兩種解釋。首先,許多人抱持先入為主的看法,無法正確解讀眼前的現象。由於一般認為信心會影響表現,許多人連一場籃球賽也沒看過就先認定有連續進球的現象,從而影響看球的感受,對連續進球或連續不進印象深刻,對兩者頻繁的穿插交錯卻視而不見。或者,一旦球從籃框彈開的常見場面出現,如果那名球員上一球有命中,他們會認為這一球「差點投進」,如果那名球員先前幾球接連落空,他們則認為他的手感顯然冷到不行(第四章會深入討論想法與成見造成的偏頗影響)。 

第二個解釋涉及更基本的層面,甚至跟任何明顯的成見毫無關連。心理學家發現人類天生對機率存有誤解。比方說,我們會低估錢幣連續擲出正面或反面的機率,容易認為實際結果太過巧合,遇到連續出現四次、五次或六次正面就直呼意外,然而,若以擲硬幣二十次而言,連續出現四次正面的機率高達五○%,連續出現五次正面的機率是二五%,連續出現六次正面的機率也有一○%。職業籃球員的平均投籃命中率是五○%,假設一場球出手二十次(許多球員都是如此),自然很有機會連續命中四球、五球甚至六球,彷彿手感熱得發燙。 

為了確認人類對機率的普遍誤解是不是造成手感一說的原因,我們讓球迷看幾串「X」和「O」,告訴他們這兩個符號分別代表進球與落空,請他們指出各串符號是否屬於連續進球或落空的例子。比方說,其中一串是「OXXXOXXXOXXOOOXOOXXOO」,其實屬於隨機排列(這一串符號彼此之間並無關連,因此屬於隨機排列,相同符號如XX或OO連續出現的次數等於相異符號如「XO」或「OX」連續出現的次數。),但六二%的受測球迷認為這串符號反映出手感的影響。

他們的錯誤判斷顯然其來有自,這串符號確實看起來像是受到手感影響,前八球總共投進六顆,前十一球更投進八顆!由此可見,球員與球迷並未弄錯:球員確實會連續進球。只是這個現象依然符合一般機率,跟信心與放鬆等因素無關,也就跟傳說中的手感無關。人類對機率存有誤解,球員與球迷犯下的錯誤在於不當解讀眼前現象。

第五章 以訛傳訛:二手資訊的偏誤效應

◎兩難困境

我們在檢視事證時易有漏洞,日常經驗包含各種誤導,個人經驗往往帶有偏見局限,而且我們不見得能加以公正衡量,因此我們不該太過相信個人經驗,而是該重視客觀明確的事實,研究人類判斷與決策的學者尤其建議大眾少仰賴個人認知,盡量採納客觀的基本概率與統計數據。比方說,當我們考量自己與另一半是否會以離婚收場,主要該關注的不是現在雙方有多熱烈與契合,而是全美目前將近五成的離婚率。誠然,我們不該完全揚棄當下感受與個人認知,但也該考量一般大眾的普遍情況,這是所有心理學家的一致見解。個人經驗並非絕對正確,最好也參考相關統計數據,而目前我們顯然做得不夠。

這些都說得很對,但統計數據從何而來?數據的準確程度又該如何判斷?比方說,廣泛流傳的五成離婚率到底是什麼意思?是指半數婚姻以離婚收場(若是如此,每次離婚都會納入統計,多次離婚者會讓數據比實際更糟),還是指半數人口一生至少會離婚一次(若是如此,多次離婚者不會重複計算)?如果我們不清楚定義,就很難靠整體離婚率評估自己的離婚機率。

一般而言,離婚率是指年度結婚數除以離婚數。多年以來,每兩對結婚的夫妻就有一對離婚,造成「半數婚姻以離婚收場」的說法,但多次離婚者也包含在內,因此個人平均離婚率其實沒有這麼高。此外,要靠這個數據評估個人狀況還會面臨另外一個難題:總離婚率是該年度各年齡層離婚率的加總結果,亦即二十餘歲、三十餘歲和四十餘歲等不同年齡離婚率的加總,但現在五、六十歲的夫妻往往較不容易離婚,年輕夫妻則較容易離婚,因此年輕夫妻要評估這輩子的離婚機率並不容易,該當格外謹慎。

數字真的會說話?

其實統計數據的準確程度很難評估。我們很少自行動手蒐集數據,既不太會利用科學期刊查找相關資料,也不見得能讀懂,只好以接收二手資訊為主,例如讀報章媒體所整理的報導,可惜媒體報導往往經過大幅扭曲。

異性戀罹患愛滋機率的報導就屬一例。如果你是只有單一性伴侶的異性戀者,沒有靜脈注射藥癮,屬於中產階級,你該多擔心自己是否會感染愛滋呢?下列說法我們多半耳熟能詳。歐普拉說:「研究指出五分之一的異性戀者將在三年內死於愛滋病,也就是說一九九○年以前會有高達二成的人喪命。說真的,愛滋不再是男同志才會得的疾病了。」《今日美國報》說:「最晚到一九九一年時,十分之一的新生兒會是愛滋寶寶。」愛滋委員會的數任會長都說:「據我們所知,愛滋病正對社會構成史無前例的嚴重威脅,比過去幾個世紀的黑死病更危險。」依照這些說法,罹病機率確實高得驚人:在一九九○年以前,五分之一的異性戀者將會喪命!到一九九一年時,十分之一的新生兒會是愛滋寶寶!如果說法屬實,眾多異性戀者顯然已感染愛滋病毒,異性之間的一對一性關係必然相當危險,任何相信這類說法的人只能跟配偶發生性關係。

幸好這些說法根本言過其實。一九九○年,遠遠不到五分之一的異性戀者感染愛滋,遑論死於愛滋,多數愛滋患者仍是男同志、靜脈注射藥癮者,以及後者的異性伴侶。而且愛滋寶寶的比例毫無激增,依然遠遠小於十分之一,媒體所言並不正確。

相較之下,個人經驗雖然有時不太可靠,卻更能正確評估愛滋病對異性戀者的威脅程度。大多數美國人都不認識有誰因為異性性行為感染愛滋,連朋友的朋友也舉不出來(先前提及的一夜情謠言並不算數,因為無法證明「受害者」確實感染愛滋)。因此,個人經驗可以戳破各個誇大愛滋風險的危言聳聽。目前誇大程度仍難確認,也極富爭議,但現有數據指出實情比較接近個人的經驗(「愛滋不可能那麼氾濫,我根本沒認識半個愛滋患者」),而非媒體的說法(「五分之一的異性戀者將在三年內死於愛滋病」)。

那麼我們到底該以什麼做為判斷依據?是個人經驗,還是統計數據?如果兩者衝突該怎麼辦?決策理論家目前發展出一套正規程序,可以同時評估這兩種來源的資訊,但要是統計數據並不準確,這套程序很難派上用場。如果個人經驗與統計數據相符,我們大可認為自己的認知正確,但如果兩者不符,該先懷疑自己的認知是否有誤,至於不明二手數據也容易有誤,不應盡信。這兩個重要的資訊來源不必然可靠,必須小心加以判斷,有時我們所能做的也只有小心為上,但光是記得分辨可靠認知與薄弱誤解已屬一大進步,畢竟有時「一無所知的麻煩不大,錯誤認知的麻煩才大」。

最後一章會廣泛探討如何避免日常經驗造成的錯誤認知,目前最重要的是該如何衡量媒體上的二手報導,例如:某個說詞能否相信?某個數據是否可靠?幸好,有些原則可供遵循:

考量資料來源

考量資料來源是最重要的方法,我們明明知道卻時常忽略。我們都不會認真看待《全國特蒐快報》,而是看重《紐約時報》,但知名大報的消息來源是什麼呢?舉愛滋為例,我們該比較相信流行病學家的見解,而不是性治療師、搖滾明星或知名演員的看法。流行病學家致力於探討流行疾病,最有資格針對愛滋傳播提出預測。性事與愛滋有關,因此媒體也會詢問性治療師的意見,但他們或許了解性功能障礙,懂得如何處理有關性愛的疑難雜症,卻不見得清楚愛滋傳播等複雜議題。如今涉及愛滋的各種危言聳聽充斥社會,大致而言,只有流行病學家的見解最正確可靠。

然而,即使知道以專家的見解為重,實行起來卻不太容易。記者時常曲解專家的意思,常見招數是引述專家平常的一句話,搭配偏頗說詞,彷彿後者也獲專家認可,比方說:「據信每三位青少年就有一位沉迷古柯鹼,總統特別反毒委員會成員奈斯也指出:『反毒大戰相當棘手。』」奈斯也許確實認為反毒大戰相當棘手,卻不見得認同「三分之一」這個預估數字,但媒體並置兩句話的做法容易造成誤會,導致讀者認為兩者都是他的意思。我們必須小心區分直接引述與額外暗示。


相信事實,質疑預測

對未來的預測容易出錯,即使以此為業的專家也不例外,像是氣象學家時常誤判隔日天氣,經濟學家往往錯估經濟指標,因此我們該看重專家提出的事實而非預測。雖然流行病學家對愛滋傳播的預測值得關注,但更該留意的應是既有事實,例如目前實際的愛滋病患人數,或是同性戀者、異性戀者與靜脈注射藥癮者的感染比例,或是捐血人口之中出現愛滋陽性的比例。如同先前所述,重點在於懂得小心為上,謹慎看待任何對未來的預測。

留意強化與弱化做法

科學界人士很少做出準確估計,例如他們不會只說「五四%的選民支持向進口油品徵稅」,而是會加上「正負誤差在四個百分點」。科學預估幾乎都會列出範圍或「信賴區間」,疾病管制中心也許會說:「我們預估美國境內共有五十萬至一百五十萬名愛滋帶原者。」然而,較高的數字顯然更有報導價值,因此媒體往往省略範圍不講,只提較高的數字:「疾病管制中心指出,高達一百五十萬名美國人……」我們該知道任何「高達」二字都是強調信賴區間其中一端的極值,用來吸引目光,我們不該全盤接受,而該打點折扣。

謹慎看待各種現身說法

媒體時常請受害者現身說法,藉以凸顯問題的嚴重程度,這種做法相當有效,足以讓大眾設身處地,對弱勢感同身受,媒體的職責即是如此!然而,我們不該因此誤判問題的普遍程度。感同身受實屬理所當然,但客觀判斷不應隨之起舞。任何現身說法再感人催淚,也只是個人經歷,我們通常沒什麼道理認為那一個人有助我們了解整體問題的普遍程度,同情個人是一回事,評估到底有多少人同受其害則是另一回事,碰到任何煽動人心的現身說法都該謹慎看待。

簡而言之

二手資訊不夠準確,容易造成錯誤認知,而非促進正確認知。如果資訊本身不可靠,根據資訊所做的判斷也無法正確,錯誤資訊幾乎只能導致錯誤認知,而這些認知甚至看似是依據個人(二手)經驗判斷的「必然結果」。



close
貨到通知