
想像一場由美國情報單位贊助的「預測奧運」。成千上萬的志工在網路上對未來下注:烏克蘭局勢、油價走勢、哪位領袖會連任……。結果最準的一小群人,沒有安全徽章、沒有機密線人,卻在準確度上打敗擁有機密資訊的情報分析師,並在四年的比賽中,以約 35–72% 的優勢勝過其他研究團隊。這不是都市傳說,而是《Superforecasting》背後的實驗事實。
這和你我有什麼關係?因為我們每天都在做「帶著預測的決策」:要不要轉職、該不該上新產品、台幣會不會續貶。每一次按下「確定」,其實都是對未來的機率押注。如果預測更準,決策就更穩。
《超級預測》作者與本書介紹
《Superforecasting: The Art and Science of Prediction》由 Philip E. Tetlock 與 Dan Gardner 合著。Tetlock 是賓州大學 Annenberg/Wharton 跨聘教授,研究政治判斷與決策心理學;Gardner 則是《Risk》《Future Babble》的暢銷作者與資深記者。寫作動機,源於 Tetlock 更早的長期研究:他追蹤專家多年,發現多數「名嘴」的預測只比亂猜好一點,甚至常輸給簡單模型。
為了更進一步驗證與改進,人們到底能不能學會準確預測,他與團隊在美國 IARPA(情報高等研究計畫局)資助下,展開為期四年的大型預測競賽 Good Judgment Project(GJP),要解兩個核心問題:
- 世上真的存在「超級預測者」嗎?
- 如果有,他們憑什麼更準?這些方法能不能複製與訓練?
本書便是把這場實驗裡最有價值的故事、方法與數據,打包成人人可學的預測手冊。
《超級預測》核心觀念
1) 用「機率」說話:讓輸贏可被打分
超級預測者不說「一定會」「應該不會」,他們給百分比,並接受評分。評分方法叫 Brier 分數:把你的機率預測與實際結果做差、平方並平均(分數越低越好)。「機率語言 + 即時回饋」迫使我們面對過度自信,逐步校準自己的直覺。
為什麼重要? 沒有分數,就沒有學習;沒有機率,就談不上比較。你以為自己「差一點就對了」,在 Brier 分數面前都會被攤開。
2) 先用外部視角:找「基準率」當起跑線
面對陌生問題,直覺會被戲劇性細節吸走;超級預測者先問:歷史上相似事件的發生率是多少? 這就是外部視角,又稱 基準率(base rate)/參照類別(reference class)。先用基準率立一個不帶情緒的起點,再以案情細節微調。書中舉例:討論 阿拉法特是否遭毒殺 時,先看「政治領袖遭毒殺的歷史機率」,再納入地緣政治、嫌疑動機、檢測流程等細節修正。外部視角能避免被新聞的戲劇性牽著走。
3) Fermi 化拆解:把模糊問題變成可加總的小問題
不確定性像一團霧,Fermi 化(Fermi estimation) 的做法是把大問題拆成幾個可估的小塊,再把機率乘除加總。例如:「未來 6 個月內某國會否解除資本管制?」可拆成:法律程序完成的機率 × 執政黨意願 × 外部壓力 × 市場承受度……每一塊都能用數據與類比估,最後合成整體機率。拆解讓討論從「我覺得」變成「這一步要多少、為什麼」。
4) 小步快跑地更新:少量、頻繁、可追蹤
厲害的預測多半不是天才的靈光一現,而是小幅且頻繁的調整。研究顯示,願意根據新訊息一點一點修正的人表現更好。與其等到大新聞再把機率從 40% 跳到 70%,不如根據邊際訊息從 40 → 43 → 45 → 47% 逐步更新。這很像貝葉斯精神:先有先驗,再用證據推動後驗。
5) 問好問題:定義清楚、可驗證、有截止日
模糊的問題養不出好預測。比起「台海緊張會不會升高?」,更好的寫法是:「在 2026/12/31 前,是否會發生 X、Y、Z 三項可觀察事件中的至少一項?」並附上判定來源(如官方公告、主流媒體、資料庫)。好問題像一條清楚的跑道,能大幅提升預測品質,也避免事後爭論。
6) 團隊 > 個人:多元觀點與「理由書寫」
在 GJP 比賽中,團隊平均 經常勝過單打獨鬥。關鍵不是人多,而是把理由寫下來、互相挑戰:你寫下為何是 62%,我指出哪個假設太勇;她補一個反向數據。當每個人都必須用文字交代推論,盲點就會浮上檯面。這種理據透明的文化,遠勝過會議室裡的權威與嗓門。
7) 聰明地「加權平均」:聚合與「極化」(extremizing)
把一群人的機率直接平均常過於保守。GJP 的招牌技巧之一是 極化:先聚合眾人意見,再視訊息獨立性與歷史表現,適度把機率往兩端拉,讓群體判斷更有「解析度」。這不是逞勇,而是統計上對多訊息疊加的理性修正——既然蒐集到許多相互獨立的弱訊號,最後的結論就不該停在 52% 附近。
8) 當狐狸,不做刺蝟:多源資訊 × 反身懷疑
借用 Isaiah Berlin 的比喻:刺蝟有一個漂亮的大理論,狐狸則從各處撿線索、隨時修正。超級預測者明顯更像「狐狸」:對新證據敏感、敢自我否定、願意為不確定貼上 0.57 這種不帥氣的數字。這種氣質也許不性感,卻在真實世界更有韌性。
9) 追蹤誤差,訓練校準:讓自信與命中率對齊
只要長期記錄,你會看到自己的 校準曲線(calibration curve):你說 70% 的情境,是否真的約有 7 成成真?若 70% 的承諾只有 5 成兌現,你就過度自信;若常把 60% 寫成 55%,則太保守。校準不是面子工程,而是把主觀自信與客觀頻率慢慢對齊的紀律。
10) 人才、訓練、環境缺一不可
GJP 的研究總結四個關鍵:挑人(talent spotting)、訓練(de-bias)、組隊(teaming)、聚合(aggregation)。好的招募能挑出起步就較準的一群人;短時的去偏訓練與持續的實戰回饋,能進一步拉開差距;在正確規則下協作與聚合,則把個體優勢放大。結論不浪漫:超級預測不是天賦神話,而是可被發現、養成、放大的複合工程。
總結:把預測變成日常的思考肌肉
讀完《Superforecasting》,最深的感受是:預測不是為了炫耀「說中了沒」,而是為了做更好的決定。 它逼你把直覺拆開、把證據寫清、把自信對齊結果。以下三個態度,特別值得台灣讀者立刻採用:
- 把不確定「數字化」:機率不是冷血,而是對複雜世界的尊重。當我們用 0–1 之間的數字說話,合作更容易,分歧更具體。
- 把學習「可回收」:有分數就有迭代;有理由就能複盤。錯得明白,是下一次對得更好的起點。
- 把預測「社會化」:別把討論變成面子戰,而是證據戰。讓同儕挑戰成為日常,讓彼此的盲點在公開的理由裡現形。
對企業來說,這等於把「拍腦袋的戰略會議」升級為「可驗證的決策系統」;對個人來說,它是訓練理性與謙卑的雙重課。別等到世界完全明朗才動身——小步估算、持續更新,就是在霧中向前的正確姿勢。
延伸閱讀/行動清單
行動清單(先選 2–3 項開始):
- 建立預測日記:每週寫下 3 個問題(有明確判定與截止日),標上機率,記錄理由與資訊來源。
- 採用 Brier 計分:做一個簡單試算表,每月回顧自己的分數與校準曲線,觀察過度自信或過度保守。
- 三人預測小隊:固定時間交換彼此的「理由書寫」,要求彼此提供反證;最後做一次加權平均,再適度「極化」。
- 先外後內:下次開會決策前,先寫下基準率(外部視角),再討論細節(內部視角),避免被最新新聞牽著走。
延伸閱讀(入門到進階):
- 《Superforecasting》官方書頁(Penguin Random House):https://www.penguinrandomhouse.com/books/227815/superforecasting-by-philip-e-tetlock-and-dan-gardner/
- Good Judgment:超級預測者戰績與方法概述:https://goodjudgment.com/resources/the-superforecasters-track-record/
- IARPA ACE 計畫(比賽背景與 Brier 分數):https://www.citizenscience.gov/ace-forecasting/
- Good Judgment:Four Keys(人才、訓練、組隊、聚合):https://goodjudgment.com/about/the-science-of-superforecasting/
- Tetlock Edge 系列短課(含「極化」與聚合技巧):
- 學術研究:
- Mellers 等(2015):「誰預測得更準?校準與解析度」PDF:https://stanford.edu/~knutson/jdm/mellers15.pdf
- Atanasov 等(2020):「小幅頻繁更新者表現更佳」PDF:https://faculty.wharton.upenn.edu/wp-content/uploads/2022/03/1-s2.0-S0749597819300949-main.pdf
- IARPA 公布 GJP 資料集與研究摘要:https://www.iarpa.gov/newsroom/article/iarpa-announces-publication-of-data-from-the-good-judgment-project
- 作者介紹:
- Philip E. Tetlock(Wharton):https://mgmt.wharton.upenn.edu/profile/tetlock/
- Dan Gardner(官方頁):https://dangardner.ca/about/
從今天起,讓每一次「我覺得」都帶上一個機率與一段理由。幾個月後回頭看,你會驚訝:理性與謙卑,真的能透過預測這門手藝,一點一滴長出來。









