
「我兒子為什麼這麼有天份?」在 Google 上的搜尋次數,是「我女兒為什麼這麼有天份?」的 2.5 倍。
——Seth Stephens‑Davidowitz
深夜 2 點,你躺在床上滑手機,輸入「我聞不到味道是不是得了 Covid」;同一時刻,千公里外的陌生人正在搜尋「如何偷偷查另一半的訊息」。隔天官方數字還沒公布,Google Trends 上「loss of smell」的暴衝就預告了一波疫情;而那位陌生人,很可能比任何親友都先知道自己關係的裂縫。只要你敲下鍵盤,大數據就替你寫下情書、懺悔錄,甚至死亡預告。
我們以為自己獨處,卻其實把最赤裸的靈魂交給了搜尋框——它既是全世界最大的告解室,也是全球最龐大的真心話俱樂部。
《Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are》正是這間「告解室」的使用指南。它要告訴我們:在鍵盤背後,你不再是精心包裝的社交化身,而是毫無防備的透明人。這不僅與你息息相關,更將重塑未來政治、商業與倫理的遊戲規則。
作者與本書介紹
Seth Stephens‑Davidowitz 出生於紐澤西,父母都是心理學家,家中餐桌話題經常圍繞「人們為什麼這麼做?」。他在哈佛攻讀經濟學博士時偶然取得 Google 搜尋資料,發現那些匿名的關鍵字比任何民調都更靠近人心,從此一頭栽進「數位行為學」。離開校園後,他進入 Google 擔任數據科學家,後來成為《紐約時報》《衛報》的固定專欄作者,專寫「搜尋暗語與社會現象」。
寫這本書,一半是社會學家的熱情,一半是記者的好奇。Seth 想回答兩個問題:(1)人們表面行為和真實想法差多遠?(2)大數據能否為公共政策與商業決策提供更誠實、即時的指引? 於是,他把海量搜尋、社群足跡、Pornhub 點擊、Netflix 停留時間……全都搬進統計模型,再配上犀利又幽默的文字,讓冷冰冰的數字瞬間有了體溫。本書自 2017 年出版以來,被譯成 20 多國語言,進入《金融時報》與《麥肯錫》年度商業書籍榜單,也成為行銷、政治、公共衛生領域的必讀參考。
1|「數位真心話」:搜尋框是最誠實的測謊機
2012 年美國總統選舉前夕,歐巴馬的支持度在多數民調領先,但 Seth 發現,在某些郡縣,「n‑word jokes」「Obama Muslim」這類歧視性搜尋量高得驚人。最終結果顯示,這些地區的投票確實更傾向共和黨。十年後的 2022 年期中選舉,同樣的語意分析預告「犯罪」「通貨膨脹」的關鍵字浪潮,精準反映經濟焦慮。面對陌生訪員,人們會自動穿上政治正確的西裝;面對鍵盤,連西裝內的衛生衣都懶得穿——搜尋記錄是全球最大的測謊機,成本低、樣本大、幾乎無可隱藏。
美國 Google 搜尋「How to vote Trump in Spanish」在 2016 年九月突然飆升,透露出西語裔選民對川普的「偷愛」。無論他們最終投票與否,這波搜尋已讓團隊提早布局搖擺州字幕廣告。
2|微數據大力量:樣本不是越多越好,而是越「真」越好
Netflix 擁有 3 億用戶、上億影片評分,但真正能預測你今晚點哪部電影的,不是五星好評列表,而是遙控器停留在縮圖上的 400 毫秒。Tinder 工程師也透露,拇指在照片上停頓 1.2 秒以上比右滑左滑更能預測「心動」程度。Seth 稱這些為「微數據」(microdata):它們體積小卻直指無意識,如同指紋般獨特。
- 行為 > 回答:人們願意動手不一定願意動口。
- 隱含成本低:點擊只需 0.3 秒,填問卷得 3 分鐘,真實度差十倍。
因此,真正的資料科學不在於「裝更多水」,而是「找到泉眼」。公司若只堆高伺服器容量,卻忽略關鍵行為指標,彷彿拿掃把與台風對抗——姿勢嚴謹但無濟於事。
3|預測祕密:Google Trends 能打敗民調嗎?
Google Trends 的「即時」與「行為取向」優勢,在疫情與選舉中屢屢立功:
- 疫情偵測:哈佛研究團隊發現,「loss of smell」「corona test near me」在病例激增前 10–14 天上升,可作為提早預警系統。
- 電影票房:輸入片名 + tickets,可在首映前 48 小時預測週末票房,誤差不到 10%。
然而,盲信大數據也可能翻車。2013 年 Google Flu 項目因演算法偏重「新聞熱搜」噪音,導致流感病例高估兩倍。Seth 用這個案例提醒:大數據不是萬能藥,資料科學家必須時刻追蹤模型漂移(model drift)與語意變化。
4|偏見的放大鏡:我們也在演算法裡照見自己
家長搜尋「Is my son gifted?」遠高於「Is my daughter gifted?」;女性搜尋「I’m fat」頻率是男性的三倍。這些搜尋印證了性別刻板印象,也成為演算法訓練素材。當推薦系統只餵你既有興趣,你會陷入更深的同溫層。2018 年 Amazon 內部的 AI 招募工具因學習歷史資料,竟自動降低女性程式設計師的分數,最後被緊急下架。
▶️ 行銷啟示:如果廣告投放只依男女「既有興趣」分眾,你將永遠錯過那些想「改變」的消費者。洞察偏見,才能打破偏見。
5|問對問題,比擁有數據更重要
Seth 曾用 Facebook「按讚」資料預測人格(OCEAN 指標),結果準確率隨樣本量增加並未線性成長,一旦問題設計錯誤,模型就像開錯方向的特斯拉,自動駛向懸崖。資料是望遠鏡,提問是方向盤。 想知道「誰會買新能源車?」與「哪些人對減碳有情感連結?」得出策略完全不同。領導者若只丟狗骨頭給演算法,就會得到「更多狗骨頭」的答案。
6|隱私與倫理:當「誰在看」成為真正的問題
從 Cambridge Analytica 到台灣健保資料庫開放爭議,Seth 一再強調「可被識別性」風險。只要拼湊 15 個匿名搜尋,就能推算 90% 使用者的身分。歐盟 GDPR 規定「被遺忘權」,但在區塊鏈時代,刪除更像把水倒進大海再撈起。
- 再辨識攻擊(re‑identification attack):研究顯示,美國 87% 公民可僅透過「郵遞區號+生日+性別」被唯一定位。
- 保險差別定價:若保險公司取得搜尋「胸痛」「戒菸」紀錄,健康險保費恐怕翻倍。
7|數據地緣政治:民主與專制的戰場
在民主國家,大數據常用於選戰、公共衛生;在專制體制,它則可能成為社會信用系統的鞭子。Seth 揶揄:「同樣是搜尋『移民』,有人得到簽證廣告,有人得到請喝茶的電話。」數據成了新石油,也成了新疆域——誰掌握基礎設施,誰就握有話語權。對台灣而言,如何在開放創新與國安防護間取得平衡,將是下一個十年的戰略課題。
8|AI 世代的自我覺察:讓大數據成為自助餐,而非餵食秀
ChatGPT 等生成式 AI 讓個人也能「調用大數據」。Seth 鼓勵讀者把自己的搜尋匯出,用 NLP 工具做「情緒雲」,看看一年來最常出現的字眼。你會驚訝地發現:那些半夜的焦慮、衝動購物紀錄,比好友更了解真正的你。自我覺察是 AI 時代的新教養:知道自己把什麼餵給演算法,等於在為未來的自己下訂單。
《數據、謊言與真相》總結
從逢甲夜市的行動支付到 PTT「崩潰」貼文,台灣人的線上軌跡一樣誠實得可怕。真正的課題不是「大數據准不準」,而是我們願不願意對鏡中倒影負責。
- 對企業:下一個護城河不是資料量,而是能否把「數位真心話」轉成「動作」——搶在消費者意識到需求之前就端上解方。
- 對政府:公共決策若缺乏即時數據,只能開「霧裡看花」的記者會;若過度蒐集,又可能滑向監控國家。治理的藝術在於透明機制與公民參與。
- 對個人:下一次打開搜尋框前,先問自己:我害怕被別人知道什麼?或許那才是人生必考題。
金句:搜尋紀錄是一面鏡子,映出的是你不敢直視的皺紋,也照亮你修補皺紋的方向。
延伸閱讀/行動清單
- 用 Google Trends 追蹤「房價 泡沫」「移民 台灣」「AI 失業」近五年曲線,觀察社會情緒高低起伏。
- 下載 Data Detox Kit,刪除十個不必要的 App 權限,體驗「數位輕斷食」。
- 讀 Cathy O’Neil《Weapons of Math Destruction》+ Virginia Eubanks《Automating Inequality》,理解演算法對弱勢族群的衝擊。
- 在公司啟動「搜尋日記實驗」:匿名蒐集一週內員工最常搜尋的三個困擾,做文字雲,找出隱性痛點。
- 練習把自己的 YouTube 觀看紀錄匯出,用 AI 工具做主題分類,檢視「資訊飲食」是否營養均衡。









