數據、謊言與真相
定價420元 | 特價79332
賽斯‧史蒂芬斯—大衛德維茲
(Seth Stephens-Davidowitz)──著
陳琇玲──譯

★結合《精準預測》的大量資訊分析、《異數》的敘事風格,以及《蘋果橘子經濟學》的機智風趣。

★Google前資料分析師描寫大數據最令人信服、深具挑釁,甚至令人捧腹大笑的一本書!

回答問卷、民意調查、接受採訪、臉書貼文 ──
我們都有可能說謊;但是你的搜尋行為可不會說謊!

面對朋友、醫生、家人、老闆,我們都不會完全坦白,
但當獨自在Google上搜尋時,我們會透露真實的疑惑、渴望與恐懼,
Google資料分析師用大數據推翻你對人們的既定印象,
從約會、選舉到體育,真相會讓你不安、驚訝、捧腹大笑!

作者證明大數據提供一種前所未有的方式,讓我們窺探人們的內心世界,因為人們透過鍵盤才會在無意中私密地坦承千奇百怪的事情。

作者認為,我們對人們的看法大多錯得離譜,因為人們會對朋友、情人、醫生、調查說謊,也會對自己說謊。然而,我們不再需要依賴人們告訴我們什麼。網路上的新數據,也就是數十億人在Google、社群媒體、約會網站,甚至色情網站留下的數位足跡,最後會揭穿事實真相。

這些不僅是新類型的數據,更有些是「誠實」的數據,在匿名機制下,彷彿四下無人時,人們才會吐露自己最真實的想法,以及真正想問的尷尬問題。這類數據就像數位版的「誠實豆沙包」,讓人們表達出自己的無性婚姻、個人精神健康問題、不安全感、受虐,以及對黑人或穆斯林的憎惡。

透過分析這座數字金礦,我們現在可以了解人們真正在想什麼,真正想要什麼,以及真正做了什麼。本書以極具啟發性的觀點解讀大數據,並以各式各樣有趣的案例忠實呈現網路世界與當代社會的現況,帶我們一窺人們的內心世界,同時得以重新認識自己與這個世界。

數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目
定價420元 | 特價79332
賽斯‧史蒂芬斯—大衛德維茲
(Seth Stephens-Davidowitz)──著
陳琇玲──譯

▍誠品書店當月選書

▍城邦讀書花園當月選書

▍亞馬遜非文學類當月選書

▍亞馬遜2017年年度最佳商管書

▍《財星》雜誌當月最佳商業書籍

▍《紐約時報》暢銷書

▍《經濟學人》《紐約郵報》《圖書館期刊》等    多家媒體推薦

▍苗博雅/《阿苗帶風向》主持人
   張鐵志/文化與社會趨勢觀察家
   馮勃翰/台大經濟系副教授
   ——誠實推薦

《阿苗帶風向》主持人苗博雅:
「透過作者風趣的文筆,我們知道大數據搭配電腦運算,有嶄新的力量……作者雖然醉心於以新穎方式分析海量數據,但他仍然在書中誠實地提醒讀者大數據的各種『能與不能』……本書的優點:簡明、幽默、易懂。只要讀者能夠看到最後一頁,勢必有所收穫。」
哈佛大學榮譽退休校長暨諾頓講座教授勞倫斯‧桑默斯(Lawrence Summers):
「《蘋果橘子經濟學》(Freakonomics ) 和《魔球》(Moneyball )都要靠邊站了。這本精彩傑作是說明大數據結合聰明才智如何撼動世界的最佳示範。閱讀這本好書,會讓你以嶄新的方式看待生活。」
《人性中的良善天使》作者史蒂芬‧平克(Steven Pinker):
「研究思維的一種嶄新方式,史蒂芬斯—大衛德維茲的發現一次又一次地顛覆我對自己國家和同胞先入為主的看法……這本書真是太令人著迷了。」
《蘋果橘子經濟學》合著者史蒂芬‧李維特(Steven Levitt):
「針對大數據揭露人們日常生活真相做出絕頂聰明又機鋒處處的探索。史蒂芬斯—大衛德維茲是我見過最會善用數據說故事的高手。」
《我們是誰?大數據下的人類行為觀察》作者克里斯汀‧魯德(Christian Rudder):
「對於我們生活的數據進行振奮人心又引人入勝的審視……大數據會徹底推翻你對人們的既定印象,真相會讓你畏縮、暗自竊笑並搖頭嘆息。」
《注意力商人》(The Attention Merchants ) 作者吳修銘(Tim Wu):
「《數據、謊言與真相》仰賴大數據迅速拆穿我們自以為文明的假象。一本讓人既著迷又震驚,時而駭人聽聞的傑作。最棒的是,讓真相一覽無遺。」
史丹佛大學經濟學教授拉吉‧切提(Raj Chetty):
「《蘋果橘子經濟學》的增強版,這本書顯示大數據如何能針對重要有趣的問題,提供我們驚人的新答案。史蒂芬斯—大衛德維茲以機智俐落的方式提供數據分析,為構成社會科學的大數據提供精闢出色的介紹。」
拉扎德投資銀行(Lazard)董事總經理暨前國會預算辦公室主任彼得‧奧薩格(Peter Orszag):
「傑作!!!作者妙筆生花敘述透過大數據進行的一場寓教於樂之旅。這場旅程剛好為人類行為本身提出一個重要的新觀點。如果你想了解我們居住的世界正在發生什麼事,甚至是了解你的友人究竟怎麼回事,你就該從頭到尾看完這本書。」

別讓直覺扯你後腿——是什麼造就了NBA球星?

小時候,我只有一個夢想:我希望長大後成為經濟學家和數據科學家。沒有啦,我開玩笑的。小時候我很想成為職籃球員,效法我的英雄——紐約尼克隊明星中鋒派崔克.尤英(Patrick Ewing)。

有時我懷疑每一位數據科學家的內心都像小孩一般,設法弄清楚為什麼自己童年的夢想沒有成真。難怪最近我會調查要在美國職籃(後稱NBA)闖出名號,需要具備什麼條件。調查結果令人驚訝。事實上,調查結果再次證明,有效的數據科學可能如何改變你對世界的看法,以及這些數字可能多麼違反直覺。

我特別關注的問題是:在貧窮家庭長大,還是在中產階級家庭長大,讓你更有可能在NBA成名?

大多數人會猜前者。一般人都認為,在貧困環境下長大,也許由十幾歲未婚媽媽辛苦扶養的環境,有助於培養在這種競爭激烈運動比賽中達到頂尖水準所需的驅動力。

費城高中籃球教練威廉.艾勒比(William Ellerbee)在接受《運動畫刊》(Sports Illustrated )採訪時表示:「郊區小孩打球往往只是為了好玩,但都市貧民區的小孩卻把籃球當成生死攸關的大事。」唉,我是在紐澤西州郊區由雙親扶養長大,而我這個世代最優秀的球員雷霸龍.詹姆斯(LeBron James),是在俄亥俄州阿克倫由一名十六歲貧窮的單親媽媽扶養長大。

事實上,我進行的一項網路調查顯示,大多數美國人的看法跟艾勒比教練和我一樣:NBA球員大多在貧困環境下長大。

這種普遍看法正確嗎?

我們來看看數據怎麼說。目前並沒有關於NBA球員社經背景的綜合數據來源,但是藉由數據檢測,利用來自許多來源的數據,例如basketball-reference.com、ancestry.com等網站和美國人口普查及其他數據,我們可以弄清楚哪些家庭背景最有利於NBA球員的養成。你會發現這項研究使用各種數據來源,其中有些數據來源較大、有些數據較小,有些是網路數據、有些是離線數據。跟一些新的數據來源同樣令人振奮的是,只要傳統來源的數據有幫助,優秀數據科學家不會將其摒除在外。取得問題正確答案的最佳方式是,結合所有可用的數據。

第一個相關數據是每個球員的出生地。針對美國的每個郡,我記錄在一九八○年代出生的黑人人數和白人人數。然後,我記錄他們當中有多少人成為NBA球員。我把這個數據跟各郡家庭平均所得進行比較。我還控制一個郡的種族人口統計數據,因為黑人成為NBA球員的可能性大約是白人的四十倍,光是這個主題就足以寫一本書好好研究。

數據告訴我們,出生在富裕郡的男孩,更有機會成為NBA球員。舉例來說,跟在最貧窮郡出生的黑人小孩相比,在美國最富裕郡出生的黑人小孩成為NBA球員的可能性是前者的兩倍之多。對白人小孩來說,最富裕郡出生的白人小孩成為NBA球員的可能性,則比最貧窮郡白人小孩的可能性高出六○%。

這表示事實跟普遍的想法正好相反,出身貧困的NBA球員並沒有我們想的那麼多。然而這個數據並不完美,因為美國許多富裕郡,如紐約郡(曼哈頓),也包括哈林區等貧困地區,所以,童年貧困還是有可能激勵小孩成為NBA球員。我們還需要更多線索和更多數據來佐證。

所以我調查NBA球員的家庭背景。這項資訊是在新聞報導和社群網路中找到的。這種方法相當耗時,所以我把這項分析限制在一九八○年代出生、得分最多的一百位非裔美籍NBA球員上。跟美國一般黑人相比,NBA超級明星球員由青少年媽媽或未婚媽媽所生的可能性少了三○%。換句話說,NBA最優秀黑人球員的家庭背景也顯示,寬裕的家庭背景是實現成功的一大優勢。

然而,不管是郡出生數據和有限球員樣本的家庭背景,都沒有提供所有NBA球員童年的完美資訊。所以我還不完全相信中產階級的雙親家庭會比貧困單親家庭,養育出更多NBA球星。針對這個問題我們能蒐集到愈多數據愈好。

然後我想起另一個數據點可以提供球員背景的線索。羅蘭.弗萊爾(Roland Fryer)和史蒂芬.李維特(Steven Levitt)這兩名經濟學家在一篇論文中提到,黑人的名字是個人社經背景的一項指標。弗萊爾和李維特研究一九八○年代加州的出生證明發現,在非裔美國人中,貧窮未受過教育的單身媽媽往往會給自己小孩取很特別的名字,跟中產階級受過教育的已婚雙親會為小孩取的名字不同。

來自富裕背景的小孩更有可能取菜市場名,譬如:凱文、克里斯和約翰。貧困家庭出生的小孩,名字可能較為獨特,譬如:Knowshon、Uneek和Breionshay。出生貧困的黑人小孩,他們名字和同年出生的其他小孩大為不同的機率將近有兩倍之多。

那麼,NBA黑人球員的名字又是什麼狀況呢?他們的名字聽起來更像中產階級出身,還是窮困家庭出身?檢視同一時期加州出生的NBA球員,他們取獨特名字的可能性是一般黑人男性的一半,這是統計數字顯示的一項顯著差異。

你認識的人當中,是否有人認為NBA是出身貧民區者的聯盟?那你可要告訴此人,只要仔細聽聽下一場比賽的轉播,注意羅素有多少次運球超越德懷特,然後試圖將球從賈許伸出的手臂中滑入凱文正等著接球的手裡。如果NBA真的是一個充滿貧窮黑人的聯盟,那麼賽事轉播聽起來會很不一樣,會有更多球員的名字像雷霸龍。

現在,我們蒐集了三種不同證據,包括出生郡、得分最高球員母親的婚姻狀況以及球員的名字。沒有一項數據來源是完美的,但三者都支持同樣的說法。更好的社經地位表示更有可能成為NBA球員。換句話說,普遍的看法是錯誤的。

一九八○年代出生的所有非裔美國人中,約有六○%者的爸媽是未婚的。但是據我估計,在那個年代出生、後來成為NBA球員的非裔美國人中,絕大多數來自雙親家庭。換句話說,NBA不是主要由雷霸龍這類背景的男性組成。有更多的男性像克里斯.波希(Chris Bosh)這樣,在德州由雙親扶養長大,培養出喜歡電子玩具的興趣。或像克里斯.保羅(Chris Paul)是北卡羅來納州路易斯維爾中產階級雙親家庭的第二個兒子,他的家人跟他一起在二○一一年上了一集益智節目《家庭大對抗》(Family Feud)。

( 本文摘錄自第一章〈別讓直覺扯你後腿——是什麼造就了NBA球星?〉)

 

推薦序 現象、真相與解方──提到「大數據」,你想到什麼?/苗博雅
推薦序 大數據成了窺探你內心的新窗口/史蒂芬‧平克

前 言 川普勝選讓你跌破眼鏡?那是你沒看懂數據
──歐巴馬勝選代表種族歧視已經好轉?看看「黑鬼」的搜尋次數好嗎?

第一篇 管他大數據還是小數據
第一章 別讓直覺扯你後腿──是什麼造就了NBA球星?

第二篇 大數據的驚人力量
第二章 佛洛伊德說的正確嗎?──拼錯字背後隱藏的慾望
第三章 怎樣的數據算是大數據?──每個年代都可以算出「平均長相」
第四章 躲在線上的真相──你永遠問不出來的同志比例、仇恨言論、性隱私和顧客的腦袋
第五章 我們周遭發生了什麼事?──逃稅最嚴重的城市
第六章 整個世界,都是我的實驗室──怎樣的頭條標題吸引人?

第三篇 小心面對大數據!
第七章 大數據,大垃圾?──大數據看起來很萬能,但別拿它來算明牌!
第八章 愈多數據,愈多問題?──我可能因大數據而無法借款?
結 論 大數據告訴我,很少人看到最後一頁

賽斯‧史蒂芬斯—大衛德維茲
Seth Stephens-Davidowitz

《紐約時報》撰稿人暨華頓商學院客座講師,曾為Google數據科學家。史丹佛大學哲學系畢,哈佛大學優等生榮譽學會(Phi Beta Kappa)成員暨經濟學博士,目前定居紐約市。史蒂芬斯—大衛德維茲的研究使用新的大數據來源,揭露人們潛藏的行為和態度,並已刊登在《公共經濟學期刊》(Journal of Public Economics )等聲望卓著的出版物。
推薦序 現象、真相與解方──提到「大數據」,你想到什麼?/苗博雅
推薦序 大數據成了窺探你內心的新窗口/史蒂芬‧平克

前 言 川普勝選讓你跌破眼鏡?那是你沒看懂數據
──歐巴馬勝選代表種族歧視已經好轉?看看「黑鬼」的搜尋次數好嗎?

第一篇 管他大數據還是小數據
第一章 別讓直覺扯你後腿──是什麼造就了NBA球星?

第二篇 大數據的驚人力量
第二章 佛洛伊德說的正確嗎?──拼錯字背後隱藏的慾望
第三章 怎樣的數據算是大數據?──每個年代都可以算出「平均長相」
第四章 躲在線上的真相──你永遠問不出來的同志比例、仇恨言論、性隱私和顧客的腦袋
第五章 我們周遭發生了什麼事?──逃稅最嚴重的城市
第六章 整個世界,都是我的實驗室──怎樣的頭條標題吸引人?

第三篇 小心面對大數據!
第七章 大數據,大垃圾?──大數據看起來很萬能,但別拿它來算明牌!
第八章 愈多數據,愈多問題?──我可能因大數據而無法借款?
結 論 大數據告訴我,很少人看到最後一頁

賽斯‧史蒂芬斯—大衛德維茲
Seth Stephens-Davidowitz

《紐約時報》撰稿人暨華頓商學院客座講師,曾為Google數據科學家。史丹佛大學哲學系畢,哈佛大學優等生榮譽學會(Phi Beta Kappa)成員暨經濟學博士,目前定居紐約市。史蒂芬斯—大衛德維茲的研究使用新的大數據來源,揭露人們潛藏的行為和態度,並已刊登在《公共經濟學期刊》(Journal of Public Economics )等聲望卓著的出版物。