因果革命:人工智慧的大未來(硬殼精裝)

9折$ 612
4 /5
7位讀者評分
5
43%
4
29%
3
14%
2
14%
1
0%

精選書評

全部書評 | 共7則書評

評鑑星等(可複選)
評鑑日期
user-img
3.0
|
2025/03/17
從介紹因果圖進行推理的概念,講述統計學如何忽視因果性,應用因果圖的範例及效應,最後說明因果革命相對於人工智慧發展如機器學習等有何勝出之處及起了什麼影響,以及為何能幫助我們打造具備道德思考的人工智慧
user-img
4.5
|
2023/01/10
因果革命 - 人工智慧的大未來

許多志向遠大的 ai 科學家,把 AGI(通用人工智慧) 作為生涯發展的終極目標之一,希望能讓機器模擬人類的智慧。不過要達成這個目標,任務極度艱鉅,尚有許多失落的環節需要補足,其中之一就是「因果推論」。

當今各種資料分析方法,不論是統計學或機器學習,都只能求得事物的「相關性」,而無法斷定其「因果性」。縱使近年來勢如破竹、綻放光芒、大獲成功的深度學習(神經網路),對於因果問題依然束手無策。

「因果性」為何如此重要?

若知道兩個變數具有「相關性」,我們就能透過其中一個變數的升降,來預測另一個變數的升降。但若能知道「因果性」就更厲害了,我們就能進一步從「因」介入,而達成所希望的「果」。

簡而言之,知道「相關性」只能預測世界,而知道「因果性」卻得以改造世界。

可惜的是,傳統上要得到因果性非常困難,光憑資料分析並無法求得事物的因果性,若要斷定因果性,唯一的方法是進行「隨機對照」實驗(例如醫學上的臨床實驗),但做實驗不僅勞民傷財,而且曠日費時。

百年來就陸續有科學家思考此一問題,希望能夠找到方法,不必做實驗,只透過資料分析,就能解開因果問題。但一直到前幾年,才由圖靈獎得主 Judea Pearl 集其大成,他從貝氏機率出發,發展出貝氏網路,進而發現因果的3層階梯,最後終於發明了因果網路,一舉破解因果之謎, 拿下 ai 研究的重大聖杯。

Judea Pearl 的名言是 “Mind over data”(思想勝過資料),因果推論的原理是由邏輯推理所驅動,而機器學習的方法是由資料所驅動。他認為人類智慧的運作方式更趨近於邏輯推理驅動,而非資料驅動。這也是為何神經網路要看過1萬隻貓後,才能學會辨識出貓,而人類的嬰兒只要看過1隻貓,一輩子都有能力辨識出各種千奇百怪的貓,智慧高下立判。

因果推論是 ai 科學的下一代殺手兵器,Judea Pearl 透過此書把他精巧的軍備全盤托出,毫無保留,奉獻給世人。受到他的啟發,當今世上各種因果推論的應用正在嘗試展開,而 DeepMind、Netflix 等先驅公司也都紛紛投入資源,開始探索這個領域。

我認為,有朝一日,假若有科學家能發明方法,把機器學習與因果推論融合為一,ai 的未來必定一飛沖天、一鳴驚人。
展開
user-img
3.5
|
2022/06/15
|
電子書
probabilistic graphical model = 一套結合機率論與圖論的數學理論架構(AI中常用)

其中最重要的一類 probabilistic graphical model,即是用有向非循環圖(DAG)表示的 Bayesian network,被本書作者拿來描述因果結構。

用 Bayesian network 描述因果結構,可以統合各學科探討因果關係的傳統方法,包括心理、社會學中的結構方程模型(SEM)、計量經濟學中的工具變量(IV)、流行病學中的隨機試驗(RCT)、哲學中的反事實語意等。有以上相關學科背景的人,讀這本會比較好懂;雖然本書定位為科普,但其寫作形式恐怕難讓一般大眾產生共鳴。

若能看英文的話,網路上有很好的免費資源,從因果推理的基本精神(個人覺得比這本「科普」書更好懂)到詳細的數學推導(一般大眾可跳過)都有涵蓋:

1. 哈佛流行病學教授 Miguel Hernan 的 edX 課程,以及教科書 Causal Inference: What If 免費下載

2. MIT 出版社的 Elements of Causal Inference 免費下載
展開
user-img
3.5
|
2021/07/25
書評:因果革命:人工智慧的大未來
The Book of Why: The New Science of Cause and Effect

總評價: ★★★✭☆
----------------------------------------------
通用性: ★★★☆☆
實用價值: ★★★✭☆
內容深度: ★★★★★
內容密度: ★★★★✭
敘事易讀性: ★★★☆☆
翻譯與排版: ★★★✭☆

註:星等意義可參照Amazon.com 美國版或日本版的書評狀況。
深度密度等,為對於:從書名與書籍系列推斷之,預想目標讀者程度為相對參照。


【內容】
中心主旨在講:「具有相關」不一定代表「因果關係」。特別是在目前的「人工智慧」「大數據」研究中容易出現的問題。

本書所講的「因果模型」「因果推論發動機(名詞本身不重要)」等詞,源自於作者電腦科學背景。基於電腦程式語言架構、目的、運作流程;其不甚滿意統計數據上,沒有/刻意不表示出「因果關係/自變數與應變數」的判斷(註:原始目的就不同)。其所說的「因果模型」「因果推論發動機」,為一種亦可用因果流程圖作表達、與驗證測試之機制(有輸入/輸出端)。

其推倡之「因果模型」為一種可敘述「因果關係/自變數與應變數」之表達、與驗證方式。本書重點在於其敘述方式之建構與提倡,並清楚區分一些如「主動改變至此狀態」與「具有此種狀態」的區分表達。

目前電腦資料中通常沒有建構因果常識、轉化敘述性資料時也有問題。遠程來說,作者希望可建構出人工智慧瞭解與判別因果關係的能力。否則電腦處理統計後,只會回答「這些要素有多少相關性」的官話:正確而無添加,但也沒什麼用。

自統計資料到因果關係的初步應用,有時會在釐清所有直接因果/機轉路徑前,可合理驗證獨立要素且無不良影響後就施作。此類狀況,小自商品陳列販賣、大至某些藥品(先救人)。

但因果/機轉路徑常不只一種,且不單是 Yes/No而是需量化、有時間差變異、且案例背景不是都一樣,如本書p.35, p.51, p.116例。

此類驗證屬本書第四章RCT( Randomized Controlled Trials)。白話:我們下次再試看看另一種作法,改變這個參數來比較。但實際常卡在難有對照機會,特別是在歷史或社會科學的宏觀領域,時間點或群眾已經改變。

以及,其在本書表述之與RCT類似或代用的「介入(調整)」演算。基於資料/大數據分離出其他因素之影響。唯此作業不適合手工計算,書中沒放太多公式,而重於概念說明與因果圖示。因定義上該演算必是多變數回歸,且還不一定是直線(平面)性。註:作者Judea Pearl之前的重大成就,為確立基於條件機率的「貝氏網路」(電腦)演算法。

本書之第三階最終「反事實(無前例)」階段為「虛擬」反事實推演。目的是推斷事物規則「因果關係」,並假設該規則可適用於無前例的情況。以本書所提倡之方式判別各段因果,「以資料/數據估計因果關係」(但仍受制於假設的健全性)。

此為要讓人工智慧能夠假設、理解、驗證事物規則,並作出基於事物規則的反應或建議,為其所說的「因果革命」(用於人工智慧時)。


【實用價值】
本書如標適用於對「人工智慧」有興趣的人。相關要素包含邏輯與統計。書中講邏輯的部份,不需前置知識,思緒清晰即可。

條件機率與因果關係為本書敘述之主幹。書中統計的說明,會用到如高中條件機率(貝氏定理),與大學統計的型一與型二誤差等。目前因疫情,常聽到的是偽陽性偽陰性問題。專有名詞多但順著看就可不必強記名稱,知道在作什麼就好。如果覺得閱讀負擔大,對已逝歷史及學者生平與研究歷程可以跳過。本書近半篇幅是這類東西。

對讀者的運用價值上,對非涉人工智慧研發或運用者,可對一些狀況的表述、判讀、與邏輯判斷可有些幫助。

廣汎的說是歸因與議題驗證的邏輯思考。如悖論與具未明他因等「表外」要素時,思考要完整、且要對事象有全盤瞭解。解題所需的要素不一定在題目中報表上。要有全盤瞭解,才能分辨出是否有其所述「後門」要素(在背後作怪的東西);以及可能存在的「前門」要素-找出隱藏之中介機制/要素,將之前機轉未明的間接影響,改成較直接的影響,讓它顯現與驗證。


註:雖說他是在強調一個表述方法(與幾個數理規則),可能被認為表述方法不是很重要。但更換表述的效果可能比一般人認知的來得大。

語言可以引導思考、思考會受制於使用的語言(有文化,但也有語言自身的效果與限制)。如英語與中文的思考方式就不同;或是如管理上講的what gets measured, gets managed。如果不能measure表述、甚至沒有去定義一個東西,就不太會去有效管理它。未經定義的東西,很難一直把它保持在有意識的思考中。


【翻譯與排版】
翻譯不是很順。為免蓄意挑選的疑惑,均以列示作者序或本文最開頭 3~5 句為代表。

本書譯:
「將近二十年前,我為自己的《因果論》(Causality)寫序時,提出這樣大膽的評論:『因果性已經出現重大轉變,從壟罩在迷霧中的概念,變成具有明確語意和完整邏輯的數學物件。矛盾和爭議已經解決,不明確的概念已經闡明,長久以來被視為形而上或棘手、必需依靠因果關係的實際問題,現在可以運用基礎數學原理解決。簡單說來,因果性已經數學化了。』」

部份詞語疑自行按字面轉翻且拿捏有疑。如 p.277稱「若非因果關係」。此譯法除不通用,與上下文連結也會造成句意不清之閱讀困難。應指But For Causation「若無、則非(則不發生其果)」因果關係。稱「若非因果關係」會改變句子文意。中文裏沒有專有名詞開頭大寫的處理,現在也沒什麼人在用私名號來標示專有名詞以防混淆了。

而在假定譯者有直譯現象時(不會主動添字或重組說法、但也不會主動略去單字),本書許多敘述有省略而不明說應要敘述詞語的現象(代號未表述、代名詞或應有子句不清晰甚至省略),文章的易讀性並不佳。
展開
user-img
4.5
|
2021/07/12
對於工作上需要使用機器學習模型、解讀數據意義的人來說,這本書很有啟發性。前面一、二章把問題意識破題得很清楚:只考慮關聯性而未考慮因果性,將有決策問題。而因果性需要數學模型,才能以演算法的方式處理。概念上這是可以理解的。
第三章講貝氏定理的意義,覺得詮釋得蠻特別的。為了處理工作上的問題,我回頭把這章讀了兩次,終於讀懂貝氏定理的應用方式。
但是後半部的章節講如何實際應用因果圖做因果推論就很難讀懂了,覺得應用面沒辦法只看文字,需要看程式碼,但作者沒有提供額外的資訊。
網路上有找到其他學者接續這本書之後的發展,是一本正在寫成的書,尚未出版,有提供前面幾個章節,他們使用的函式庫是DoWhy(python),他們要處理的問題也很清楚:真實的資料中,往往無法執行隨機控制實驗,那麼應該如何做因果推論。
我覺得這本書只是一個起點,提出一個新的思考框架,看似蠻顛覆性的,像是一種新的思考語言,看起來有點陌生,需要多個文本交互參照著讀,但若讀懂了,對於思考問題是蠻有幫助的。
user-img
5.0
|
2019/09/04
|
電子書
這本書從七月到八月中,終於看完一遍。先說我的背景,是理工,在學校未學過機率與統計,但是在去年因為學習人工智慧,才稍微摸到皮毛。看過很多人評論這是一本難懂的書,對我而言,卻覺得這本書其實寫得還算淺顯易懂,可能是剛好上過coursera 「概率图模型 專項課程」,第一堂課。對於其中的定義,以及最後幾章的數學公式,有所理解。買這本書的動機,是因為對於「貝氏定理」不理解,真的是買對了,因為就是這位作者利用貝氏定理,在上個世紀做的題目,由他娓娓道來,自然更容易懂了。作者在書裡,我覺得說不清楚的地方,是「置信度傳播」,這也是他發明的做法。這裡需要參考網路上其他人的說明,倒也不是難事。
作者在條件機率上加上 do ,最後消去使得 do 等於 see ,也就是人類可以利用推理,就可以達成他在書上所說第二層,以及第三層反事實,講得頗為精妙。他也說了一個小故事,是由一位物理博士田津寫出來的,當這簡單的數學公式發表,眾人都不敢相信。
順帶一提的是前幾天,Yann Lecun演說反駁的就是這位作者主張現在的神經網路無法完成因果推論。
user-img
1.5
|
2019/08/14
我看不懂這本書。

當然,看不懂應該沒有資格評價,然而,本書作者在序言清楚表示目標讀者是一般大眾,我可以保證,一般大眾絕對連皮毛都看不出個所以然。作者的目的 ─「將因果革命介紹給一般大眾」是失敗的。

別被出版社自己編的副標題誤導了,這本書主要不是談人工智慧,這本書談的是「統計」。讀過統計的應該都知道「相關不等於因果」吧,作者認為,統計學長年不談因果推論是一大錯誤,作者大力闡揚具有因果推論的統計學,發明了一套因果推論體系,開發相關工具如「因果圖」、包含因果推論的數學式等,讚賞路徑分析、中介分析、結構分析等早年具有因果推論的嘗試,而近年來相關統計技術的發展,作者便稱之為「因果革命」,並指出這種革命將大大改變未來統計的應用性。個人在研讀研究所時,用的就是結構方程模型,自己也買了一本專書來研讀,遺憾的是,那本書不注重闡釋原理原則 (與國內大多統計教科書類似),讀完還是一知半解,最後我還是跟大多數研究生一樣,放棄對原理的了解,純粹將這技術當作「工具」來使用,只要確定我的資料適用就夠了,其他交給軟體去跑。看到這本書的時候,原以為我可以彌補當年的遺憾,能夠對因果統計技術的原理有更深層的了解,結果我錯了。

作者對於統計學界長年忽視因過推論這件事,非常不能苟同,至今還是有很多學者對於路徑分析、結構方程的因果推論性存疑,作者急欲證明因果數學的效力絕對不亞於「實驗操弄」,便出了本書,想讓一般大眾了解作者的理論,據此改變整個統計學界。可惜的是,作者出了一本一般大眾根本看不懂的書,別說普通人了,就連讀過一般統計學的人也看不懂,我也是念到研究所才知道路徑分析和結構方程這些玩意。作者刻意採用「非數學」的語言,以為這樣就能讓變成通俗讀物,可惜弄巧成拙,有些東西就是必須要用數學來表達,硬要用通俗語言只會弄得更隱晦難解。本書的因果數學,其中最基礎的 do 運算子,從頭到尾都沒說清楚是什麼 (白話當然說不清楚),這使得後續的因果數學完全不知所以然。作者的思維層級早已遠超一般人,已經難以想像一般人的背景知識與自己到底有多大的差距,例如,作者在某段艱深難懂的推論後說明「相信讀者現在一定跟我一樣興奮」,顯現出作者強烈的投射作用,表面上想以白話的方式來呈現,又不經意地把讀者當成統計專才,書中常常提到「執行對照」,我打賭只念過一般統計學的人不會知道這是什麼東西。

個人認為,至少需要統計本科系、碩士級或以上的學術訓練,才能一窺本書奧秘,如果是衝著人工智慧來看的,保證你大失所望,作者只有一章談論人工智慧,講的無非是因果推論才是未來真正 AI 的解方,但作者本人卻已離開人工智慧的領域許多年了。這本書我讀得很痛苦,我大學時念過一般統計學,考研究所念第二遍,上研究所後了解一些進階的統計技術,但對於閱讀本書的門檻來說,我只是半吊子,所以我才說保證一般人連皮毛都看不懂。當然,也不是整本書都看不懂,書中談到各種統計悖論、或是假性相依等現象是挺有趣的,但收穫實在不多,完全不推薦一般大眾來閱讀。
展開