這本書從七月到八月中,終於看完一遍。先說我的背景,是理工,在學校未學過機率與統計,但是在去年因為學習人工智慧,才稍微摸到皮毛。看過很多人評論這是一本難懂的書,對我而言,卻覺得這本書其實寫得還算淺顯易懂,可能是剛好上過coursera 「概率图模型 專項課程」,第一堂課。對於其中的定義,以及最後幾章的數學公式,有所理解。買這本書的動機,是因為對於「貝氏定理」不理解,真的是買對了,因為就是這位作者利用貝氏定理,在上個世紀做的題目,由他娓娓道來,自然更容易懂了。作者在書裡,我覺得說不清楚的地方,是「置信度傳播」,這也是他發明的做法。這裡需要參考網路上其他人的說明,倒也不是難事。 作者在條件機率上加上 do ,最後消去使得 do 等於 see ,也就是人類可以利用推理,就可以達成他在書上所說第二層,以及第三層反事實,講得頗為精妙。他也說了一個小故事,是由一位物理博士田津寫出來的,當這簡單的數學公式發表,眾人都不敢相信。 順帶一提的是前幾天,Yann Lecun演說反駁的就是這位作者主張現在的神經網路無法完成因果推論。
百年來就陸續有科學家思考此一問題,希望能夠找到方法,不必做實驗,只透過資料分析,就能解開因果問題。但一直到前幾年,才由圖靈獎得主 Judea Pearl 集其大成,他從貝氏機率出發,發展出貝氏網路,進而發現因果的3層階梯,最後終於發明了因果網路,一舉破解因果之謎, 拿下 ai 研究的重大聖杯。
Judea Pearl 的名言是 “Mind over data”(思想勝過資料),因果推論的原理是由邏輯推理所驅動,而機器學習的方法是由資料所驅動。他認為人類智慧的運作方式更趨近於邏輯推理驅動,而非資料驅動。這也是為何神經網路要看過1萬隻貓後,才能學會辨識出貓,而人類的嬰兒只要看過1隻貓,一輩子都有能力辨識出各種千奇百怪的貓,智慧高下立判。
因果推論是 ai 科學的下一代殺手兵器,Judea Pearl 透過此書把他精巧的軍備全盤托出,毫無保留,奉獻給世人。受到他的啟發,當今世上各種因果推論的應用正在嘗試展開,而 DeepMind、Netflix 等先驅公司也都紛紛投入資源,開始探索這個領域。
部份詞語疑自行按字面轉翻且拿捏有疑。如 p.277稱「若非因果關係」。此譯法除不通用,與上下文連結也會造成句意不清之閱讀困難。應指But For Causation「若無、則非(則不發生其果)」因果關係。稱「若非因果關係」會改變句子文意。中文裏沒有專有名詞開頭大寫的處理,現在也沒什麼人在用私名號來標示專有名詞以防混淆了。
這本書從七月到八月中,終於看完一遍。先說我的背景,是理工,在學校未學過機率與統計,但是在去年因為學習人工智慧,才稍微摸到皮毛。看過很多人評論這是一本難懂的書,對我而言,卻覺得這本書其實寫得還算淺顯易懂,可能是剛好上過coursera 「概率图模型 專項課程」,第一堂課。對於其中的定義,以及最後幾章的數學公式,有所理解。買這本書的動機,是因為對於「貝氏定理」不理解,真的是買對了,因為就是這位作者利用貝氏定理,在上個世紀做的題目,由他娓娓道來,自然更容易懂了。作者在書裡,我覺得說不清楚的地方,是「置信度傳播」,這也是他發明的做法。這裡需要參考網路上其他人的說明,倒也不是難事。 作者在條件機率上加上 do ,最後消去使得 do 等於 see ,也就是人類可以利用推理,就可以達成他在書上所說第二層,以及第三層反事實,講得頗為精妙。他也說了一個小故事,是由一位物理博士田津寫出來的,當這簡單的數學公式發表,眾人都不敢相信。 順帶一提的是前幾天,Yann Lecun演說反駁的就是這位作者主張現在的神經網路無法完成因果推論。
作者對於統計學界長年忽視因過推論這件事,非常不能苟同,至今還是有很多學者對於路徑分析、結構方程的因果推論性存疑,作者急欲證明因果數學的效力絕對不亞於「實驗操弄」,便出了本書,想讓一般大眾了解作者的理論,據此改變整個統計學界。可惜的是,作者出了一本一般大眾根本看不懂的書,別說普通人了,就連讀過一般統計學的人也看不懂,我也是念到研究所才知道路徑分析和結構方程這些玩意。作者刻意採用「非數學」的語言,以為這樣就能讓變成通俗讀物,可惜弄巧成拙,有些東西就是必須要用數學來表達,硬要用通俗語言只會弄得更隱晦難解。本書的因果數學,其中最基礎的 do 運算子,從頭到尾都沒說清楚是什麼 (白話當然說不清楚),這使得後續的因果數學完全不知所以然。作者的思維層級早已遠超一般人,已經難以想像一般人的背景知識與自己到底有多大的差距,例如,作者在某段艱深難懂的推論後說明「相信讀者現在一定跟我一樣興奮」,顯現出作者強烈的投射作用,表面上想以白話的方式來呈現,又不經意地把讀者當成統計專才,書中常常提到「執行對照」,我打賭只念過一般統計學的人不會知道這是什麼東西。
個人認為,至少需要統計本科系、碩士級或以上的學術訓練,才能一窺本書奧秘,如果是衝著人工智慧來看的,保證你大失所望,作者只有一章談論人工智慧,講的無非是因果推論才是未來真正 AI 的解方,但作者本人卻已離開人工智慧的領域許多年了。這本書我讀得很痛苦,我大學時念過一般統計學,考研究所念第二遍,上研究所後了解一些進階的統計技術,但對於閱讀本書的門檻來說,我只是半吊子,所以我才說保證一般人連皮毛都看不懂。當然,也不是整本書都看不懂,書中談到各種統計悖論、或是假性相依等現象是挺有趣的,但收穫實在不多,完全不推薦一般大眾來閱讀。