精英日課 s2 The Book of Why: 05 六個判斷力層級

  • 一個問題:你怎麼知道一個東西到底是不是真的有效呢?比如一種賣得很貴的保健。
  • 最底層的判斷力,是既然這個東西"貴",那就肯定有效。貴可以讓你覺得有效,最多相當於理論上應該有效 - 可是真正有沒有效,得看實踐。
  • 第二層判斷力,是有個熟人吃了這個保健品有效,所以我認為它有效。一個例子無法證明有效。可能熟人那幾天偶然身體不好,本來不吃也能恢復。
  • 第三層判斷力,是對人群的研究。但還是不能說明這個保健品有效,你怎麼能知道是吃了保健品的人身體好呢?還是身體好的人更容易買保健品吃呢?
  • 科學家會怎麼做呢?說X對Y有效,就是要建立從X到Y的一個因果關係: X->Y,事情的複雜之處在於,往往會有一個其它因素Z,即影響了X也影響了Y。比如X代表每天鍜鍊身體,Y是身體健康,Z是年齡。科學上管Z叫"干擾因素 (Confounding Factor)",也叫潛在變數。不考慮Z就貿然說鍜鍊身體對身體有好處,那你就犯了混雜偏誤,也叫混淆偏移 (Confounding Bias)。Z,混雜了X->Y的因果關係。
  • 我們可以只考察同一個年齡段的人,看看其中鍛鍊及不鍜鍊的人的健康區別,來去除Z的混雜。
  • 第四層的判斷力,就是如此這般,你想到一個因素就控制一個因素,控制了各種可能因素之後,給你一個結論:X跟Y之間有這麼一個推測性的關係。
  • 第五層的判斷力是隨機實驗 (by Ronald Fisher)。大規模隨機分組的好處就在於,因為沒有使用任何主觀分類標準,那就不管你有什麼干擾因素,這個干擾因素在兩個組裡的強度應該是大致相同的。只要實驗的樣本量足夠大,隨機分成的兩組之間就不會有本質的差異。
  • 但有些事不能做實驗,比如你想知道吸煙是否真的導致了癌症。
  • 第六層判斷力,是用更簡單、更準確的方法決定到底應該控制那些變數。所謂"存在干擾因素",就是 - P(Y|X) != P(Y | do(X) )。
  • 根據這個定義,科學家得出了兩條判斷規則,給定任何一個因果關係,我們都能確定到底那些變量應該被控制。
  • 第一條規則是"後門"路徑的信息傳遞必須被隔斷。
  • 第二條規則是如果後門路徑中有"A->B<-C"這樣的碰撞結構,那就不要控制了。

你可能感兴趣的:(精英日課 s2 The Book of Why: 05 六個判斷力層級)