前言
哲学所研究的问题是那些不言而喻,普通人还没有意识到那还是一个问题的那些问题。如果你还没有意识到这一层,你就不可能是一个拥有哲学思维的人。真正对哲学有点兴趣,顺着逻辑的思路不断追溯追求终极,最终会把你导向宿命论,当然如果你承认宿命论你也是一个肤浅的人。在东方思想里面因果关系是一个公设,是一个不言而喻的真理,但是在西方思想家和哲学家思绪里,是有过明确质疑和讨论的,比如早期的休谟和康德。今天我要聊的话题就是到底世界上有没有因果关系?
正文
不知道你注意过没有,物理定律里根本就不包括因果关系。比如你拿个气压计测量大气压,物理定律说你的气压计读数 B 和大气压 P 之间有一个正比关系
B = kP
但是这个定律里根本没说“谁导致了谁”。是气压导致了气压计的读数吗?可是上面的方程完全可以改写成 P = B/k,只看方程,你完全可以说是气压计的读数导致了大气压的大小。物理定律只是描述一个规律,并不在乎因果。
高尔顿的徒弟卡尔·皮尔逊说,因果这个概念已经过时了,科学的世界里你只能谈论相关性。皮尔逊认为我们只是总结宇宙的规律,然后按照规律 —— 其实也就是总结出来的经验 —— 去做事而已。至于说规律背后有没有什么因果关系,到底是谁导致了谁,这个你永远都说不清,也没意义。
自此之后,哲学家一直在研究,怎么用统计规律定义因果关系。当年皮尔逊说因果就是 A 发生 B 一定发生,就是相关系数等于1。但是这个定义肯定是错的。你想想,树木快速生长的时候,小草也在快速生长,它们两个的相关性就是1,那你能说草跟树之间有因果关系吗?其实是春天到了这个缘故同时导致了树和草的生长。再者,有些因果关系不一定是100%相关。比如有一种药,对大部分人有效,但是对某些人无效 —— 治好了算是运气好,那你能说药跟治病之间没有因果关系吗?因果关系可以是一个概率。
后来又有哲学家想了个办法。说所谓 “X 导致 Y”,这个因果关系可以用 P(Y|X) > P(Y) 来定义:X 的出现,增大了 Y 出现的可能性。这是一种概率化的因果,但是也不能排除单纯的相关性。
珀尔倒是给了一个更好的定义:P(Y | do(X)) > P(Y). 也就是说,如果你单方面对 X 做一个干预动作,导致 Y 的概率增加,那么就是 X 导致了 Y。这个可能是目前为止最合理的定义。
可是不管你怎么定义,你永远都说不清到底什么叫“X 导致 Y”。没油的车开不动,加上油车就开起来了,你说这是汽油导致了车能开 —— 可你能确信吗?难道是汽油想让车开起来吗?也许上帝喜欢车里有油,没油他就不让车开,看见有油了就允许车开……也许一切都是上帝的安排。
为此哲学家做了大量的调查研究,发现各种相关性。有些相关性很有意义,有些相关性就没什么意义,称之为“伪相关(spurious correlation)”。
比如说,一个国家的人均巧克力消费量,和这个国家的诺贝尔奖得主人数,有一个非常强的正相关。这就是一个没什么意义的伪相关。你总不可能说吃巧克力有利于得诺贝尔奖。让我们解释这个相关性的话,肯定是巧克力消费量高是因为这个国家的经济比较发达,而经济比较发达的国家容易出诺贝尔奖得主。
请注意!你只要这么一解释,就用到了因果关系!所谓人类一思考,上帝就发笑。
这就很尴尬了。你说没有因果只有相关,然后又说有些相关性有意义,有些相关性是伪相关。那你判断有没有意义的标准是什么呢?难道不还是要借助因果吗?无形之中,我们还是觉得有因果的相关性更有意义 —— 虽然我们无法用纯粹理性定义因果。我们如此地倾向于因果思维,从根本上来说,是因为因果思维很有用。一个简单的因果模型,就能胜过无数经验。
所以有些事儿看似简单,但是细思极恐。而有些人的思想,可以拨云见日。
美国统计学家休厄尔·赖特(Sewall Wright)。1920年,赖特发表了一篇有关天竺鼠的毛色遗传的论文。他假设有三种因素可能影响毛色,分别是发展(d)、遗传(h)和环境(e),他把这三种因素画成了因果关系图。然后赖特根据自己的实验结果,用解方程的方法算出了三种因素的相对大小。他把天竺鼠的毛色问题给解决了。
这绝对是开创性的工作。赖特不但第一次使用了因果模型,而且还提出了一个洞见。赖特说,我这个因果模型并不是客观的。你不可能通过数据分析、用机械化的流程得到这张图。因果图之所以这么画,图中之所以考虑了这些关系而没考虑别的关系,这是你自己主观的选择 —— 是你用自己的知识、阅历和判断画出来的。
也就是说,因果关系,其实是你的主观假设。数据是客观的,而人的观点是主观的。相关性是客观的,因果是主观的。
有了这个洞见,我们解决问题的步骤就是下面这样的 ——
第一步,根据你自己的见识,画一张主观的因果模型图。模型里有些因果关系是概率性的,A 发生并不一定会让 B 发生,只要 A 对 B 有影响就行。
第二步,使用实验和数据分析,确定图中每个因果关系的强弱大小。这样你就有了一个完整的因果模型。
第三步,使用因果模型,你就可以回答“观察、干预、想象”那三种问题了。
如果 AI 拥有这样的模型,它就等于获得了智能。珀尔称之为“小图灵问题”,相当于计算机通过了一个小的图灵测试:他掌握了因果思维。
结论
你注意到没有,我自始至终没有彻底回答“到底什么是因果关系”,也没有真正解决“为什么”的问题!
在我看来,因果分析这个思想的最高妙之处就在于,你无须确定真正的因果关系,你无须回答“为什么”。
真实世界里任何事情都是错综复杂的,你根本就无法列举影响一个结果的所有可能缘故。你必须做出各种取舍,你只能把你认为最重要的缘故画在图上。图画完了,你并没有科学地、彻底地、逻辑完备地回答“为什么”,你只是说,根据你的猜测,应该是因为这几个缘故。
而事实上也不需要回答“为什么”。我们在生活中的实际应用,对改变世界真正有用的,其实就是回答“观察、干预、想象”这三种问题!
所以因果分析的最终目的不是查明因果关系,而是回答三种问题。这三个问题比因果关系更基本 —— 因果关系只是我们回答问题的手段。没有这个手段,只靠数据分析,你回答不了第二和第三种问题。当然,有了这个手段,如果你的因果模型不准确,你给的答案也会不准确 —— 你可能会漏掉一个特别重要的因果关系,你可能忽略了黑天鹅事件。但是这不要紧!预测未来的事儿本来就是谁也保证不了100%准确。
最后,请注意,虽然模型是主观的,但是因果分析仍然具有客观的性质。如果两个人的假设相同,他们画的因果关系图就是一样的,那么接下来的数学方法是客观的,这两个人对未来的预测,必定是100%相同。
这里边有哲学,主观和客观,非常有意思。按理说这个世界应该是完全客观的存在,科学家一直在试图客观地认识世界。可是我们不管是给东西分类也好,提出因果关系也好,做预测也好,只要你心念一动,你就必然是主观的。