相关性和因果性:科研投入和自杀率有关系吗?

相关性和因果性:科研投入和自杀率有关系吗?

00:00
06:48

期原文 


欢迎来到《AI思维50讲》。你好,我是丁磊。

 

我们之前聊过,AI思维的基础是数据。作为基础,数据力是你颠覆传统思维的原力。AI思维的预测、决策和创新都离不开数据。从这一讲,我将带你深入了解数据的魅力。

 

进入了大数据时代以后,数量繁多的数据之间有着不同的关系。所以,今天我想和你聊聊,数据之间的相关性和因果性。

 

法国启蒙思想家伏尔泰说过一句话:“雪崩的时候,没有一片雪花是无辜的。”

 

在这句话里其实存在一个很有趣的问题:雪山是随着片片雪花的飘落而崩塌,还是因为那场忽降的大雪而彻底崩溃的呢? 这看似是一个先有鸡还是先有蛋式的哲学问题,其实是关于因果性和相关性的科学思考。

 

将两个一起出现的事物关联到一起是人类与生俱来的能力,是否能够考虑清楚两个事物之间的关系,决定着你处理事情的思路和角度。

 

我们先来了解一下什么是相关性和因果性。

 

相关性是指两个事物之间是有关联的,一个事物随着另外一个事物的变化而变化。比如说,随着身高的增加,你的体重也有上升,那么身高和体重就是正相关的关系。还有,饮食越健康,你生病的次数就越少,那么饮食合理的程度和生病的次数就是负相关的关系。

 

但是我们要十分注意,并不是在数据上存在相关性,这两个事物之间就存在合理的相关关系。如果两个事物之间的关系缺乏合理的解释,那么这个相关性就有可能是虚假的。比如说,哈佛大学的博士生泰勒·维根(Tyler Vigen)就研究了许多虚假的相关性案例。

 

这些案例,在数据上都有很高的相关性,但其实都十分的不合理。比如说,从1999年到2009年这十年间,美国科研的投入和自杀率之间的相关性高达99.79%,美国缅因州的离婚率和美国人造黄油的人均消耗量之间的相关性也高达99.26%

 

虽然这两个案例在数据上都有很高的相关性,但是实际上却看起来非常荒谬。真正存在相关性的两者之间,必须有一个关联的基点。你会因为在科研上的投入变多,就去自杀吗?会因为人造黄油的消耗量上升就去离婚吗?这些事件之间并没有关联的基点,所以这些都是虚假的相关性。

 

至于如此高的相关性的数值,可能只是由于社会的发展,不同的指标同步变大,造成的一种巧合罢了。所以如果你要考虑,两个事物之间是否有相关性的关系,除了要关注他们在数据上的相关度,还要考虑两者之间,是否有科学合理的解释。

 

因果性不同于相关性,要判断两个事物之间是否存在因果关系,首先要判断两者是否存在关联,因为相关关系是因果关系的基础。如果这两个事物之间相关联,还要判断两者之间的先后关系,也就是说,是一个事物导致了另外一个事物的出现。同时满足以上两个条件其实还不够,我们还需要判断这两个事物之间的关系是单一的,也就是说,不能出现第三个变量导致结果的出现。

 

比如说,你苦苦追求心目中的女神很多年,但是她就是不答应。你心里很疑惑,是因为自己长得不够帅,还是因为上次表白的时候,没有买上九十九朵玫瑰。其实经过分析你就会发现,在女神不喜欢你这件事情上,可能存在很多个变量,可能是因为你不够帅,也可能是你们的价值观不一致,或者是你上次运动完,一身臭汗的去找她,给她留下了不好的印象。是这些原因共同导致了他她不喜欢你,所以其中任何一件事,都不能和她不喜欢你这件事情,构成直接的因果关系。

 

讲到这里你可能听出来了,判断两个事物之间的关系,因果性比相关性要复杂很多。传统科学就要求找到两个事物之间的因果关系,你需要用科学的手段来证明两个事物之间存在一个必然的、先后关联发生的因果规律。

 

但是在现实生活中,相关性比因果性更具有实践价值。你只需要知道,出现某些迹象时,数据统计的高概率显示它会有相应的结果。这是对传统思维方式的一种颠覆,但是可以让你在实际的工作生活中,更加迅速准确的做出决策。

 

AI思维更加推崇的也是相关性。在大数据时代,不同人之间的差异性是非常大的,同一个人在不同情况下的选择也会不同,所有人之间的所有需求,都处于多维度且变化的状态之下发生的。等你绞尽脑汁地想明白了为什么,可能时机早已从你的手中溜走了。而且很多时候,不论事情的缘由多么曲折,它们最终指向的,都是同一个结果。而你,最终为的也不过是这个结果罢了。

 

不管你是什么职业,要做出什么选择,哪一个不需要抓准时机,哪一个不需要准确地抉择。所以,在这个大踏步前进的社会中,耗费过多的精力去寻找因果关系不再是那么的重要,抓住相关性才是我们决胜的王道。

 

相关性思维是通过分析不同事件之间的联系,实现由起点直接到达终点的效果。它颠覆了传统的因果思维追根究底的思考方式,是AI思维能够快速准确地进行预测做出决策的内在逻辑。物有本末,事有始终,如果你想要事半功倍地得到想要的结果,掌握相关性思维是关键的第一步。

 

今天课程的最后,我想留给你一个思考题:

 

既然人工智能可以发现变量和结果之间的相关性,那么如果我们拥有的变量越多,将变量之间的相关性都叠加在一起,是不是就可以无限的逼近结果,也就是说,可以百分之百的预测未来呢?

 

欢迎在评论区留下你的看法,也欢迎你把本期的内容分享给你的朋友,我们下期再见。

以上内容来自专辑
用户评论
  • 1773810dbbd

    人工智能是未来的发展趋势,看来以后要多用相关性思考问题了。

  • 听友209501481

    哇涨知识了

  • 1837316bzbk

    涨知识,头一次知道这些东西,书上肯定没有的东西

  • 吃月亮的三岁

    以前一直用因果性思维思考,看来以后要学会用相关性思维思考