85科学方法论的第三个要点:什么是量度?

85科学方法论的第三个要点:什么是量度?

00:00
15:15

您好,欢迎收听我的经济学课。上次课讲了效用概念的第二个大陷阱。要避开这个错将序数当基数的陷阱,就要发挥“边际分析法”的第二个引申用途。

 

这里顺便讲解科学方法论的第三个要点。先稍微复习一下,科学方法论的第一个要点是可证伪性,第二个要点是奥克姆剃刀原则。这里要讲的第三个要点是:什么是量度?

 

与前两个要点一样,没学过科学方法论的人经常会犯错,以为正确的才是科学,以为理论越复杂越好,人们也常常在这第三个要点上犯大错。这个大错有两个层面,首先是把可量度作为科学的特征。这当然不对,可证伪性才是科学的特征。其次,更进一步的错误是把基数量度当成是量度的唯一方式,就是以为量度必须要有确切的数字。比如长度是十米,人们就认为这很精确,但这是基数量度,只是量度的一种。量度既有基数量度也有序数量度,而序数量度就是指排序。

 

边际分析法的第二个引申用途是指出在经济学里总量不重要,边际量才重要。这个用途的其中一个含义是:能够排序就行,不需要知道总量。当然,如果知道总量的话肯定可以排序;但光是知道排序的话,不一定能够知道总量。比如A是100、B是20,那当然可以排序了,排序规则是从大到小的话,A排在B前面。但是如果只知道A排在B前面,A到底是100还是200,B到底是20还是40,不知道,也不需要知道。自然科学与社会科学的一个重要区别,就是自然科学一般比较容易找总量,社会科学不太容易、甚至不可能找总量,所以社会科学会更加依赖边际分析法,也就是在量度时更加依赖序数量度。

 

遵循这门课程的一贯做法,先举一个非常简单的日常生活的例子,以便让您容易地看清楚问题的本质。众所周知,农业生产是一个看天吃饭的行业,受天气影响很大,风险很高。但风险到底有多高呢?具体的总量不可能知道,但有一点是可以肯定的,那就是古代时农业生产的风险比现代要高。为什么呢?以后的课程专门讲信息费用时就会指出,所谓风险高在科学的经济学里是指信息费用高,因为信息费用高会导致人们很难掌握充分的信息来做出正确的决策。说古代时农业生产的风险比现代高,就是指将不同时期的农业生产的信息费用进行排序的话,古代排在高处,现代排在低处。

 

古代没有气象学方面的科学知识,未来的天气会怎样,古人基本上只能靠猜。当然中国的古人也很伟大,搞出了很多关于天气的谚语,但这些都是知其然而不知其所以然,是凭经验积累出来的结论,并不是很可靠。现代有了气象学,人们根据理论就知其然也知其所以然了。人类还发射了卫星上天观测气象的变化,掌握有关的局限条件。既有理论又掌握局限条件,就能提前发布天气预报,也就是做事前推断。以前台风要来,古人基本上没啥办法,只能眼睁睁地看着台风严重地损毁农作物。但现在就不同了,有气象学与气象卫星的双管齐下,提前就能预见台风要来,政府赶紧组织农民抢收粮食,做好各种防范措施。所以现在不利天气对农业生产所造成的损失是显著下降了的。这些损失的减少,反映着信息费用的下降,也就是风险的下降。

 

但是如果要问,到底古代关于天气的信息费用有多高,现代的又有多高,这个问题没法回答。其实直到今天,关于天气的信息费用还是很高的。第一,要投入科学家研究气象学。第二,要发射气象卫星上天调查局限条件。直到现在,天气预报仍然被认为在自然科学中是除了地震预报之外最不准确的预测,也就是出错的可能性比较高。其实天气预报比预测赌博结果要准确多了,但赌博只是娱乐,不是生产,预测是否准确对个别人有影响,对社会整体利益没有影响,跟地震预报、天气预报是不能相提并论的。以前的课程说过了,预测赌博结果所需要的物理学理论很简单,难的是要迅速地掌握足够充分且准确的局限条件以运用理论是不可能的。地震预报与天气预报的问题类似于预测赌博结果的困难,不是理论层面的地震学、气象学不够完备,而是局限条件的调查太难。地震预报之难,以至于人类到目前为止还是选择索性放弃提前预测,而是把重心放在防震建筑与震后救援之上。有些天气的局限条件也跟地震一样难以掌握,如龙卷风之类,人类也是放弃了预报。但大部分常见天气的局限条件相对地震要容易得多,所以天气预报的不准确虽然常常成为人们嘲笑的对象,还是成为现代生活的必备服务。第三,要尽可能广泛地向民众发布天气预报。

 

尽管现代关于天气的信息费用还是很高,但我们可以非常肯定,古代的信息费用一定更高,这一点通过观察现代农业借助天气预报有效地抵御了很多不利天气的侵害而避免了大量的产量损失这个事实,是能获得众所认同的。您看,这段分析中不需要知道总量,甚至没有出现一个具体的数据,但进行排序的逻辑清楚明了、令人信服。这就是完美的量度!难道非要说出古代的信息费用是1000、现代是100,那才叫精确,才叫科学吗?硬是搞出这样的数字来,不是反而更可笑吗?

 

总之,科学的量度只需要能够排序,不需要知道精确的数字。不懂这个科学方法论关于量度的要点的人,很容易会犯一种可称为“精确地错”的毛病,迷恋统计数据。在网上,这种人叫“数据党”,辩论时喜欢列举大量数据,或服膺于列举了大量数据的人。套用一句网络流行语“有图有真相”,这些“数据党”是相信“有数据才有真相”。有这种毛病的人其实接连犯了两次偷换概念的错误,把可量度作为科学的特征是把科学的概念偷换成数学,其实严格来说也不是数学,而是算术。因为数学严格来说是逻辑,不是数字。只把基数量度看成是量度,则是又把数学或算术偷换成了统计学。

 

其实统计学里的很多数据也是序数性质的,特别是社会科学范畴之内。比如您肯定做过这种问卷调查:您对某公司的服务是非常满意、一般满意、不满意、非常不满意。这就是典型的序数量度。有时可能设计成打分的形式,10分是非常满意,0分是非常不满意那样。问卷调查里有另一类问题是基数性质的,比如问您一个月有多少收入就是基数。但要您根据满意程度打分这种问题,表面看是基数,其实是序数。做问卷调查的人为了方便做统计分析,就算这类问满意程度的题目本身不是设计成打分的,他在分析时也会把回答置换成分数,将不同问卷的分数加总起来。所以在一般人看来,统计学表面上全是基数,好像很精确的样子。

 

以前的课程在讲金融市场上有图表派与价值投资两种投资方式时,已经提到统计学有很多陷阱,在不了解这些陷阱的情况下就盲目地迷恋数据,会掉进非科学、甚至伪科学的坑里。以前也提到这句关于统计数据的话:世界上有两种说谎的方式,一种方式是直接说谎,另一种方式是统计数据。容易利用统计数据说谎,是因为统计学存在着太多猫腻。当然这不是统计学的错,是滥用统计数据的人的错,正如经济学家滥用数学并不是数学的错那样。

 

迷信数据是“精确地错”,与之相对的是“粗略地对”。科学的特征是可证伪而不是精确,精确的统计数据完全有可能是错的,充满了逻辑漏洞。但为什么粗略反而有可能是对的呢?那就是使用了边际分析法进行序数量度,表面上看不到总量、甚至看不到明确的数据,但逻辑明显是对的,也经受住事实的验证。这次课讲的科学方法论的第三个要点,其实是说:在量度这件事上,宁要粗略的对,不要精确的错。

 

那么统计学到底有什么猫腻导致“数据党”们掉进精确地错的陷阱里去呢?以前讲金融市场的投资方式时提到过,一个是统计数据不可靠,另一个是统计数据之间存在的只是相关性、并不是因果关系。当时着重举的是说明后一个陷阱的例子,这里就着重举说明前一个陷阱的例子。而且这里不仅要从反面说明统计数据是怎样令人“精确地错”,更要从正面示范如何运用边际分析法、也就是序数量度来摆脱对统计数据的迷恋,进行真正符合科学方法论要求的正确分析与事实验证,达成“粗略地对”。

 

统计数据不可靠这个陷阱本身就有多种情况。一种情况是直接数据造假,本质就是伪科学,比非科学更糟糕,因为其实就是诈骗。正如骗术有高低之分,造假也有低档与高档之别。低档的造假就是简单地编造数据。这种没有技术含量的造假就一笔带过。稍为高档一点的造假是统计数据收集回来之后进行一下回归分析,发现有些数据对自己想要的结论不利,就把它剔除出去。这在讲金融市场的投资方式时提过了,这里举一个宏观经济方面的典型例子。美国经济学家克鲁格在奥巴马做总统期间任白宫经济顾问委员会主席,他竟然玩弄把长期失业人口剔除出去以实现在“统计数据”上降低失业率的花招。这只是他利用统计数据撒谎的骗术之一,事实上他提出的所谓“实证学派”,完全不是这里所说的以科学方法论为基础的科学第三部曲,而是赤裸裸地滥用统计,基本上所有统计学的猫腻他都用了个遍、玩得很溜,可谓高档造假伪科学的骗子典范。

 

另一种数据不可靠的情况不是直接造假,而是对数据的处理有问题。而这又可分为两种情况。一种情况就是前面说过的,明明是序数性质的统计数据,却强行搞基数才能做的四则运算。这是进一步把统计学偷换成了定量分析。统计学里面其实也可以有定性分析,定量分析只是其中一种,但正如很多人误以为基数量度才是量度、序数量度就不够精确那样,也有很多人以为定量分析才是精确的、科学的统计分析。

 

另一种情况则是对数据的理解不足,这跟滥用数学有类似之处。在经济学里使用数学必须说清楚数学的经济含义,同样的道理,在经济分析或事实验证中使用统计数据也必须要搞清楚数据背后的经济含义。这就一方面要了解统计数据是怎么收集来的,另一方面是要有经济学理论给予指导。这种情况跟统计学的第二个陷阱在于统计数据之间的关系是相关性而不是因果关系,在逻辑上其实是相通的。因果关系是要由理论提供的,而应用理论又必须掌握局限条件。了解统计数据怎样收集是掌握局限条件,接受理论指导是为了寻找因果关系。

 

下一次课,我将通过彻底地批倒一个诺贝尔经济学奖得主用统计数据分析中国房价的例子,展示数据不可靠的这两种情况,并示范如何摆脱对数据的迷恋做真正的科学分析!


以上内容来自专辑
用户评论
  • 超军_1j

    科学方法论三个要点:可证伪性;奥克姆剃刀原则;科学的量度。 什么是量度? 量度既有基数量度也有序数量度,而序数量度就是指排序。 科学的量度只需要能够排序,不需要知道精确的数字。

    听友81226520 回复 @超军_1j: 来自哪里以及没有结婚,不是影响科学与否的因素,两位差不多得了

  • 171475582

    李俊慧在佛山科技学院的致用楼前对我说:"知道我这次借魏则西炒作自己为何这么成功么?就是要抛出一个惊世骇俗的观点,然后用'科学','科学价值观'这些流行词语进行包装,再重复一千遍,一万遍,这样虽然会漏掉一些有判断力的人,但是能留下很多铁杆的粉丝,这招我是从谢作诗那学来的"。

    涛_373 回复 @171475582: 你竟然还用照片做头像,你以后也会出名的,不害怕吗?