同学们好,我是曾建川,欢迎和我一起拓展。
在本讲的主课里,我们讲了利用大数据来预测的故事。听完主课的同学会有一种感受,大数据的确很有用,然而真正精彩之处,似乎并不在大数据本身,而在于那些利用大数据展开奇思妙想的人。
关于大数据和预测,我们一起来做一做历史拓展。在这一次拓展课堂里,我们将看到历史上的人们曾经对预测是如此向往、却又如此怀疑。
我还是从一个故事讲起吧,故事里,对预测充满怀疑的人们,尝到了毁灭性的苦果。
2005年9月1日,美国国家海洋暨大气总署水文气象预报中心最后一次发布报告,关于卡特里娜飓风的报告。
此时,在美国的新奥尔良市,已经是风灾之后的噩梦之城。卡特里娜飓风带来的摧毁性打击,引发了无法控制的骚乱。劫匪和武装团伙开始在废墟之上烧杀抢掠,警察根本难以抵抗,两名警察因此而自杀了、还有二百名警察直接辞职。
幸存的灾民,眼睁睁看着这一切,承受着苦难。他们没有及时撤离,丧失了离开这里的机会。
然而,他们原本是可以离开的。因为美国国家飓风中心对卡特里娜飓风,早已做出了准确的预测。然而几乎有五分之一的新奥尔良人,忽略了飓风预测。他们或者是没有听到预报;或者是听到了,却选择了怀疑,他们侥幸地认为,事情不会有那么严重。由市长雷纳金下达的强制撤离命令,居然是他在犹豫了24小时之后才发送出来的,那一定是异常折磨的24小时,因为那当中,一直有许多政府官员在苦苦地哀求着他,其中有一名官员所说的话,市长应该毫不犹豫地听取,那位官员名叫马克斯.梅菲尔德,他是美国国家飓风中心的主管。
早在那之前一个多星期的8月23日,在巴哈马群岛上空,一架空军侦察机就捕捉到一些奇特的干扰气流,它们由几个漩涡一同集聚能量,正在从东往西、旋转着移动,朝着美国的方向推进。同时,大西洋海面上的一些货船也察觉到了,有经验丰富的船长开始担忧起来,然而他们也祈祷着,但愿这诡异的旋风,不会加剧,而是像他们曾经遇到过的那些海上热带气压风团那样,渐渐消失。
这团旋风并没有如人所愿,它们进发得越来越快、裹挟着越来越强的能量。到8月24号的下午,美国国家飓风中心的计算机已经做出预测,这将是十几场会在美国登陆的飓风,它被命名为“卡特里娜”飓风。
到8月27号的清晨,卡特里娜已经显示出令人战栗的能量,它一步步增强到5级,而美国历史上遭遇过有记载的5级飓风,不过三次而已。计算机的预测已经非常精准了——卡特里娜会迅速光顾新奥尔良,那个城市将被变成一个巨大的水库。
接下来的事,我们都已经知道了。尽管预测是准确的,然而它没能成功地令人信服。
在人类历史上,人们从很早以前,就对预测是如此向往,却又如此怀疑。
说到喜欢预测的古人,中国古人一定是其中的佼佼者。甲骨被火烧裂的纹路、天象、环境与地理位置、甚至梦境,都能成为预测的依据。而在中国以外的世界,当然也是如此。
例如,许多同学们可能对巨石阵都不陌生。在英国的索尔兹伯里平原,空旷翠绿的原野上,一些巨大的岩石伫立着、它们以一种特殊的、相对整齐的顺序排列着,不同的天象掩映之下,它们显示出纷繁的魅力。
这些石块已经有大约四千三百年的历史了,它们曾经是史前人类的神庙。一代又一代的学者为它着迷,他们做出各种努力,试图推演出巨石阵背后的那些古人,在用巨型石块进行建设时,究竟想实现些什么。
许多学者坚持认为,建起巨石阵的古人们,能利用这些大石块,预测月食和日食。一位名叫纽汉的学者,热切地拥抱了巨石阵当中的四块——从91到94号石头,纽汉激动地发现,四块巨石恰好构成了一个矩形,其长边正好指向月出的最南端、和月落的最北端。而巨石阵能预测日食和月食的说法,则来自于用计算机进行过大量计算的天文学家。
类似的古代建筑或遗迹还有很多,它们都以独特的方式,在告诉后世的人们,有史以来,对自己的周边环境做出预测,一直是人类希望努力做到的事。
对于那些过于久远的历史,和过于模糊的的预测尝试,我们已经无法确切地知道,那到底有些怎样的细节。直到公元1814年,法国一位天文学家和数学家拉普拉斯,非常明确地用文字描述出,预测能够通过对数据进行分析来实现。
我敲一下黑板,“预测能够通过对数据进行分析来实现”,这句话,对于今天的我们来说,是毋庸置疑的,听过“大数据”系列前几堂课程的同学,脑子里也应该早已有了这样的认知。然而,拉普拉斯可是在两百多年前的1814年,说出这句话的,他甚至没办法理所当然地把这句话说出来,而是需要论证一番。那么,就让我们来听一听,两百年前的拉普拉斯,是如何论证的吧。
说起来,拉普拉斯相当有名,他和薛定谔一同并列在物理学的“四大神兽”思想实验当中,“四大神兽”当然是后世物理学界对那四个著名思想实验的戏称,其中,薛定谔的猫,可能是大家听得比较多的。相应的,拉普拉斯的“神兽”,是一个DEMON,中文翻译为“妖怪”的“妖”,然而拉普拉斯不会承认DEMON的存在,他自己最初用的词是intellect,也就是“智者”。
用拉普拉斯的话来说,有一个假设的智者,他是如此智慧,能够掌握全宇宙中、构成大自然的所有事物的位置和速度。那么,这样的智者就能实现关于未来的预测。他是怎么做到的呢?
拉普拉斯解释到,我们可以把眼下的宇宙,看作是过去和未来共同影响的结果,那么,具备了强大理解能力的智者,同时还掌握了全宇宙的那些“数据”,是的,拉普拉斯已经用了“数据”这个词,这样一个智者,他当然能够通过分析数据,用一种简单的公式或准则,来预测出宇宙中所有物质——大到星体、小到原子——它们的所有运动。
也就是说,对于具有了强大理解能力的智者来说,就没有什么是不能确定的,过去和未来都能尽收眼底。
同学们,你能否理解拉普拉斯呢?那个假设的智者,到底是谁呢?拉普拉斯对此,其实也有说法。两百多年前的他,已经看到,人类还不具备像“智者”那样的预测能力,但是如果人类能够变得足够聪明呢?
那时的拉普拉斯还没办法去解释,人类将如何变得“足够聪明”,然而,今天的我们可以告诉他,一台高速的计算机,应该就能实现这一点,不就是“数据分析”的工作吗!计算机很擅长啊。
然而,拉普拉斯的“智者”,后来仍被人们说成了DEMON,也就是拉普拉斯之妖,这表明,人们对他的说法是深刻怀疑的,认为他的假设是不正确的。
是啊,在人类历史上的每一个阶段,都会有关于预测的美好向往、甚至实现的故事,却也总是伴随着怀疑。
关于大数据的预测,不也是这样吗?一些学者会极力告诉大家,大数据简直魅力无穷,等待着聪明的人们去开发出无尽的价值;而另一些学者,则会警告大家,充斥在整个世界的数据,正在变为扰人耳目的噪音。
那么,听到这里的同学,你又是怎么想的呢?
还没有评论,快来发表第一个评论!