大数据时代防坑指南,帮你看清数据背后的认知陷阱
精华笔记
在现代社会,一个人的衣食住行、生老病死都和数据息息相关,每个人既是数据的制造者,也是数据的消费者。
本书作者桑内·布劳是荷兰计量经济学家和数据分析记者,她写这本书的目的,是为了唤起人们对数据使用的警惕。数据并不像人们以为的那么客观真实,数据的错误使用可能会影响上千万人的生活。
在数据无所不在的现代社会,我们需要学会正确使用数据,而不是让数据反客为主来操控我们的生活。
第一,在数据使用上会出现哪些问题?
1、标准化环节:
不是所有东西都可以被数据量化,当被衡量对象比较抽象复杂时,数据未必能反应真实情况。
2、采集环节:
①调查方式和问题设置不当
②样本种类单一且数量太少
③调查者的个人倾向
3、分析环节:
把伪因果关系错当成因果关系:
①偶然事件
②缺少因素
③反向关联
还有些人会把真正的因果关系宣传成伪因果关系,以达到混淆视听的目的。
第二,大数据时代存在哪些风险?
1、标准化环节:
将大数据统计得出的某个数据,扩大运用到其它不适用的领域。
2、采集环节:
大数据采集会出现纰漏,同时大数据采集也可能侵犯个人隐私,并被不法分子利用。
3、分析环节:
大数据无法分辨现象之间的真正关系,会做出错误预测,或者制造出新的问题。
书 名:数据如何误导了我们
作 者:[荷] 桑内·布劳
主 讲 人:西蒙
主 播:路琨
策 划 编 辑:李雪清
总 编 辑:徐苑
数据与因果不是一码事
很有趣