本期课程
【数字小学问】点评网站的低分商家真的很差劲吗?
主讲人:胡渐彪
时间:2017年9月12日0点
课程重点
为什么评分不能反映真实情况:
问题就出在,网站上的分数,是由“所有人”评分的结果
因为在一般人群中,对口味的要求,通常就像金字塔一样,那种舌头特别挑,对口味特别讲究的人,往往在人群中,就像金字塔的顶端,只占一小部分
至于大多数的客人呢,他们在评价一家餐厅的时候,他们对味道的要求,不会那么严格⋯⋯他们心目中的好吃与不好吃,往往,会同时受到餐点的份量,与价格的影响
所以,如果一家餐厅,味道特别好,可是呢,价格偏高,这时候,这家店在网站上的评价,就会趋于两极,少数人,会因为味道好,所以给高分,但多数人,却可能嫌他价格不划算,份量没吃饱,因此打低分⋯⋯结果,两者一平均,这家餐厅的分数,就被拉下来了
相反的,如果一家餐厅,走的是经济实惠的风格,那么对于少数舌头挑惕的客人来说,他们一开始,恐怕就不会来,而会来的顾客呢,他们对于味道的要求,由于不是那么严格,所以只要餐点的水准,到达一定程度,就会觉得“这家店已经够好吃了”,因此,纷纷给高分⋯⋯
所以,并不是评分不可靠,而是当评分者的口味,呈现金字塔分布的时候,则平均分越高的餐厅,往往符合的,越是贴近于基础人群的标准
辛普森悖论:
早在1951年,英国统计学家辛普森,就曾经提出:在分组比较中都占优势的一方,在结果中,反而变成劣势的现象。
那么,发生这种现象的原因究竟是什么?
简单来讲,是因为权重不同导致了结果的不可信。
飞机的延误现象:
A和B呢,虽然都是120次的航班,但A是以北京为基地,B是以广州为基地。
所以A的120次航班中,从北京出发的有100架,准点50班,准点率为50%;广州出发了20次,准点了16班,准点率为80%。所以,全部加起来,在总共120个航班中,A准点了66架次,66除以120,得出了A总准点率55%。
记好咯,55%的准点率,我们来看看B。
同样是120班飞机,B从北京出发的只有20架次,准点了8次,准点率为40%;广州出发了100次,准点了70班,准点率为70%。好,这样B的准点率是78班除以120班飞机,得出了总准点率65%。
这就是B65%,和A55%的来历。
但是,你仔细想想。B真的比A更准时吗?
正确挑餐厅的方式:
回到我们之前挑餐厅的故事,现在,你已经知道了点评网站分数也受到辛普森谬误的影响,食客权重比例不一导致了结果的不可靠。
所以呢,如果你是那种,挑餐厅的时候,除了味道,其他条件不太在意的吃货
那么,与其参考大数据的评分,还不如,去建立一个“焦点团体”,也就是先重点参考你身边那些特别会吃的朋友的意见
而这也就是为什么,举世闻名的米其林餐饮指南,他们对餐厅好坏的评鉴,不是开放由所有的顾客投票,而是派出专业的审查员,一家一家去打分,为的,就是怕专业人士的评分,在不同的权重下,被牺牲了
本期金句
(点击图片可保存并分享)
思考题
生活里,你还发现过哪些辛普森悖论的例子呢,分享出来我们讨论一下。
课程表
数字的把戏:为什么免费的是最贵的?
为什么有人愿意花7块钱去换1块钱?
点评网站的低分商家真的很差劲吗?
不了解“真随机”,你就只能受命运摆布。
数字是怎么在同一个问题上“说谎”的?
下期课程
【数字小学问】不了解“真随机”,你就只能受命运摆布。
主讲人:邱晨
时间:2017年9月13日0点
航班这个例子真的是扯淡。率的比较应该用卡方检验,渐彪欧巴算过卡方检验的P值吗?P<0.05吗?目测这个样本量就没有统计学意义,何况样本量根本不够。除了分层比较这个理念符合统计学理念,其他真是扯淡
表示买东西看餐厅只看差评。。。
以出差为乐,与数据为伍,行色匆匆,不忘初衷。这才是我最熟悉的渐彪欧巴的画风。看到你又做回自己,真开森😊
就像Steam游戏平台上面的游戏,有些我看起来很cult很糙的游戏(注意这是主观评价),评分却出奇地高,评论区也好评如潮,究其原因,也是只有cult玩家才会去玩这些游戏并评分,所以如果你不是目标受众,剁手之前最好进行更多调研,例如看看实况什么的。嗯,这是超过50%游戏30分钟弃坑的惨痛教训。
怎么感觉每一期你都在讲废话
避免辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。
不同意啊 你们吃黄鱼面前已经说了价格实惠 说明你们已经把价格因素考虑在内了咯
你们既然有钱又想吃更好吃的面那为啥要去看“大众”点评呢……是为了想出这期节目么🤦♂️
点餐和订票的讨论模型有区别,点餐的模型不符合辛普森悖论,因为口味变量和分量变量的权重在不同点餐情景下基本相同,而飞广州和飞北京在ab的权重是不同的。有偷换概念的诡辩嫌疑。
kiven神 回复 @kiven神: 餐馆评分的模型不符合辛普森悖论。因为不同的餐馆,口味和份量的食客权重基本相同,而辛普森悖论要求两个变量的权重相反。
无论是在哪个平台买东西的时候会看到图片以及评价,看完以后心里面会存在一个预期,超过预期的好,当然给好评。达不到预期自然会给低分。其实旅游景区里面最容易出现辛普森谬误,因为旅游区人数多,就餐的地方选择性少。