1603【数字小学问】点评网站的低分商家真的很差劲吗?

1603【数字小学问】点评网站的低分商家真的很差劲吗?

00:00
08:48

本期课程 


【数字小学问】点评网站的低分商家真的很差劲吗?

主讲人:胡渐彪

时间:2017年9月12日0点




课程重点 


为什么评分不能反映真实情况:


问题就出在,网站上的分数,是由“所有人”评分的结果


因为在一般人群中,对口味的要求,通常就像金字塔一样,那种舌头特别挑,对口味特别讲究的人,往往在人群中,就像金字塔的顶端,只占一小部分


至于大多数的客人呢,他们在评价一家餐厅的时候,他们对味道的要求,不会那么严格⋯⋯他们心目中的好吃与不好吃,往往,会同时受到餐点的份量,与价格的影响


所以,如果一家餐厅,味道特别好,可是呢,价格偏高,这时候,这家店在网站上的评价,就会趋于两极,少数人,会因为味道好,所以给高分,但多数人,却可能嫌他价格不划算,份量没吃饱,因此打低分⋯⋯结果,两者一平均,这家餐厅的分数,就被拉下来了


相反的,如果一家餐厅,走的是经济实惠的风格,那么对于少数舌头挑惕的客人来说,他们一开始,恐怕就不会来,而会来的顾客呢,他们对于味道的要求,由于不是那么严格,所以只要餐点的水准,到达一定程度,就会觉得“这家店已经够好吃了”,因此,纷纷给高分⋯⋯


所以,并不是评分不可靠,而是当评分者的口味,呈现金字塔分布的时候,则平均分越高的餐厅,往往符合的,越是贴近于基础人群的标准


辛普森悖论:


早在1951年,英国统计学家辛普森,就曾经提出:在分组比较中都占优势的一方,在结果中,反而变成劣势的现象。


那么,发生这种现象的原因究竟是什么?


简单来讲,是因为权重不同导致了结果的不可信。 


飞机的延误现象:


A和B呢,虽然都是120次的航班,但A是以北京为基地,B是以广州为基地。


所以A的120次航班中,从北京出发的有100架,准点50班,准点率为50%;广州出发了20次,准点了16班,准点率为80%。所以,全部加起来,在总共120个航班中,A准点了66架次,66除以120,得出了A总准点率55%。


记好咯,55%的准点率,我们来看看B。


同样是120班飞机,B从北京出发的只有20架次,准点了8次,准点率为40%;广州出发了100次,准点了70班,准点率为70%。好,这样B的准点率是78班除以120班飞机,得出了总准点率65%。


这就是B65%,和A55%的来历。


但是,你仔细想想。B真的比A更准时吗?





正确挑餐厅的方式:


回到我们之前挑餐厅的故事,现在,你已经知道了点评网站分数也受到辛普森谬误的影响,食客权重比例不一导致了结果的不可靠。


所以呢,如果你是那种,挑餐厅的时候,除了味道,其他条件不太在意的吃货


那么,与其参考大数据的评分,还不如,去建立一个“焦点团体”,也就是先重点参考你身边那些特别会吃的朋友的意见


而这也就是为什么,举世闻名的米其林餐饮指南,他们对餐厅好坏的评鉴,不是开放由所有的顾客投票,而是派出专业的审查员,一家一家去打分,为的,就是怕专业人士的评分,在不同的权重下,被牺牲了



本期金句 


(点击图片可保存并分享)



思考题 


生活里,你还发现过哪些辛普森悖论的例子呢,分享出来我们讨论一下。



课程表 


数字的把戏:为什么免费的是最贵的?


为什么有人愿意花7块钱去换1块钱?


点评网站的低分商家真的很差劲吗?


不了解“真随机”,你就只能受命运摆布。


数字是怎么在同一个问题上“说谎”的?


下期课程 


【数字小学问】不了解“真随机”,你就只能受命运摆布。

主讲人:邱晨

时间:2017年9月13日0点


以上内容来自专辑
用户评论
  • 叶智勇_

    无论是在哪个平台买东西的时候会看到图片以及评价,看完以后心里面会存在一个预期,超过预期的好,当然给好评。达不到预期自然会给低分。其实旅游景区里面最容易出现辛普森谬误,因为旅游区人数多,就餐的地方选择性少。

  • 3maojiayou

    航班这个例子真的是扯淡。率的比较应该用卡方检验,渐彪欧巴算过卡方检验的P值吗?P<0.05吗?目测这个样本量就没有统计学意义,何况样本量根本不够。除了分层比较这个理念符合统计学理念,其他真是扯淡

  • vjhsyjvsk

    表示买东西看餐厅只看差评。。。

  • 阿菜菜brita

    以出差为乐,与数据为伍,行色匆匆,不忘初衷。这才是我最熟悉的渐彪欧巴的画风。看到你又做回自己,真开森😊

  • 听友39929423

    就像Steam游戏平台上面的游戏,有些我看起来很cult很糙的游戏(注意这是主观评价),评分却出奇地高,评论区也好评如潮,究其原因,也是只有cult玩家才会去玩这些游戏并评分,所以如果你不是目标受众,剁手之前最好进行更多调研,例如看看实况什么的。嗯,这是超过50%游戏30分钟弃坑的惨痛教训。

  • 洪祥焜

    怎么感觉每一期你都在讲废话

  • 纵拥星万万

    避免辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

  • ly_1cu

    不同意啊 你们吃黄鱼面前已经说了价格实惠 说明你们已经把价格因素考虑在内了咯

  • 博麗靈夢_zg

    你们既然有钱又想吃更好吃的面那为啥要去看“大众”点评呢……是为了想出这期节目么🤦‍♂️

  • kiven神

    点餐和订票的讨论模型有区别,点餐的模型不符合辛普森悖论,因为口味变量和分量变量的权重在不同点餐情景下基本相同,而飞广州和飞北京在ab的权重是不同的。有偷换概念的诡辩嫌疑。

    kiven神 回复 @kiven神: 餐馆评分的模型不符合辛普森悖论。因为不同的餐馆,口味和份量的食客权重基本相同,而辛普森悖论要求两个变量的权重相反。