第4章 论预测心理学(3)

第4章 论预测心理学(3)

00:00
22:17

三、方法论的考虑

代表性假设认为,预测与按相似度进行的评估或评定没有差别,尽管标准的统计理论认定预测应该比这些判断更不那么极端。因此,对代表性假设的检验,需要一种可以将预测与其他类别的判断相比较的实验设计。本章报告的实验中,就使用了两种比较实验设计的变异形式。

在其中一个设计中,我们标记为A - XY,不同组的被试在同一输入信息(A)的基础上判断两个变量(XY)。比如在汤姆的例子中,两个不同的小组被给予同样的输入信息(A),也就是,一份人格描述。其中一组按相似度(X)对结果排序,而另一组按可能性(Y)排序。相似地,在数值预测的几个研究中,不同组的被试被给予同样的信息(A),比如说,对一位学生的五个形容词的描述,其中一组提供评估(X),另一组则提供预测(Y)。

在另一设计中,我们标记为AB-X,两组不同被试在不同输人信息(AB)的基础上判断同一输出变量(X)。比如,在工程师/律师研究中,两个不同小组做同一判断(X),即一个特定的人是工程师的可能性。他们得到此人的简要人格描述和有关工程师与律师的基率频率(base-rate fre-quencies)的不同信息(AB)。而在数值预测的情境中,不同组根据不同变量—百分比平均绩点(A)和心理集中度(B)—的分数对平均绩点(X)做出预测。

这些比较实验设计表明,与标准模型相反,预测与相似度的评估或判断一样不回归,从而支持了代表性假设。我们同样可以问,与实际结果或者当输入信息与结果在同一量表上衡量时的输入信息相比,直觉预测是否回归。由于著名的趋中错误(central-tendency error)(Johnson1972Woodworth1938),即使当预测与转换后的形式一样不回归时,我们也预期他们将比实际结果更回归一些。在各种广泛的判断任务中,包括纯粹的将输入变量从一个量度转换到另一个量度上,被试都倾向于避免极端的回答且限制他们判断的变异性( Stevens& greenbaum1966)。由于这一反应偏差,相比输人信息或结果,判断将是回归的。本章所使用的设计通过两种判断的比较中和了这一效应,因为二者都受同一偏差的影响。

这里的系列研究,关注的是人们基于在实验前就可使用的信息来做预测的情形,这些信息是以刻板观念(如对某一工程师的刻板观念)和对变量之间关系的预期的形式出现的。它们没有提供结果的回馈,对每一被试要求的判断的次数也很少。与之相反,大部分以前的预测研究,都是处理被试并不了解的对变量之间的函数或者统计关系的学习,这些研究通常有大量次数的试验和不同形式的结果反馈。在斯洛维奇等( Slovic et al.1971)的研究中,有对部分这类文献的回顾。在有回馈的反复预测的研究中,被试通常选择那些使整个预测序列或模式高度代表实际结果的分布的结果。比如,在概率学习的研究中,被试构造出与结果序列的统计特征大体一致的预测序列。同样地,在数值预测中,被试相似地构造出散点图,也就是输入与结果的联合分布(参见Cray1968)。为了这样做,被试使用一种混合策略:对任一给定输入信息,他们构造出一个有不同预测的分布。这些预测反映的事实是,任一输入信息,在不同的试验下产生不同的结果。显然,在这两种范式中,其预测规则是不同的,尽管都涉及了代表性启发式。在有回馈的范式中,被试构造出代表输入信息与结果关系的整体范式的回答序列。在本章考察的情形中,被试选择最能代表每一个体给他们的印象的预测。这两种方法导致对标准规则不同的背离:在回馈范式中用混合策略代表不确定性;但在本章涉及的范式下,则根据评估的预测而摒弃不确定性。

 

四、信心与效度错觉

如前面章节所示,人们通过选取最能代表输入信息的结果来预测。我们提出,人们对预测的信心程度反映出被选结果在多大程度上比其他结果更能代表输入信息。在输入信息(如分数描述)具有多重属性的数值预测的情境中,代表性的一个主要决定因素,是输入信息的一致性或者连贯性。输人信息越一致,预测分数将显得越具代表性,从而对预测越有信心。比如,在两门基础课程成绩都是B的基础上做出总体成绩是B的预测,相比基于获得AC的成绩做出的同样的预测,更具信心。事实上,输入信息内部的变异性或者不一致,已被发现会降低预测的信心(Slovic1966)。

那种认为一致的描述(profile)相比不一致的将给予更多的可预见性的直觉,是不由自主的。然而,值得注意的是,这一观念与被普遍应用的多元预测模型(即正态线性模型)不相符合,后者认为预测的预期准确度独立于描述内部的变异性。

当判断者依据高度相关的分数来预测时,通常将碰上一致的描述;相对地,在相关性较低时,不一致的描述会更常见。因为信心随着一致性而增长,当输入变量高度相关时,信心通常也会比较高。然而,就给定效度的输人变量而言,它们与标准值( enteron)的多重相关性和它们之间的相关性是反向相关的。因此,一个两难的情况出现了:输入变量间的高度相关增强了信心却降低了效度。

为说明这一效应,我们要求被试基于两组能力测试预测平均绩点。被试被告知,其中一组测试(创造性思维和符号能力)是高度相关的,而另一组测试(思维灵活性和系统推理能力)是不相关的。他们看到的分数都符合这些预期(对其中一半的被试,测试贴上的相关和不相关的标签被调转过来)。被试被告知,“所有测试在预测大学成绩上,被发现是同样成功的。”在这种情况下,当然地,不相关组的测试将比相关组测试实现更高的预测准确度。但正如预期的,在总体的预测分数范围内,被试对依据相关组测试做出的预测更具信心。也就是,他们在一个较低的预测准确度的情境中更具信心。

在许多预测研究中,包括我们自己的,都观察到另一个发现:信心是表现的预测水平的J状函数(参见 Johnson1972)。被试对杰出表现的预测,具有相当的信心,并且他们对预测彻底的失败比预测平庸的表现,也有更多的信心。正如我们前面所看到的,直觉预测通常都是不充分地回归。因此,预测与结果之间的偏差,在极端值时是最大的。J状信心函数,使被试在预测最有可能偏离常态时最具信心,成为必然。

上述分析表明,增强信心的因素,比如一致性和极端性,通常与预测准确度是负相关的。因而,人们在极易犯错误的判断中倾向于体验相当的信心,这一现象我们可称之为效度错觉(illusion of validity)。与其他感知和判断上的错误一样,即使在其虚幻的特性被意识到时,效度错觉通常仍会存留。比如,当采访一位候选人时,大多数人都会对我们对他将来的表现的预测具很高的自信,尽管我们都知道采访的极不可信是臭名昭著的。

 

五、有关回归的直觉

回归效应与我们所有人都息息相关。在我们的经验中,大部分杰出的父亲都有稍稍令人失望的儿子,光彩照人的妻子有暗淡的丈夫,适应不良的开始适应,幸运儿最终遭遇飞来横祸。尽管有这样的经历,人们并没有获取回归的合理概念。首先,在许多注定会发生回归的情况下,他们没有预测回归。其次,正如任何一位统计学老师会证实的,对回归的合理概念是十分难获得的。最后,当人们观察到回归时,他们通常会对其臆造出动态的解释。

是什么让回归的概念违反直觉,且难以获得和应用呢?我们认为这一困难的一个主要来源在于,回归效应,通常违背了所预测的结果应该最大限度地代表输入信息的直觉。

为显示尽管与统计学有相当的接触但非回归的直觉仍然持续的事实,我们为一组心理学研究生被试提供了下面这个问题:

 

一个测试的问题。一位随机抽取的个体,在一个标准的IQ测试中获得140分。假定IQ分数,是“真实”分数和服从正态分布的随机测量误差的总和。请给出你对此人真实IQ的置信水平为95%的置信区间的上限和下限的最佳估计。也就是说,给出一个高估计值,这样你有95%的把握使真实IQ事实上低于这一估计,以及一个低的估计值,这样你有95%的把握使真实1Q高于此估计。

 

在这个问题中,被试被告知将观测到的分数视为“真实”分数和误差成分之和。由于观测到的分数显著地高于总体均值,误差成分更有可能是正值,因而此人在随后的测试中也将获得一个略低的分数。然而,大部分被试(108位中有73位),报告了以140为中心的对称的置信区间,而未能传达出任何的回归预期。在剩下的35位被试中,其中24位报告了回归的置信区间,11位报告反回归的区间。因此,大部分被试忽略了输入信息中的不可靠因素的效应,而视140为真实分数一样来预测。这种在预测时把输入信息看成是毫无错误的倾向,在本章中已被反复观察到。

回归现象的发生,有时也能被认识到,这可能是因为我们在自己的观察中发现了回归效应,也可能是因为我们被明白无误地告知回归现象已发生。当意识到时,回归效应通常会被视为需要进行大量解释的系统的变化。事实上,在社会科学中,提供了大量的对回归效应的虚妄的解释。已有人运用动态原则来解释为何有些企业在某一时段生意兴隆但随后濒于垮台,为何面部表情的训练有益于在前测中分值很低的培训者,而有害于表现极佳的人。如果那些作者能够意识到给定两个有相同方差的变量,下面两个命题在逻辑上是等价的,则部分这样的解释就不会被提出:(1Y有关于X而回归;(2YX之间的相关系数小于1unity)。因此,解释回归效应与解释为何相关系数小于1是等价的。

作为对认识到和合理表达回归效应是多么困难的最后一个说明,请考虑下面这个提供给研究生样本的问题。这个问题所描述的,是发生在作者之一身上的真实经历。

 

一个培训的问题。一所飞行学校的老师釆纳了心理学家推荐的一致正面强化的政策。他们对每一个飞行操作的成功实施都进行口头强化。在使用这个方法一段时间后,老师们声称,与心理学原理相反,对正确实施复杂操作的高度赞赏通常会导致下一次尝试中表现的下降。心理学家应该如何应答?

 

在飞行操作中,回归是不可避免的,因为飞行表现并不是十分的稳定且成功操作之间的进步也是缓慢的。因此,飞行员在一次尝试中表现极佳,在下一次有可能弄糟,无论老师对最初的成功做出什么样的反应。富有经验的飞行教员事实上已发现回归现象,但归结为是正面强化的负面效果。这一真实的故事表现了我们人类生活中令人悲哀的一面。我们一般在他人表现良好时予以强化,在他人表现糟糕时予以惩罚。仅仅通过回归效应,他们就极有可能在惩罚后提高成绩,而在奖赏后成绩下滑。于是,我们被置于一个终生的计划中,我们常常为惩罚他人而受到奖励,为奖励他人而受到惩罚。

回答这一问题的研究生中,没有一位提出回归效应可能导致这一问题。相反,他们提出口头强化对飞行员可能是无效的,或者会导致过分自信。有些学生甚至怀疑教员的印象的正确性,并探讨他们对情境的感知偏差的可能来源。这些被试都毫无疑问接触过彻底的对统计回归的处理。然而,当它不是用父亲和儿子的身高这一熟悉的方式表达时,他们没能认识到这一归事件。显然,单凭统计学训练,并不能改变对不确定性的基本直觉。

 

本章原载《心理学评论》( Psychological Review197380237-251)。允许重印。

 

注释

[1]除非另加说明,本章中实验的被试,均为通过俄勒冈大学的一份学生报纸招聘的有偿志愿者。数据是在小组的情境下收集的。

[2]在计算这一相关系数时,我们把排名反过来。这样一个更高的判断可能性被赋予了更大的数值。

[3]参见本书第159页。

[4]每份有意义的行为片段,应高度代表行动者的人格。这种期望,可解释为什么普通人和心理学家一样总是对这些因素之间可忽略的相关表示惊奇,而这些因素,就是对诚实、风险承担、攻击行为和依从的明显可交换的测量(Mischel1968)

 [5]对研究中的回归谬误(regression fallacies)的富有洞见的讨论,可参见Campbell(1969)Wallis & Roberts(1956)
以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!