您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 推荐下载--贝叶斯推理研究综述-最新
贝叶斯推理研究综述人们根据不确定性信息作出推理和决策需要对各种结论的概率作出估计,这类推理称为概率推理。概率推理既是概率学和逻辑学的研究对象,也是心理学的研究对象,但研究的角度是不同的。概率学和逻辑学研究的是客观概率推算的公式或规则;而心理学研究人们主观概率估计的认知加工过程规律。贝叶斯推理的问题是条件概率推理问题,这一领域的探讨对揭示人们对概率信息的认知加工过程与规律、指导人们进行有效的学习和判断决策都具有十分重要的理论意义和实践意义。1什么是贝叶斯推理早在18世纪,英国学者贝叶斯1702~1761曾提出计算条件概率的公式用来解决如下一类问题假设[,1],[,2]…互斥且构成一个完全事件,已知它们的概率[,],=1,2,…,现观察到某事件与[,1],[,2]…相伴随而出现,且已知条件概率[,],求[,]。贝叶斯公式发表于1763年为[,]=[,][,][[,1][,1]+[,2][,2]…]这就是著名的贝叶斯定理,一些文献中把[,1]、[,2]称为基础概率,[,1]为击中率,[,2]为误报率[1]。现举一个心理学研究中常被引用的例子来说明参加常规检查的40岁的妇女患乳腺癌的概率是1。如果一个妇女有乳腺癌,则她有80的概率将接受早期胸部肿瘤射线检查。如果一个妇女没有患乳腺癌,也有96的概率将接受早期胸部肿瘤射线测定法检查。在这一年龄群的常规检查中某妇女接受了早期胸部肿瘤射线测定法检查。问她实际患乳腺癌的概率是多大?[2]设[,1]=乳腺癌,[,2]=非乳腺癌,=早期胸部肿瘤射线检查以下简称射线检查,已知[,1]=1,[,2]=99,[,1]=80,[,2]=96,求[,1]。根据贝叶斯定理,[,1]=180[180+9996]=0078心理学家所关心的是,一个不懂贝叶斯原理的人对上述问题进行直觉推理时的情形是怎样的,并将他们的判断结果与贝叶斯公式计算的结果做比较来研究推理过程的规律。因此有关这类问题的推理被称为贝叶斯推理。2贝叶斯推理研究概况21基础概率忽略现象的发现与争论和开辟了概率推理这一重要的研究领域。他们在20世纪70年代初期的研究首先发现,人们的直觉概率推理并不遵循贝叶斯原理,表现在判断中往往忽略问题中的基础概率信息,而主要根据击中率信息作出判断。他们一个经典性的研究[3]是告知被试100人中有70人是律师,30人是工程师,从中随机选出一人,当把该人的个性特征描述得象工程师时,被试判断该人为工程师的概率接近090。显然被试忽略了工程师的基础概率只有30。后来他们还采用多种问题验证基础概率忽略现象[4],如让被试解决如下出租车问题一个城市85的出租车属于绿车公司,15属于蓝车公司,现有一出租车卷入肇事逃逸事件,根据一目击者确认,肇事车属于蓝车公司,目击者的可靠性为80。问肇事车是蓝车的概率是多少。结果大多数被试判断为80,但如果考虑基础概率则应是41。这一研究结果引发了20世纪70年代以来的大量研究。有研究支持其结论,如用前述乳腺癌问题让内科医生判断,结果95的人判断介于70~80,远高于78[2]。等人的研究结果表明,即使哈佛医学院的工作人员对解决如乳腺癌和与之相类似的问题都出现同样的偏差[5]。但也有研究发现,在许多条件下,被试对基础概率的反应是敏感的。例如,如果问题的措辞强调要理解基础概率与判断的相关性[6]或强调事件是随机抽样的[7],则基础概率忽略现象就会减少或消除。另一个引人注意的是和1995年的研究,他们强调概率信息形式对概率判断的影响。采用15个类似前述乳腺癌的文本问题进行了实验,问题的概率信息用两种形式呈现,一种沿用标准概率形式百分数;一种用自然数表示的频率形式,如1000名妇女中有10名患有乳腺癌,在患有乳腺癌的妇女中8名妇女接受早期胸部射线测定法检查,在没有患乳腺癌的990名妇女中有95名接受早期胸部射线测定法检查。结果在频率形式条件下,接近50的判断符合贝叶斯算法,而在标准概率条件下只有20的判断符合贝叶斯算法[8]。而另一些研究者对此也提出异议,有人认为他们在改变信息形式的操作中,同时也改变了其他的变量。如和[9]提出这种概率信息的改变使原来的一般性问题变成了当前单个情境的具体问题,因而问题变得容易,被试判断的改善不能说明他们的计算与贝叶斯计算一致。另外认为[10],他们进行频率形式的操作为所有数据提供了一个共同的参照尺度——即所有数据都是相对于总体1000名妇女而言的,依靠它所有的数据变得容易比较。很明显,接受射线检查并患乳腺癌的妇女的数量8与接受射线检查并无乳腺癌的妇女的数量95相比或与接受射线检查的妇女总数103相比都是非常小的。相反,在标准概率条件下,没有共同的参照尺度,表面上击中率80远高于误报率96,但它们是相对于大小不同的亚样本,而不是相对于总体,不能在同一尺度上进行数量比较。于是他们用4个问题进行了2数据比较尺度共同尺度/非共同尺度×2数据形式标准概率/频率的被试间设计,实验结果表明不管采用哪一种数据形式,被试在非共同参照尺度条件下,判断准确性都低,在共同参照尺度下,判断准确性高。所以判断准确性与数据形式无关。可见,人们在概率判断中忽略基础概率是不是一种普遍现象,不同的研究之间存在较大分歧。这将促使研究者们采用各种方法对人们的概率判断推理过程进行更深入的探讨。22贝叶斯推理问题的研究范式为了探讨上述问题,人们采用了不同的研究范式。从已有的研究看,贝叶斯推理的研究范式主要有两种,一种是文本范式,一种是经验范式。文本范式是实验中的问题以文本的形式直接提供各事件的基础概率和击中率、误报率等信息,让被试对某一出现的事件作出概率大小的判断。如前述的乳腺癌问题,工程师问题,出租车问题等的研究就是采用这一范式。然而,在实际生活中,人们进行概率判断需要从自己经历过的事件中搜集信息,而不是像文本范式那样被动得到这些信息。经验范式便克服了文本范式的这一缺陷。经验范式就是在实验中让被试通过经历事件过程,主动搜集信息来获得基础概率、击中率和误报率等各种情况的信息,然后作出概率判断。例如,和[11]为了探讨基础概率信息和特殊信息对被试解决问题策略的影响,利用建筑棒任务,进行了实验设计。对于一个给定的问题来说,计算机屏幕下方提供3条不同长度长、中、短的建筑棒并在上方显示一条一定长度的目标棒,要求被试用建筑棒通过加法中棒+短棒策略或减法长-中或短棒策略制造目标棒。被试只能凭视觉估计每条棒的长度,迫使他们不能用代数方法而只能用策略尝试来解决问题。基础概率是两种策略解决问题的基本成功率;特殊信息是建筑棒与目标棒的接近类型对选择策略的暗示性和所选策略成功的预见性长棒接近目标棒则暗示使用减法策略,中棒接近目标棒则暗示使用加法策略,如果暗示性策略成功表明该策略具有预见性,否则为非预见性。问题设计时,在200个任务中控制两种策略基本成功率偏向一策略高如70,另一策略低如30;无偏向两策略各50和暗示性策略对成功预见性的比例有预见性暗示性和非暗示性策略成功率分别为80和20;无预见性暗示性和非暗示性策略成功率各50。研究者对被试在尝试上述任务前后分别用10个建筑棒任务进行了测试,发现被试在尝试前主要根据特殊信息选择策略,在尝试后主要依据两种策略的基本成功率信息选择策略。说明人们在尝试200个任务后对尝试中的基础概率信息的反映是敏感的。经验范式的优点在于,实验操作过程非常接近人们在日常生活中获得概率信息以作出判断的情况,较为真实地反映了人们实际的表征信息和作出概率判断的过程。所以许多研究者采用了这一范式[12-14]。但研究范式的变化并没有能消除前述的争论,在不同的研究范式下都存在人们对基础概率信息的忽略或敏感现象,并出现了各种对基础概率信息忽略或敏感现象进行解释的理论。3几种主要理论如前所述,人们进行概率判断时,在一些条件下忽略基础概率,在另一些条件下并没有忽略基础概率。那么,人们是如何作出判断的呢?哪些因素在影响人们的概率推理呢?对此,不同的研究者提出了不同的观点。31启发法策略论和认为人们直觉的概率推理受认知策略的影响,这是一种依赖于经验的判断或猜测。所以,经常会作出错误的判断。主要的认知策略包括代表性启发法和可得性启发法。代表性启发法是指人们倾向于根据样本是否代表或类似总体来判断其出现的概率,愈有代表性的,被判断为出现的概率愈大,愈少代表性的被判断为出现的概率愈小。例如,在他们的研究中,要求被试估计某城市有6个孩子的家庭中,男女儿童出生顺序为和代表男孩,代表女孩的比例,结果大多数被试估计前者远高于后者[3]。因为前者更能代表整个人口中的比例,其次它看起来更随机。但从机会来说,两者的概率应是相等的。可得性启发法是指人们倾向于根据某现象在知觉或记忆中容易得到的事例来估计其出现是概率,如他们在实验中要求被试估计英语中以字母、、、、开头的单词数和以它们为第三个字母的单词数,结果绝大部分被试估计前者远多于后者[15]。但实际上前者是的基础比例远低于后者的基础比例。判断错误的原因在于人们更容易回忆出以这些字母开头的单词,而不容易回忆起它们在中间位置的单词。这与人们的记忆组织有关。32自然抽样空间假说等[16]认为判断一个事件出现的概率时,人们从什么范围抽取一样本有一种自然的抽样倾向,他们称之为自然抽样空间,如果直接从自然的抽样空间中抽取的样本对判断事件的概率是无偏差的,则被试容易作出准确的判断;但若要求被试从非自然抽样空间中抽样才能正确判断事件的概率,则被试容易作出错误的判断。如前述乳腺癌问题,被试从患乳腺癌的人群中抽样来判断接受射线检查的概率较为自然,因为被试更容易认为患乳腺癌的人要接受射线检查。但实验任务是要求从接受射线的人群中抽样来判断患乳腺癌的概率,这与被试的自然抽样方向相反,导致被试对问题进行了错误的表征,对照贝叶斯公式,被试的错误是把[,1]表征为[,1],刚好与问题的要求相反,从而作出了错误的判断。33频率效应论和[8]同意自然抽样的观点,但他们所指的自然是人们加工概率信息的自然方式,认为人们是通过事件的频率而不是标准概率百分数来获得环境信息的,虽然两种信息形式的意义相同,但人们对具有同等意义的不同外部信息形式会产生不同的心理表征。他从进化论的角度出发认为,人类进行概率推理已经进化了一种认知算法规则系统,它不适合加工以百分数表示的标准概率信息,而适合加工以自然数表示的频率信息,因为标准概率是在概率论发展以后才被人们认识的,而频率在人类进化的早期就被认识了,所以人们对事件的频率容易编码而且几乎是自动的,而对标准概率难于编码。因此,它们预言当问题的陈述从标准概率形式转变为频率形式时,对条件概率的直觉推理会得到显著改善,并在前述的他们的实验中得到了支持。如果被试在判断中是忽略基础概率的,那么在标准概率改为频率形式时也应表现出来,但他们的实验表明加工频率信息的被试判断的准确性明显高于加工标准概率信息的被试。然而,正如前面所述,他们的结论也受到其他研究的挑战。34抽样加工理论[10]认为对概率判断最根本的影响既不是抽样方向也不是概率信息形式,而是抽取不同样本所得的数据需要进行不同的认知加工。概率判断中的认知加工分为两个过程,一是归纳加工过程,即利用记忆中或知觉到的样本进行的概率估计,如旅行前根据自己的经验估计某个地区为晴天或雨天的概率。然而,由于受许多主观如个人偏好、期望等和客观条件如过去的经验是在一定时空下获得的的限制,根据可利用的样本来估计概率会存在许多潜在的偏差,所以,要作出正确的判断就必须调整抽样过程中潜在的偏差,这是一个元认知控制过程,通过它,不同来源的样本得到整合并运用于最后的概率判断,这需要运用大量基于规则的元认知操作,包括使用逻辑规则、概率演算、统计学知识或元认知知识。如变换在不同尺度上估计的数量、颠倒条件概率、对来源于有偏差的样本进行矫正等。判断者之所以忽略基础概率而不遵循贝叶斯原理,是因为他们缺乏元认知手段,不能调整在抽样过程中潜在的偏差。为验证此结论,他们用4个问题在此仅以乳腺癌为例在计算机上设计了、两种卡片盒,分别让两组被试自己搜索信息,告知被试卡片盒的每张卡片正面标明是否患有乳腺
本文标题:推荐下载--贝叶斯推理研究综述-最新
链接地址:https://www.777doc.com/doc-4215801 .html