您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 行为主义学习理论讲义
第三章行为主义学习理论代表人物Pavlov’s经典条件反射Waston行为主义的开山鼻祖Thorndike效果律工具性条件反射Skinner操作性条件反射行为主义集大成者Bandura社会学习论第一节经典性条件反射学说一、经典条件反射学说的由来巴甫洛夫把这种通过联结作用而形成的对一些刺激做出反应的现象称为条件反射(conditionalreflexes),他进一步对影响条件反射的各种变量进行了系统研究,成功地提出了一种学习类型的研究范式。后来由于研究者又发现了其他类型的条件作用,就将巴甫洛夫发现的条件作用称为经典条件作用(classicalconditioning)。二、经典条件作用的原理1、基本概念无条件刺激(unconditionedstimulus,UCS):任何能够自然引起有机体反射性行为的刺激。无条件反应(unconditionedresponse,UCR):由无条件刺激引发的反应。中性刺激(neutralstimulus,NS):原本不能引发无条件反应的刺激,如铃声和灯光等。条件刺激(conditionedstimulus,CS):通过学习,中性刺激也能引起原本只有无条件刺激才能引起的反应。条件反应(conditionedresponse,CR):由条件刺激单独引发的反应。2、经典条件作用形成的基本过程条件作用之前食物唾液分泌(无条件刺激,UCS)(无条件反应,UCR)铃声无唾液分泌(中性刺激,NS)(无反应或无相关反应)条件作用期间(多次重复)伴随诱发铃声+食物唾液分泌(条件刺激,CS)(无条件刺激,UCS)(无条件反应,UCR)条件作用之后诱发铃声唾液分泌(条件刺激,CS)(条件反应,CR)3、消退与自发恢复条件作用的消退(extinction):若多次呈现条件刺激,却始终没有无条件刺激与之相伴出现,有机体的条件反应就会逐渐减弱,甚至不再反应。自然恢复(spontaneousrecovery):已经消退的条件反应,经过一段时间后,通常能够再次被条件刺激激发而出现。经典条件作用的学习和消退曲线进化心理学家认为消退和自发恢复都具有适应环境变化的意义。如果一段时间电台多次发布地震警报,却没有发生地震,人们可能会逐渐对这种警报不以为然,隔一段时间后当警报重新出现时,人们又会表现出一定的警觉,此时,这种自发恢复的倾向就是很有必要的,因为这次的警报很可能是有预测性的。4、刺激泛化与辨别刺激泛化(stimulusgeneralization):当条件作用建立之后,一些和条件刺激相类似的刺激,虽然它们从来没有和无条件刺激匹配过,也能引起有机体不同程度的反应。刺激辨别(stimulusdiscrimination):和刺激泛化相反,是指有机体通过学习,能够在一些维度上将条件刺激和其他刺激区别开来,选择性地对条件刺激做出反应的现象。5、高级条件作用巴甫洛夫实验中的狗建立起对铃声的条件作用后,如果实验者在每次铃声响起之前又向狗呈现一个灯光,那么几次重复后,灯光也能激起狗的唾液分泌。经典条件作用建立之后,让一个新的中性刺激与条件刺激反复相伴呈现,结果该中性刺激也变成条件刺激,也能引起相应的条件反应。以这种程序建立起的新的条件作用,称为高级条件作用(higher-orderconditioning)以此类推,如果不断用新的中性刺激与条件刺激相匹配,在理论上就可以建立无限多的高级条件作用,从而在刺激与刺激、刺激与反应之间建立起复杂的联系。5、两种信号系统第一信号系统引起条件反应的物理性条件刺激。第二信号系统引起条件反应的以语言为中介的条件刺激。对巴甫洛夫学说的评价经典条件反射解释了学习活动最基本的生理机制;只能解释较简单的低级学习。三、华生的行为主义JohnBroadusWatson,(1878~1958)华生(Watson,JohnBroadus1878-1958)概括了行为主义的基本原则①心理学的研究对象应该是行为,而不是意识②它的方法应该是客观的而不是内省式的;③它的目标应该是预测并控制行为,而不是对精神现象的基础理解。认为学习就是刺激替代的过程,所有行为都是通过条件作用建立的刺激-反应(S-R)联结。1920年华生和其实验助手雷纳(Rayner)进行了小艾尔伯特与小白鼠的经典实验:恐惧的泛化对华生提出行为主义的评价贡献:促进了心理学走上客观化道路;将巴甫洛夫的理论引进了学习理论,促进了行为主义学习理论的形成,扩大了心理的研究领域;推动了心理学的应用。批评:全盘否定意识和本能,贬低生理和遗传的作用以及脑和神经中枢在心理活动中的重要作用,片面强调环境和教育的作用,而忽视了人的主观能动性。只能解释较简单的低级学习第二节操作性条件反射学说桑代克的联结学习理论斯金纳的操作性条件作用一、桑代克的联结学习理论1.实验通过系统地观察,桑代克发现,猫逃离迷笼的过程是一个尝试错误(trial-and-error)的学习过程。•猫通过不断尝试,最终偶然做出了正确的行为,而这种正确的行为会随着猫逃离迷笼的次数增加,在练习中变得愈加熟练,那些错误的行为,则倾向于消失。人和动物的学习过程都是一个尝试错误的过程,伴随满意结果的反应将最终从众多尝试性反应中得以保留,形成刺激—反应联结,学习就是在刺激与反应之间形成联结。学习的实质就是经过尝试错误在刺激与反应之间形成联结。其中,桑代克将结果影响反应的原则称为效果律(lawofeffect):在一种刺激情境下,伴随满意结果的反应,其重复出现的概率将会增加,而伴随不满意结果的反应,其重复出现的概率将会降低。桑代克提出了学习的准备率、练习律、效果律。2.基本观点二、斯金纳:操作条件作用由于行为结果的作用,导致有机体行为出现的概率发生改变的学习形式,就是斯金纳的操作性条件作用(operantconditioning)。1.操作性条件作用的基本过程两种行为两种条件作用引发的反应:应答行为自发的反应:操作行为经典性条件作用操作性条件作用改良后的斯金纳箱2.操作性条件作用的形成操作性条件作用的形成(辨别性剌激)(操作性反应)(强化剌激)SD-----R——SR(杠杆)(压杠杆)(食物)经典性条件作用与操作性条件作用的比较经典性条件作用操作性条件作用关键的关系刺激与反应的次序条件刺激与无条件刺激。操作行为和它的结果(奖励或惩罚)之间。过程特点刺激替代反应修正涉及的心理学规则接近联结原则强化反馈原则基本范式S1→RS2↗R←S学生的行为不自觉的,行为是由无条件刺激或条件刺激引发的。自觉的,行为发生后其结果导致了行为发生的概率的增加或减少。事件发生的顺序条件反射建立前:US→UR条件反射建立后:CS→CR操作行为:强化-行为增加操作行为:惩罚-行为减少。举例教师总是先挥挥手,再说“请安静”。说“请安静”之后引发学生的无条件反射安静和挥挥手引发的条件发射安静很相似。强化:当学生安静时,教师就表扬学生,使学生今后还能保持安静。惩罚:当学生吵闹时,教师就剥夺他们的休息时间,学生很可能在今后的休息时间不再吵闹。3.操作性条件作用的消退、维持;分化与泛化(一般了解)消退——消除强化从而消除或降低某种行为。维持——逐渐减少强化频次,使行为得以保持。泛化——条件反射形成初期,类似于条件刺激物的刺激,也会引起条件反射。分化——可知觉到先前刺激的差异,并对这种差异做出反应。4、强化理论(1)强化与强化物的类别正强化与负强化正强化(positivereinforcement)是在行为发生之后,呈现或增强某种刺激从而使行为在将来出现的概率增加。在正强化中呈现的刺激,称为正强化物(positivereinforcer),如食物、金钱、赞扬、微笑等。负强化(negativereinforcement)是在行为发生之后,撤销或减弱某种刺激从而使行为在将来出现的概率增加。在负强化中被撤销或减弱的刺激,称为负强化物(negativereinforcer),如电击。程序行为后果行为的改变当学生认真正强化物行为听课时正强化物的使用(认真听课)(老师的表扬)出现(学生听课更认真)当学生认真负强化物行为听课时负强化物的使用(认真听课)(课后的作业)消除(学生听课更认真)行为的频率增加行为的频率增加正强化物与负强化物的运用一级强化(物)与二级强化(物)初级强化物(primaryreinforcer)是指任何直接指向于有机体生物学因素的强化物。次级强化物(secondaryreinforcer)是需要与已经存在的强化物建立联结才能起到强化效果的强化物。包括:社会强化物,如表扬、微笑、拥抱或关注活动强化物,如玩玩具、做游戏、从事有趣活动代币强化物,用来换其他强化物的钱、分数、彩星或积分等普雷马克原则(2)强化的程序强化程序的类型连续强化断续强化比率强化间隔强化定比强化不定比强化定时强化不定时强化连续强化与断续强化连续强化(continuousreinforcement)是对每次正确反应都加以强化的强化程序。断续强化(partialreinforcement,或间隔强化)则是只对部分正确反应加以强化的强化程序。连续强化虽然可以使有机体迅速地学会一种行为,但是从长远来说,它对阻止行为的消退效果不佳。而断续强化对一种行为得以长期保持,则有着更佳的效果。定比强化与不定比强化定比强化(fixed-ratioschedule,FR)是指在有机体做出一定数目的正确反应之后即获得一次强化的强化程序。不定比强化(variable-ratioschedule,VR)是指在有机体做出不定数目的正确反应之后即获得一次强化的强化程序。通常,这两种强化程序都能够使有机体保持较高的反应频率。定时强化与不定时强化定时强化(fixed-intervalschedule,FI)是指在前次强化后,经过一段固定时间间隔,有机体的反应才能再次获得强化的强化程序。不定时强化(variable-intervalschedule,VI)是指在前次强化后,经过一段不固定的时间间隔,有机体的反应才可以再次获得强化的强化程序。(3)惩罚及其效果惩罚:减少某个行为发生概率的一种程序。正惩罚:在一个行为之后呈现某种恶性刺激,从而使这种行为出现的概率减少。负惩罚:在一个行为之后移除某种良性刺激,从而使某种行为出现的概率减少。程序行为后果行为的改变当学生认真负强化物行为听课时负强化物的使用(认真听课)(课后的作业)消除(学生听课更认真)当学生在课堂惩罚行为上讲话时正惩罚的使用(课堂讲话)(批评)或负惩罚(取消小红花)的应用(学生课堂讲话次数减少)行为的频率降低行为的频率增加负强化物与惩罚的运用5.程序教学程序教学的基本原则1.明确说明学习目的2.小步子的逻辑系列3.学习者主动地作出反应4.信息的及时反馈5.低的错误率6.按学生自己的速度完成教学程序程序教学可以使用程序课本来进行,也可以利用教学机器来进行。程序教学与计算机的结合,产生了CAI(ComputerAssistedInstruction)。对程序教学的评价让学生积极反应,有利于调动学生学习的主动性;及时反馈符合学习的基本原则;自定步调可以使教学个别化,使教学进度符合每个学生的实际情况;程序教学对于推动教学控制论的发展和教学技术手段现代化都有积极的影响。程序教学的理论基础来源于动物学习的研究,有机械主义、还原论的倾向;对于学生的智力活动未给予足够的重视;有人认为小步子、低的错误率不利于学生的学习;程序教学有利于分析,不利于综合。对教育的启示第一,教学理论和教学方法、技术方面确定教学的目标(终点行为)和学生的水平(起点行为)明确描述从起点行为到终点行为的各个小步行为,通过各种手段让学生按步骤学完所安排的内容即时反馈程序教学模式及其教学技术第二,教学目标的设置与表述方式方面明确原则:明确表述教学目标所涉及的行为。目标1:培养学生的分析能力目标2:提供一篇报纸上的文章,学生能把文章中陈述事实和发表议论
本文标题:行为主义学习理论讲义
链接地址:https://www.777doc.com/doc-4425715 .html