您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 智能技术在心理测量中的应用
智能技术在心理测量中的应用•智能技术是什么?•是人工智能的一部分,•主要包括人工神经网络、遗传算法、粗糙集、模糊集、Agent等。•100多年前,•人们把数理统计的方法运用到心理学中,•产生了心理统计学和心理测量学,•推动了心理学研究的科学化。•智能技术和统计方法一样,•是一种通用技术,•必然会进一步提高心理学研究的科学性。•“智能”的概念是心理学首先提出来的,•智能技术是生命科学和计算机结合的产物,•它涉及了多种理论和方法。•和心理测量的关系是什么?•心理测量是按照一定的规则,•用数字对人的潜在心理特质•进行描述。•存在的问题是什么?•心理学家认为,心理测量所得到的数据具•有随机性,随机误差满足正态分布。•可以采用数理统计的方法来处理这些数据,因此心理统计学是心理专业学生的必修课•程。•心理学家认为,•心理测量的数据是可以计算平均数的,•这就隐含着这样一个假设,•这些数据是等距的,•因此是可以进行加减运算的。•心理学家还认为,•心理测量数据之间的关系是可以用数学•公式来表示的,•甚至认为变量之间是存在线性关系的。•我们经常使用的皮尔逊相关系数就是反映了两个变量之间的线性相关,•我们津津乐道使用的因素分析就是建立在相关系数基础上的,•我们习惯使用的多元回归也是线性回归。•变量间线性关系的思想已经深入我们•的脑海,•人们不假思索就运用了这些方法。•经典测验理论的基本模型就是这种思想•的反映。•X=T+e•这里有线性关系,•也有正态分布的假设。•CTT的出现,•推动了心理测量的发展,•但没有很好反映变量间的关系,•于是出现了项目反应理论。ijibDaiijieccP11•项目反应理论提出了•一个S形的函数模型,•事实真是这样吗?•我们还应该进行探索。•心理测量中存在着许多变量的相互关系,人们一直在追求用某些数学公式来表达•它们之间的关系。•但也许这种关系很难用公式表示。•目前采用的统计方法只是考虑到了心理•测量数据的随机性,•我们还可以从数据的其他特性来进行•研究,•例如测量数据的模糊性、粗糙性。•正是考虑到心理测量数据的特点,•我们近年来采用了人工神经网络、•粗糙集、遗传算法、模糊集等方法•来试图解决心理测量中的某些问题。一、人工神经网络•心理学和人工神经网络有什么关系呢?•黄希庭主译的《认知心理学》•人工神经网络就是联结主义理论,•是心理学家和计算机科学家•共同研究的成果,•是用计算机来模拟人脑神经网络的工作。(一)神经网络模型的提出1、信息加工理论的缺点:把人看成是简单的物理符号系统只是强调信息加工的系列性不能很好地解释日常生活中的很多认知现象2、具有里程碑意义的著作Rumelhart和McClelland(1986):《并行分布加工:认知的微观结构之探索》认知心理学的“新浪潮”(二)人工神经网络模型和人脑的神经网络1、人工神经网络模型各神经元之间存在大量的“联结”,“联结”的强度在信息加工过程中不断进行调整。信息的加工是并行:并行分布系统。2、人脑神经元的基本特性(1)细胞间突触联结强度是可变的。(2)神经细胞是一个多输入-单输出的“元件”。(3)细胞核对信息的加工是非线性的。3、生物神经元的三个功能(1)加权:对每个输入信号赋予不同程度的权重。(2)求和:把所有的输入信号组合起来。(3)传递:把组合起来的输入函数通过激活函数(又称传递函数)f(),产生一定的输出函数。fSjθjx1x2xixnwji4、人工神经元的结构5、向量表示列向量X:输入向量X=xxxni1Tnixxx1=由此可见,神经元的净输入Sj可以用其权重向量Wj(行向量)和输入向量X(列向量)的内积(点积)表示。净输入通过激活函数得到神经元的输出yj,XWSyjjjff在神经网络中最常用的激活函数是Sigmoid函数eySjj11这是一个上限为1,下限为0的S形函数YjSjSigmoid函数(三)神经网络模型的拓扑结构神经网络模型具有各种不同的拓扑结构,其中最常用的是三层前馈模型,该模型由输入层、隐含层和输出层三部分结构组成输出向量..................输入向量(四)神经网络模型的学习和联想神经网络模型的工作过程实际上就是将输入信息进行转换加工的过程,通常人们把这一加工过程分成两个阶段:学习阶段(或称训练阶段)和联想阶段(或称测试阶段)。基本的算法:误差反传算法(BP算法)–(五)神经网络的作用–当系统的输入和输出之间的关系–无法用数学的解析式表达时,–可以用神经网络来建立它的模型,–特别是多个输入变量和输出变量之间的–关系为非线性时,该模型更加能显示其–优越性。(六)基于人工神经网络的效标关联效度的研究•1、问题的提出•效标关联效度的目的:寻找测验分数和•效标分数之间的某种关系。•计算效标关联效度的方法:积矩相关系数•愿望:•测验分数和效标分数具有较高的正相关,•从测验分数来较精确地预测效标分数,•这是一个回归预测问题。•目前运用积矩相关系数作为预测效度•的缺陷:•前提是两个变量之间为线性关系,•而且只能有一个自变量。•于是就出现了这样的问题:•(1)若测验分数x和效标分数y之间为非线性关系,•积矩相关系数就不能很好地反映它们之间的关联程度,•但实际工作中很难事先就保证x和y之间就一定是线性关系。•(2)如果测验分数x为一组变量时,•就不能直接计算积矩相关系数,•而这种情况在测验中是经常遇到的,•人们经常通过一组测验的分数去预测今后的某种表现,•例如高考、公务员考试、招工测验。•常用办法:加权求和。•问题:如何确定权重?•各自变量之间交互作用的处理?•线性加权的方法不能反映它们之间的真实关系。•(3)在根据测验分数预测效标分数时,•人们通常运用线性回归方程,•这就要求x和y都是连续变量,•但实际上可能是类别变量、等级变量,•如果运用统计的方法,•就难以得到相应的回归方程。•寻找比统计手段更好的方法:•由于人工神经网络可以处理多变量•的非线性关系,•还能够处理类别变量和等级变量,•因此可以尝试用来解决上述问题。•2研究方法•2.1研究设计•考虑了自变量(测验分数)和因变量•(效标分数)之间的5种关系,•设计了相应的蒙特卡罗模拟实验条件:•(1)单个自变量和因变量之间是线性关系;•(2)单个自变量和因变量之间是非线性关系;•(3)多个自变量和因变量之间是线性关系;•(4)多个自变量和因变量之间是非线性关系;•(5)单个自变量和因变量之间是随机关系。•在每一种实验条件下,•产生一组正态分布和一组均匀分布的•随机数作为自变量,•通过事先设定的因变量和自变量关系•得到因变量的值。•分别运用统计方法和人工神经网络方法•得到反映因变量和自变量关系的数学模型。•在运用神经网络建立数学模型时,•采用了径向基网络。•样本的容量都为500。•根据已经得到的回归方程和径向基网络,•再进行泛化测试,•将蒙特卡罗方法产生样本容量为100的•数据作为输入,•将输出值和理论上的数值进行比较,•计算它们之间的相关系数r和均方误差根RMSE。•2.2径向基神经网络•径向基神经网络属于多层前向网络,•由三层神经元组成:输入层、隐含层和•输出层,•特点是隐含层神经元的变换函数是中心点径向对称且衰减的非负非线性函数。•在本研究中采用高斯函数作为基函数。•径向基网络可看成是对未知函数的逼近器,•任何一个函数都可表示成一组基函数的加权和。•因此在研究效标关联效度时,•如果测验分数和效标分数确实存在某种未知的•函数关系,•就可以用径向基网络去逼近它,•即使这种关系并不能用显函数的形式表示出来。2.3模拟实验结果•表1不同实验条件下的相关系数和均方误差根实验r1r2RMSE1RMSE211.0001.0000.00000.000021.0001.0000.00000.000030.9031.0000.99660.00004-0.1691.0000.50140.000051.0001.0000.00000.000061.0001.0000.00000.000070.0381.0003.32970.0000实验r1r2RMSE1RMSE280.0431.00010.49920.00009-0.0071.0003.52650.0000100.0671.00013.88670.0000110.0480.1810.90000.8927120.0360.1242.40983.066513-0.017-0.0280.90870.9119140.0420.01262.34522.2316•从表1中的数据可以看出:•(1)当单个自变量和因变量之间为线性•关系时(实验1和实验2),•不论自变量为标准正态分布或均匀分布,运用统计方法和神经网络方法都能够得到很好的结果。•(2)当单个自变量和因变量之间为非线性关系时(实验3和实验4),•不论自变量为标准正态分布或均匀分布,运用统计方法的结果都很不理想,•但神经网络方法能够得到很好的结果。•(3)当多个自变量和因变量之间为线性关系时(实验5和实验6),•不论自变量为标准正态分布或均匀分布,运用统计方法和神经网络方法都能够得到很好的结果。•(4)当多个自变量和因变量之间为非线性关系(实验7、实验8、实验9和实验10),不论自变量为标准正态分布或均匀分布,也不论各自变量之间是否存在交互作用,运用统计方法的结果都很不理想,•但神经网络方法能够得到很好的结果。•(5)当自变量和因变量之间为随机关系时(实验11、实验12、实验13和实验14),不论自变量和因变量为标准正态分布还是均匀分布,•运用统计方法和神经网络方法都无法对数据进行很好的拟合。•4结论和建议•(1)当无法事先确定x和y之间为线性关系时,可以运用神经网络的方法来考查测验的效标关联效度。•(2)测验分数x为一组变量时,不论它们之间是否存在交互作用,都可以运用神经网络的方法来考查测验的效标关联效度。(七)人工神经网络的其他应用•1、压敏材料的研制•2、提高汽车轮胎的胎面硬度•3、改进香烟的配方(其他食品)•4、提高多晶硅切片的合格率二、粗糙集在心理测量中的应用•1、问题的提出•因素分析:编制测量工具,•因素分析的基础:积矩相关,•满足条件:等距或等比数据,•变量之间为线性相关,•样本所在的总体呈正态分布。•如果这些条件没有满足,•怎么精简变量呢?•2、粗糙集•波兰科学家Pawlak提出的一种AI理论,•它不需要关于数据的任何附加信息,•就可以直接对不精确、不一致、不完整的数据进行分析处理,•发现数据之间的关系。•粗糙集中所研究对象的集合称作论域,•记为U,对论域中对象的分类就是建立•等价关系R。•在信息系统中,R也被称为属性集合,,C和D分别称为条件属性和决策属性;是属性值的集合。DCRrRrVV•是一个函数,•它指定了U中每一个对象x的属性值,•通常将•称作信息表知识表达系统S。VRUf:fVRU,,,•心理测量中的被试为x,其集合为U。•所需测量属性的集合为R,•通过测量得到被试在各属性r上的值,•这就相当于建立了函数f,•同时得到各属性的值域Vr。•可见进行测量的过程就是建立信息系统•的过程。fVRU,,,•粗糙集将信息系统•用二维决策表的形式进行表征,•它的每一行表示一个对象x,•每一列表示一个属性r。•粗糙集对于决策表的数据处理中•最重要的方法是约简,•其目的是在保持决策属性和条件属性•之间的依赖关系不发生变化的前提下•对决策表进行简化,•删除掉其中不必要的或不重要的属性。•人们期望找到具有最少条件属性的约简,即最小约简。•但是由于解空间随着问题的规模成指数增长,形成所谓的组合爆炸,因此寻找决策表的最小约简是NP-hard问题。•对于心理测量数据所组成的决策表,采用何种约简方法比较合适,这是我们要探索的问题。•在运用粗糙集处理决策表时,•要求决策表中的数据是离散型的,•因此就要对数据进行离散化预处理。•离散化的本质:•选取一组断点将条件属性构成的空间划分为有限个区域,使得每个区域中对象
本文标题:智能技术在心理测量中的应用
链接地址:https://www.777doc.com/doc-7036091 .html