您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > CH3(1)相关分析与回归分析
第三章相关分析与回归分析相关分析和回归分析是研究事物之间既相互联系又相互制约的关系、探索其紧密联系的程度、揭示其变化的具体形式和内在规律性的一种常用的统计分析方法,也是构造各种数学模型、借助于数学方法对事物进行分析、评价、预测和控制的重要工具,在科学实验和生产实际中有着广泛的应用。河南工业大学shiyanshujuchulishiyongfangfa第一节相关分析一、相关关系概念现实世界许多事物或现象之间相互依存、制约的关系一般可分为两类:河南工业大学shiyanshujuchulishiyongfangfa函数关系表现为一个现象发生数量上的变化,而另一个现象也相应产生数量上的变化,并且有一个确切的数值与之相对应。特点1-1对应的具有数量上的严格确定性关系(数学上以函数的形式表现)函数关系的例子:1.圆的面积(S)与半径(R)之间的关系可表示为2.某种商品的销售额(R)与销售量(Q)之间的关系可表示为(其中p为单价)3.企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3河南工业大学shiyanshujuchulishiyongfangfa2SRRpQ河南工业大学shiyanshujuchulishiyongfangfa相关关系表现为现象之间确实存在的相互依存的关系,但数量上不是严格对应的依存关系,并且其关系数值是不固定的。①现象之间确实存在着数量上的依存关系。②现象之间数量上的关系不是确定的。相关关系的例子:1.人的身高(h)与体重(w)之间的关系。2.人的血压(P)与年龄、体质、生活习惯及从事的工作与职业等的关系。3.食品的销售与产品的质量、包装、消费者爱好等的关系。4.农作物的产量与施肥量之间的关系。河南工业大学shiyanshujuchulishiyongfangfa1.相关关系的定义客观现象之间存在的互相依存关系。2.相关关系与函数关系的联系与区别⑴区别:①相关关系中的依存关系是不确定的;而函数关系中的依存关系是确定的。②函数关系所确定的相互依存关系可以用数学表达式确切地表示出来;而相关关系一般是不确定的,不能用数学表达式准确地表示出来。河南工业大学shiyanshujuchulishiyongfangfa⑵联系:对具有相关关系的现象进行分析、了解现象之间的密切联系程度时,必须利用相应的函数关系数学表达式来表明现象间的相互依存的关系。3.相关关系的种类(1)按依存关系的情况——因果关系(单向依存、互为因果)、分不清因果的依存关系。(2)按自变量的多少——单相关、复相关河南工业大学shiyanshujuchulishiyongfangfa(3)按相关的形式不同——线性相关、非线性相关(4)按相关关系的程度——不相关、完全相关、不完全相关(5)按相关关系的方向——正相关、负相关二、相关关系的测度1.相关图----散点图从直观上对正相关、负相关、线性相关、非线性相关、不相关的一种判断方法。河南工业大学shiyanshujuchulishiyongfangfa散点图的作用:借助直观的方法观察所获得的试验数据能呈现出什么样的规律与特征,从而使我们能够利用曲线拟合的方法,找出理论上的经验公式,并用来分析和解决问题。河南工业大学shiyanshujuchulishiyongfangfa河南工业大学shiyanshujuchulishiyongfangfa完全正线性相关完全负线性相关非线性相关正线性相关负线性相关不相关散点图的作法:例1.1为考察硫酸铜在水中的溶解度Y与温度X之间的关系,作了9次试验,其试验数据如表所示:试根据以上数据资料,确定硫酸铜的溶解度Y与温度X之间的关系.解法1.利用Excel河南工业大学shiyanshujuchulishiyongfangfa温度X01020304050607080溶解度Y14.017.521.226.129.233.340.048.054.8打开“插入”---“图表”---选择“XY散点图”---确定“子图表类型”---根据需要作选择。河南工业大学shiyanshujuchulishiyongfangfa0102030405060020406080100系列1解法2.利用Math解:(1)画出散点图a={{0,14},{10,17.5},{20,21.2},{30,26.1},{40,29.2},{50,33.3},{60,40},{70,48},{80,54.8}}命令:P=ListPlot[a,PlotStyle-{PointSize[0.03]}]从散点图可以看出:数据点大致散布在一条直线附近.河南工业大学shiyanshujuchulishiyongfangfa20406080304050(2)曲线拟合q=Fit[a,{1,x},x]Y=11.6+0.499167X(拟合直线方程)q1=Plot[q,{x,0,90},PlotStyle-{Thickness[0.01]}]{画出直线的图形}S=Show[p,q1](图形叠加)由叠加效果可以看出:数据点不全在直线上,但均与直线较为接近.河南工业大学shiyanshujuchulishiyongfangfa204060802030405020406080203040502.相关系数相关系数是衡量变量之间关系密切程度和相关方向的数量指标。(1)定义设两个随机变量X和Y,通常利用相关系数来刻画X与Y的线性相关程度。河南工业大学shiyanshujuchulishiyongfangfa()()(,)()()()()EXEXYEYCovXYDXDYDXDY在实际应用中,一般可利用样本数据对相关系数进行估计和分析。从总体X和Y中抽取容量为n的样本:则样本相关系数为河南工业大学shiyanshujuchulishiyongfangfa1122(,),(,),,(,)nnxyxyxy112222221111()()()()()()nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny(2)相关系数的性质①判断相关关系方向,正相关;,负相关。②判断相关关系的密切程度,越接近于1,其相关程度就越大;且越接近0,其相关程度就越小。如果进一步细分,有河南工业大学shiyanshujuchulishiyongfangfa1r0r0rrrⅰ)∣r∣=1,变量存在完全线性关系ii)0<∣r∣<1,存在一定线性关系①0<︱r︱<0.3,微弱相关②0.3<︱r︱<0.5,低度相关③0.5<︱r︱<0.8,显著相关④0.8<︱r︱<1,高度相关iii)︱r︱=0,变量完全没有直线关系河南工业大学shiyanshujuchulishiyongfangfa相关系数的计算其中河南工业大学shiyanshujuchulishiyongfangfaxyxxyyLrLL11222112221111()(),()(),()()11,iinnxyiiiiiinnxxiiinnyyiiinniiiiLxxyyxynxyLxxxnxLyyynyxxyynn(3)相关系数的显著性检验用样本相关系数r作为总体相关系数ρ的估计值,而r仅说明样本数据的X与Y的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r值很大,而总体的X与Y并不存在真正的线性关系。因而有必要通过样本资料来对X与Y之间是否存在真正的线性相关进行显著性检验,即检验总体相关系数ρ是否为零。河南工业大学shiyanshujuchulishiyongfangfa(1)提出假设:(2)构造统计量:(3)对给定的检验水平,查t分布表得临界值,利用样本求出统计量值如果,则拒绝,也即认为X与Y河南工业大学shiyanshujuchulishiyongfangfa01:0;:0HH22(2)1rnttnr2(2)tn2(2)ttn0H之间存在相关性,否则接受,即认为X与Y之间不相关。例1.2设某一容量为的样本,其相关系数,试判断此相关是否显著()解:若单从相关系数的角度来看,表明该问题有较高的相关程度。从显著性角度来看,对,查表可得,由样本计算统计量值为河南工业大学shiyanshujuchulishiyongfangfa0H06n0.8r0.050.8r0.050.025(4)2.777t由此可知:不能拒绝,即认为,说明该相关问题不显著。本例表明:当样本容量很小时,即使相关系数比较大,仍不足以说明河南工业大学shiyanshujuchulishiyongfangfa2220.842.667110.8rntr0.0252.667(4)2.777tt0H0例1.3研究某校初三学生物理成绩Y与数学成绩X之间的相关关系,现随机抽取10名学生的数学、物理成绩的相关数据如下:试求数学、物理成绩的相关系数,并检验其相关关系是否显著性。(显著水平0.05)河南工业大学shiyanshujuchulishiyongfangfa数学xi94908686727068666562物理yi93929270827665766860解:(1)计算相关系数河南工业大学shiyanshujuchulishiyongfangfa1010102111758,774,58732iiiiiixyx101021161202,59686iiiiiyxy221596867587741016.8101587327581275.60101612027741294.4010xyxxyyLLL1016.81275.61294.40.7913052190.7913r(2)提出假设H0:r=0;H1:r≠0(3)根据相关系数计算t统计量的值(4)对给定的显著水平α=0.05,查表可得临界值tα(8)=2.306,从而比较可知拒绝H0,即认为该校学生物理成绩和数学成绩之间存在显著的相关关系。河南工业大学shiyanshujuchulishiyongfangfa2220.79131023.6611(0.7913)rntr306.2866.3||)(tt(3)查表法已知:n=10,n-2=8,=0.05,r=0.7913,故查相关系数临界值表可知:rα=0.632比较可知r=0.79130.632=rα因此,可以认为该校学生物理成绩和数学成绩之间存在显著的相关关系。河南工业大学shiyanshujuchulishiyongfangfa一般而言,我们有:(1)若IrI大于表上的α=0.05相应的值,小于表上α=0.01相应的值,称变量x与y之间有显著的相关(线性)关系。(2)若IrI大于表上α=0.01相应的值,称变量x与y之间有高度显著的相关(线性)关系。(3)若IrI小于表上α=0.05相应的值,称变量x与y之间没有明显的相关(线性)关系。河南工业大学shiyanshujuchulishiyongfangfa
本文标题:CH3(1)相关分析与回归分析
链接地址:https://www.777doc.com/doc-3393240 .html