您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 关于食品安全的多元统计分析论文
1多元统计结业论文2用K-均值聚类和因子分析对食物中毒的有关数据进行分析摘要背景:食物中毒不但严重危害人们的健康,而且造成大量经济损失。我国有较健全的食物中毒报告系统,但食品安全形势不容乐观,食物中毒事件屡有发生,目的:通过分析全国食物中毒1991—2000年发生的情况,2012年食物中毒每季度发生情况,中毒病原分析,探讨日常生活预防食物中毒的措施以及政府应该采取的措施;方法:对数据进行收集整理,根据食物中毒发生的年份、季度、中毒病源运用K均值聚类分析,因子分系的方法进行分析;结果:1991—2000年京沪渝食物中毒的病源主要有微生物性的和化学性的,2012年全国食物中毒主要发生在第2、3季度,从1991年至2000年全国食物中毒的发生次数、中毒人数呈逐年下降的趋势;结论:以微生物、化学物作为防止食物中毒的重点致病因素,以第三四季度作为防止食物中毒的重点时段,通过加强预防食物中毒的宣传教育工作,中时有针对性的防控工作,建立饮食行业有效的监管机制,提高救治能力和检测能力,严厉处罚发生食物中毒的单位,可以最大限度地预防和降低食物中毒的发生,对于以前有利于控制食物中毒的措施要继续坚持,并创新新的预防及控制措施。关键词:食物中毒;食品安全;因子分析;K均值聚类;预防措施1、引言:食品安全是全社会共同关心的问题,直接关系到公众健康和生命安全。尤其是近些年来一下商家为了个人私利想食品中添加各种不利于人们身体健康的物质,导致食物中毒。食物中毒是指食用了被生物性、化学性有毒有害物质污染的食品或者3食用了含有毒有害物质的食品后出现的急性、亚急性食源性疾病。食物中毒的发生严重危害人民群众的正常生活工作,甚至有可能危及社会的稳定,因直接或间接因素导致频频发生食物中毒,使食品安全问题成为社会关注的焦点,控制和减少食物中毒的发生至关重要,据此本文根据搜集到的有关食物中毒的数据,来分析食物中毒与季度的关系,食物中毒的主要原因。2、分析原理与方法2.1、K均值聚类分析的原理与方法:主要思想及原理:K均值法是麦奎因提出的,这种算法的基本思想是将每一个样品分配给最近中心(均值)的类中方法步骤:(1)将所有的样品分成K个初始类;(2)通过欧几里得距离将某个样品划入离中心最近的类中,并对获得样品与失去样品的类,重新计算中心坐标;(3)重复步骤(2),知道所有的样品都不能再分配时为止。适用范围:样本容量很大且不相互独立的数据;2.2、因子分析的原理与方法:主要思想及原理:因子分析的基本思想是把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。方法步骤:(1)输入原始数据,计算样本均值和方差,进行标准化处理;(2)求样本相关系数矩阵;4(3)求相关系数矩阵的特征根和相应的标准正交的特征向量;(4)确定公共因子数;(5)计算公共因子的共性方差;(6)对载荷矩阵进行旋转,以求能更好地解释公共因子;(7)对公共因子做出专业性的解释。适用范围:适合具有一定相关性的数据,高度不相关几乎可以直接用源数据进行分析的用因子分析意义不大。3、数据分析3.1、食物中毒病源分析问题描述:通过表格中的数据对京沪渝食物中毒病源进行分析,因为指标之间有相关性,所以用因子分析来简化数据(数据来源于论文“中国京沪深渝1991—2000年食物中毒情况分析”)。问题分析:因为各地区食物中毒的因素很多,且各个因素之间有一定的相关性,考虑到可以用因子分析来简化数据,是数据更加清晰的反映问题。(一)操作步骤(1)录入数据,如图所示:5表3.1.1(2)在SPSS窗口中选择分析→降维→因子分析,调出因子分析主界面,如图,并将变量一如变量框中:表3.1.2(3)点击“描述”按钮,展开相应对话框,如图,保持默认值,单击继续按钮,返回主界面。6表3.1.3(4)点击抽取按钮,设置因子提取的选项,如图,一般保持默认值表3.1.4(5)点击旋转按钮,选择最大方差法,如图:7表3.1.5(6)点击得分选项,如图勾选:表3.1.6(7)点击选项按钮,打开如图窗口:8表3.1.7(8)点击确定按钮,运行因子分析过程。(二)运行结果及解释(1)特征根和累计贡献率。从表中看出前两个的银子的特征值都大于1,因此我们选取两个公共因子。(2)为了得到意义明确的因子含义,我们将因子载荷阵进行方差最大法旋转,得到旋转后的因子载荷矩阵如图:9从因子载荷阵可以看出:因子“沙门氏菌”、“金黄的葡萄球菌”相关性强,而另外两个因子相关性强,因此我们命名因子1为“微生物性因子”,因子2是“化学性因子”,从这两方面分析可以简化食物中毒病院的分析。3.2、1991—2000年全国食物中毒情况分析问题描述:通过K均值聚类分析对1991—2000年全国食物中毒起数,中毒人数,死亡人数进行分类,然后进行结果的分析。(数据来源于论文“中国京沪深渝1991—2000年食物中毒情况分析”)。问题分析:因为想要分析历年来食物中毒起数、人数,死亡人数的变化,所以考虑到用聚类分析把这些年份分类,又因为数据较多,所以用K均值聚类比较方便。(一)操作步骤(1)录入数据,如图:10表3.2.1(2)在SPSS窗口中选择分析→分类→K-均值聚类,调出K均值聚类分析主界面,并将变量移入变量框中,如图:表3.2.2(3)点击迭代按钮,对迭代参数进行设置。如图:11表3.2.3(4)点击保存按钮,设置保存在数据文件中的表明聚类结果的新变量。如图:表3.2.4(5)点击选项按钮,指定要计算的统计量。如图:表3.2.5(6)点击确定按钮,运行K均值聚类分析程序。(二)运行结果及解释(1)该表给出初始类中心12(2)下表给出每次迭代结束后类中心的变动:从表中可以看到本次聚类过程共经历了两次迭代,由于在迭代子对话框中使用系统默认选项(最大迭代次数为10和收敛判据为0),所以在迭代后,类中心的变化为0,从而迭代停止。(3)下表给出各观测量所属的类及与所属类中心的距离:(4)下表给出聚类结果形成的类中心的各变量值:结合表我们可以看出10个年份被分成两类,第一类包括1991、1992、131993、1994年,这一类的类中心中毒起数为1393,中毒人数为37786,死亡人数为305,三个指标的数量都比较高;余下的年份为第二类,第二类的类中心中毒起数为704,中毒人数为19284,死亡人数为145,三个指标的数量都比第一类低。3.3、2012年全国食物中毒报告数据分析问题描述:通过K均值聚类对2012年全国食物中毒报告中每季度的数据进行分析,找出食物中毒和季度之间的关系(数据)。问题分析:因为想要通过全国食物中毒数据的分析,看看食物中毒在哪个季度是高发期,从而在高发季度采取相应措施,所以需要将数据分成两类,一类是高发期,一类不是高发期,所以采用K均值聚类。(一)操作步骤(1)录入数据,如图:表3.3.1(2)其余步骤同上。(二)运行结果及解释(1)下表给出初始类中心,如图:14(2)下表给出每次迭代结束后类中心的变动:从表中可以看到本次聚类过程共经历了两次迭代,由于在迭代子对话框中使用系统默认选项(最大迭代次数为10和收敛判据为0),所以在迭代后,类中心的变化为0,从而迭代停止。(3)下表给出各观测量所属的类及与所属类中心的距离:(4)下表给出聚类结果形成的类中心的各变量值:通过该表可以看出季度被分成2类。第一、四季度为第一类,第二、三季度为第二类。第一类类中心三个指标的值分别为29、682、33,第二类类中心的三个指标的值分别为58、2305、41。明显第二类三个指标的值都大于第一类,这说明食物中毒在第二类即第二、三季度发生的比较多。4、结果与讨论:通过对第一组数据的分析,我们发现导致食物中毒的主要因素有15微生物性的和化学性的,这为我们提出预防食物中毒的措施提供了方向,比如我们在日常生活中要注意食物的干净卫生,在自己的日常生活中尽量多吃健康卫生的食品,另外国家也应该加强监管力度,尽量让企业减少添加剂,防腐剂等一些有害物质,有害元素的使用,同时作为企业也要配合政府的政策,不能只顾个人利益,不管他人安危。通过第二组数据的分析,我们发现在1991年至1994年食物中毒起数,中毒人数,死亡人数较1995年至2000年高,说明随着社会的发展,人们越来越重视食品安全问题,由于国家各方面政策的出台及广大人民对食品安全的关注,使食品中毒时间发生的次数减少。通过第三组数据的分析,我们发现第二三季度是食物中毒的高发期,这使我们能够有效的预防食物中毒,以第二三季度作为防止食物中毒的重点时段,以家庭、餐饮服务单位作为防止食物中毒的重点场所。5、参考文献1、孟军,谭春梅,董柏青,黄林,杨美才,陈岳波广西2002—2003年食物中毒情况分析[期刊论文]-实用预防医学2005(6)2、郭玉霞利津县1998—2004年食物中毒资料分析[期刊论文]-预防医学论坛2006(1)3、流境.食物中毒的种类及预防[j].大众科技,2005,(1):26.4、张肃.1985年-2000年我国食物中毒情况重点分析[J].中国食品卫生杂志,2002,14(5)26-285.胡萍.余少文.黄绮兰.李尧辉中国主要省市1988-2003年亚硝酸盐食物中毒分析[期刊论文]-深圳大学学报(理工版)2005(1)、6、胡萍.余少文.尹婉婷.黄瑞英.陈小婕中国21个省市食品中亚硝酸盐监测状况分析[期刊论文]-深圳大学学报(理工版)2005(2)
本文标题:关于食品安全的多元统计分析论文
链接地址:https://www.777doc.com/doc-5266293 .html