您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据时代的个人隐私保护
计算机研究与发展DOI:10.7544issn1000-1239.2015.20131340JournalofComputerResearchandDevelopment52(1):229-247,2015收稿日期:2013-10-12;修回日期:2014-05-06基金项目:国家“九七三”重点基础研究发展计划基金项目(2012CB316303,2013CB329602);国家“八六三”高技术研究发展计划基金项目(2012AA011003);国家自然科学基金重点项目(61232010,61173064);国家科技支撑计划基金项目(2012BAH39B04);国家自然科学基金项目(61202214)大数据时代的个人隐私保护刘雅辉1,2张铁赢1靳小龙1程学旗11(中国科学院计算技术研究所北京100190)2(石河子大学新疆石河子832003)(liuyahui@software.ict.ac.cn)PersonalPrivacyProtectionintheEraofBigDataLiuYahui1,2,ZhangTieying1,JinXiaolong1,andChengXueqi11(InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100190)2(ShiheziUniversity,Shihezi,Xinjiang832003)AbstractWiththedevelopmentofinformationtechnology,emergingservicesbasedonWeb2.0technologiessuchasblog,microblog,socialnetworks,andtheInternetofthingsproducevarioustypesofdataatanunprecedentedrate,whilecloudcomputingprovidesabasicstorageinfrastructureforbigdata.Alloftheseleadtothearrivalofthebigdataera.Bigdatacontainsgreatvalue.Databecomethemostvaluablewealthoftheenterprise,butbigdataalsobringsgrandchallenges.Personalprivacyprotectionisoneofthemajorchallengesofbigdata.PeopleontheInternetleavemanydatafootprintwithcumulativityandrelevance.Personalprivacyinformationcanbefoundbygatheringdatafootprintintogether.Maliciouspeopleusethisinformationforfraud.Itbringsmanytroubleoreconomiclosstopersonallife.Therefore,theissueofpersonalprivacyhascausedextensiveconcernoftheindustryandacademia.However,thereislittleworkontheprotectionofpersonalprivacyatpresent.Firstly,thebasicconceptsofbigdataprivacyprotectionareintroduced,andthechallengesandresearchonpersonalprivacyconcernarediscussed.Secondly,therelatedtechnologyofprivacyprotectionisdescribedfromthedatalayer,applicationlayeranddatadisplaylayer.Thirdly,severalimportantaspectsofthepersonalprivacylawsandindustrystandardsareprobedintheeraofbigdata.Finally,thefurtherresearchdirectionofpersonalprivacyprotectionisputforward.Keywordspersonalprivacyprotection;personalprivacyconcern;privacyprotectiontechnology;bigdataprivacy;bigdata摘要随着信息技术的发展,以Web2.0技术为基础的博客、微博、社交网络等新兴服务和物联网以前所未有的发展速度产生了类型繁多的数据,而云计算为数据的存储提供了基础平台,这一切造就了大数据时代的正式到来.大数据中蕴藏着巨大的价值,是企业的宝贵财富.但大数据同时也带来了巨大的挑战,个人隐私保护问题就是其中之一.迅速发展的互联网已经成为人们生活中不可或缺的一部分,人们在网络上留下了许多数据足迹,这些数据足迹具有累积性和关联性,将多处数据足迹聚集在一起,就可以发现个人的隐私信息.恶意分子利用这些信息进行欺诈等行为,给个人的生活带来了许多麻烦或经济损失,因此大数据的个人隐私问题引起了工业界和学术界的广泛关注.首先介绍了大数据时代个人隐私ChaoXing保护的相关概念,讨论了个人隐私保护面临的挑战和研究问题;然后从数据层、应用层以及数据展示层叙述了个人隐私保护所使用的技术,探讨了个人隐私保护的相关法律以及行业规范的几个重要方面;最后提出了大数据个人隐私保护的进一步研究方向.关键词个人隐私保护;个人隐私问题;隐私保护技术;大数据隐私;大数据中图法分类号TP311①ConsumerReportsPoll:AmericansExtremelyConcernedAboutInternetPrivacy(http:markets.financialcontent.comstocksnewsread6669586Consumer_Reports_Poll2008,9,25)计算机的出现促使各种事务数字化,如过去不方便存储、分析和共享的很多纸质材料都被数字化,计算机逐渐成为不可替代的数据处理工具.随着数据量的不断增加,数据库应运而生,数据库技术的迅速发展以及数据库管理系统的广泛应用使人们积累的数据越来越多,人们迫切需要将这些数据转换成有用的知识并揭示其潜在的价值,广泛地用于各种应用.数据挖掘就是为顺应这种需要而发展起来的数据处理技术,它通过分析企业的数据作出归纳性的推理,从中挖掘出潜在的价值,帮助决策者调整策略,减少风险,作出正确的决策.美国1991年出现了商用互联网服务,商业机构一踏入互联网就发现了它在通信、资料检索、客户服务等方面的巨大潜力.于是,其势一发不可收拾,迎来了互联网发展史上一个新的飞跃,而以Web技术为代表的信息发布系统成为互联网的主要应用.Web2.0技术的出现使得博客和社会网络迅速发展,产生了大量的文字、图像、视频等非结构化数据,随之又迎来了云计算,为用户提供了服务资源的基础平台.2008年“大数据”这一术语开始在技术圈内出现,2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,由此大数据时代拉开了序幕.大数据成为直接影响国家、社会稳定以及关系到国家安全的战略性问题,带来了许多的科学思考和科学问题,同时也面临着前所未有的挑战[1],如现有的IT架构以及机器处理和计算能力等.大数据中的大部分数据来源于人和传感器,包括用户上网浏览的资料、社交网络上用户的信息和评论、传感器数据和监视数据等.从浩瀚的半结构或非结构化数据宝藏中获得有价值的信息成为各大企业收集数据的主要目的,大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用,以提升企业在市场中的竞争力.因此,数据成为公司有价值的财产、重要的经济投入和新型商业模式的基石.企业所采集的大部分数据包含了个人信息,虽然有的数据表面上并不是个人数据,但经由大数据处理之后就可以追溯到个人.许多企业或组织基于大数据中数据巨大价值的驱动,无限制地收集、处理、使用和发布个人信息,还有许多大企业之间或企业与第三方间共享用户的信息.1)这种用户数据的使用和共享,给企业带来商机的同时,也对个人产生了惊人的影响.如一些购物网站基于用户过去一段时间的购买行为,有针对性的推荐产品或进行个性化广告的推荐;人们在犯罪之前,可以根据他们在互联网上的行为记录,准确地预测犯罪行为的发生.很显然,这些信息是从大数据的分析中获得的.2)这种用户数据的使用和共享给用户带来了风险:个人隐私泄露的频繁发生威胁到个人的生活安全,也成为影响社会治安的主要因素.据北京中关村派出所统计,2012年全年接报的电信诈骗占立案的32%,为比例最高的发案类型.诈骗中常采用6种手段:1)个人或交友圈信息泄露后的身份冒充,如犯罪分子冒充公检法机关、邮政、电信、银行、社保的工作人员或者亲友等实施诈骗,占诈骗案件总数的42%;2)购物信息泄露后冒充卖家诈骗;3)电话、QQ或邮箱等通信方式泄露后的中奖诈骗;4)寻求工作信息泄露后收到的虚假招聘信息;5)交友信息泄露后的网络交友诈骗;6)家庭信息泄露后的绑架诈骗.由此可见,许多企业都在不同程度上泄露了用户的个人信息.3)个人隐私信息的泄露引发了部分用户的恐慌,他们担心隐私数据丢失或者被恶意窃取.一项民意调查报告显示有72%的人担心他们的在线行为被公司跟踪和分析①.因此,大部分人提高了隐私保护意识,而很多企业对用户隐私保护重视不够,导致企业承受了潜在客户的丢失和经济利益损失[2].由此可见,大数据时代数据分析存在着多面性,如果对分析结果合理利用不仅能促进企业的发展,也能为用户提供更好的服务,但是,一旦出现不合理032计算机研究与发展2015,52(1)ChaoXing的运用会给个人的生活带来很多的烦恼,甚至是威胁.随着企业拥有数据量的不断增加,如果没有很好的策略解决个人隐私信息的保护问题,将会对企业甚至对整个社会造成不良的影响.当前,对个人隐私信息的保护还没有成熟的技术、成文的法律规定或行业标准,个人隐私保护更应该提上日程,实施各种有效措施保证个人隐私的安全,这也是大数据时代所面临的巨大挑战之一.本文介绍了个人隐私的基本概念,讨论了大数据时代个人隐私面临的严峻挑战和研究问题,综述了个人隐私的保护技术,提出了企业或组织应遵守的法律和行业规范,最后探索了个人隐私保护的进一步研究方向.1个人隐私的概念及在大数据中面临的挑战1.1个人隐私的相关概念1)个人隐私的概念隐私的提出要追溯到Warren等人[3]在1890年发表的《隐私权》,它成为美国传统法律的开创性著作.Warren和Brandeis提出个人隐私权是一项独特的权利,应该受到保护,免遭他人对个人生活中想保守秘密细节的无根据发布.隐私的概念在社会科学的所有领域(如哲学、心里学、社会学)已被研究大概100多年,但是并没有一个明确的既符合时代发展需求又符合实践检验的定义[4].隐私的定义主要分为2类:基于价值的,把隐私看作一种人权,是社会道德价值体系的一部分,一种商品[5],是人和社会的价值(如用户上网时,担心隐私问题的同时,在许多情况下为了达到自己的一些需求,仍然提交他们的个人信息);基于同源的,把隐私关系到个人的思想、感知和认识,看作一种状态(包含4种子状态:匿名、隐匿、保留和隐密),一种控制[6],表示个人和他人之间的交易控制,其最终的目标是增强自治或减少泄密.基于控制的隐私定义曾经是隐私研究的主流,但是也有研究把控制作为隐私的一个要素,两种研究成为学术界争论的焦点之一.在某种意义上,隐私被描述为多维的、灵活的以及动态的,它随着生活的经验而变化,是机密、秘密、匿名、安全和伦理的概念重叠,同时也依赖特殊的情景
本文标题:大数据时代的个人隐私保护
链接地址:https://www.777doc.com/doc-5740838 .html