您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > AI人工智能 > 人工智能回顾与展望84
人工智能王存睿cunrui@gmail.com我们身边的人工智能-机器人2人脸识别3草图识别智能吸尘器从儿童抓起——乐高机器人什么技术支撑起这次经济危机?????经济危机环境下IT企业“过冬”策略1.云计算:允许大量网络系统共享IT基础平台,帮助企业的IT系统以最小成本和最便捷方法达到企业级技术水准。2.SaaS:通过互联网向应用软件平台服务商定购所需应用软件服务,按所定购的服务支付费用的一种服务模式。3.ITIL:一种可以将企业IT系统及IT部门的运营效率提高25~30%的标准化体系框架。4.SOA:一种可以实现Internet环境下各独立业务系统之间应用集成的软件服务架构。5.协同软件:以异地团队协同工作为目标的协作软件工具包。6.开源软件:一类可以免费使用和二次开发的应用软件。7.虚拟化技术:一系列节省成本的技术手段,包括虚拟产品技术、虚拟平台技术、虚拟主机技术、虚拟服务技术等。8.商务智能(BI)与数据仓库技术(DW):将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。9提纲AI的几个重要阶段回顾AI的研究现状初探AI的最新动态AI在中国AI的未来发展方向展望应对策略预期目标10一、AI的几个重要阶段回顾第一阶段:符号逻辑推理AI初创的10余年间(1956-1969)代表人物:Simon,Newell,Nilsson,etc.不足:适合高层推理,但面对海量数据需要底层的统计学习方法第二阶段:知识工程及专家系统20世纪70-80年代(包括90年代初)代表人物:Feigenbaum,Shortliffe,etc.贡献:已在医疗、军事等领得到广泛应用11几个重要阶段回顾(续)第三阶段:人工神经网络20世纪80年代中后期至90年代代表性成果:BP网的成功应用,etc.不足:机器学习的关键问题之一“模型的推广性”没有理论保证(“过学习”、“欠学习”)第四阶段:基于统计学习理论的方法20世纪90年代至今代表人物:Vapnik,etc.优势:建立在坚实的数学基础之上12其它研究方向回顾智能Agent及多Agent系统20世纪90年代中期开始代表性成果:足球机器人,WebSpider,etc.Agent的观点:将AI领域目前分离的子领域重新组织为一个有机整体目前研究重点:ReinforcementLearning和SearchinLargeSpace(NASA,Google,etc.)遗传算法与进化计算20世纪70年代,现在又重新热起来了(周志华等)应用效果虽较好,但理论基础不够坚实13其它研究方向回顾(续)软计算与粒度计算20世纪60年代中后期至今代表:FuzzySets,RoughSets,GranularComputing优点:可表达、处理模糊、含糊等知识不足:还不算最主流的AI研究方向数据挖掘20世纪80年代末开始兴起应用性极强,高校不如国际性著名IT公司,较易受数据限制14国外著名的AI研究机构美国AI四大名校:Stanford,CMU,MIT,UCBerkeleyUniversityofWashington,UniversityofTexasatAustin,etc.欧洲OxfordUniversity,CambridgeUniversity,etc.其他UniversityofToronto,UniversityofAlberta,etc.15AI的主要研究流派Newell和Simon的“认知主义”,即基于“物理符号逻辑”Nilsson的“逻辑主义”McCarthy主张以非单调逻辑为中心的“常识推理”Brooks的“进化主义”,代表作“机器虫”McCulloch和Pitts的“联接主义”,基于他们提出的“神经网络理论”Vapnik的“统计学习理论”,SVM成功的三大因素:VC维-推广性,kernel-非线性,margin-几何解释(有助于直观理解)16AI界已达成的基本共识AI理论应建立在严密的数学基础上严格的定理、确凿的实验证据,不靠直觉与现实应用相关,而不是与玩具样例相关机器学习不应与信息论分离不确定性推理不应与随机模型分离搜索不应和经典的优化及控制分离自动推理不应和形式化方法分离在方法论上,AI已成为坚实的科学方法利用共享测试数据库及代码,AI系统可重复实验17AI界所面临的共同困境与数学交叉定理机器证明非经典逻辑......与语言学交叉自然语言理解口语理解......与电子学&机械学交叉计算机视觉机器人......与心理学&神经解剖学交叉认知模型心像处理......1.边界不分明2.似乎只能开辟“生荒地”18二、AI的研究现状初探机器学习——“如日中天”汇聚了国内外AI界的绝大多数精英学者已成为智能系统的核心“共性支撑技术”之一其顶级国际会议ICML的竞争十分激烈,ICML2008将在北京举办,潘云鹤院士为名誉主席JournalofMachineLearningResearch(JMLR)为近年来计算机领域影响因子最高的国际期刊之一(AI领域影响因子最高)引起《Science》等的高度重视,Science2000A,Science2000B,Science2001,Science2002(ManifoldLearning,DimensionReduction)19《Science》(2001.9)高度评价ML美国航空航天局JPL实验室的科学家们在2001年9月出版的《Science》上撰文指出:“机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展。”20AI的研究现状初探(续1)计算机视觉——“如火如荼”国际AI、图像处理等领域的主战场之一是智能机器人需突破的核心技术之一汇聚了一大批AI、PR、图像处理学者其国际顶级会议ICCV,CVPR竞争十分激烈……21AI的研究现状初探(续2)信息检索——“方兴未艾”包括:Ranking,多/跨媒体检索,文本分类,移动检索等受到Google,Yahoo,Microsoft等的高度重视具有十分广阔的研究、商业前景数据挖掘——“热情高涨”核心算法己较成熟,不断寻找新的应用点隐私保护、社会网络、生物信息学等已引起高度关注22AI的研究现状初探(续3)语音识别——“仍需努力”基本理论及方法已较为成熟实验室里的成果己相当丰硕重要挑战:如何解决真实场景的“噪音”问题(noiserobustness)粒度计算——“突出重围”粒度计算可涵盖模糊集、粗糙集等理论主要是一批华人学者在探索急需有说服力的理论及应用成果23三、AI的最新动态AI创新性应用(以数据挖掘为例)FeatureLevel:特征选择ModelLevel:三次联姻其他24三、AI的最新动态AI创新性应用(以数据挖掘为例)FeatureLevel:特征选择ModelLevel:三次联姻其他25数据挖掘数据挖掘历史数据挖掘的理论问题数据挖掘的应用问题26数据挖掘的发展1988ExpertSystems19951990ExpertSystems2004……27数据挖掘历史回顾20世纪80年代末开始兴起(IJCAI-89Workshop)1995年第一届数据挖掘国际会议(SIGKDD1995)2003年有15个数据挖掘的相关会议,包括:SIGKDD,ICDM,SDM,PKDD,PAKDD,etc.28数据挖掘的理论问题频繁模式和关联规则挖掘聚类分析分类和预测决策树结构化数据挖掘序列挖掘图挖掘29数据挖掘的应用问题数据流、传感器网络和RFID数据库的挖掘隐私保护数据挖掘Web挖掘多媒体数据挖掘社会网络挖掘生物信息学和系统生物学(SystemBiology)文本挖掘基于数据挖掘的主题演化研究30数据流挖掘概念一系列连续且有序的点组成的序列x1,…,xi,…,xn,称为数据流;按照固定的次序,这些点只能被读取一次或者几次特点大数据量,甚至无限频繁的变化和快速的响应线性扫描算法,查询次数有限Randomaccessisexpensive31隐私保护数据挖掘数据拥有者敏感数据数据挖掘经过转换的数据挖掘结果32隐私保护数据挖掘的目标PPDMencompassesthedualgoalofmeetingprivacyrequirementsandprovidingvaliddataminingresults.保护隐私和满足安全性要求(安全性)产生正确的数据挖掘归纳结果(准确性)提供高效的数据挖掘算法(高效性)AccuracyEfficiencyPrivacy33Web挖掘Web的内容挖掘(文本挖掘)Web的结构挖掘(图挖掘)Web的用户日志挖掘34面向高级搜索的页面层次挖掘(SIGIR04)1231222123122235多媒体数据挖掘36社会网络挖掘社会网络分析复杂网络建模复杂网络的信息传播机制研究社会网络数据挖掘3738ActorConnectivitiesNodes:actorsLinks:castjointlyN=212,250actorsk=28.78P(k)~k-DaysofThunder(1990)FarandAway(1992)EyesWideShut(1999)=2.339Nodes:scientist(authors)Links:writepapertogetherScienceCoauthorship40FoodWebNodes:trophicspeciesLinks:trophicinteractions41Sex-webNodes:people(Females;Males)Links:sexualrelationships4781Swedes;18-74;59%responserate.42社会网络数据挖掘DBLP合作者网络挖掘43KDD领域合作者网络挖掘(论文已被PAKDD2007录用)44生物信息学和系统生物学蛋白质网络的挖掘基因调控机理的研究……45DNARNAProteintranscriptiontranslation46文本挖掘文本挖掘是一个多学科交叉领域机器学习统计学习信息检索自然语言处理47DataAnalysisComputationalLinguisticsSearch&DBKnowledgeRep.&Reasoning48文本挖掘WordLevelSentenceLevelDocumentLevelDocument-CollectionLevel49基于文献数据的主题演化挖掘理解某一领域的发展趋势将顶级会议中的参加者分类新加入者(促进本领域的创新和发展)离开者(影响其它领域)持续保持者5051SIGMOD_ConferenceVLDBPODSAAAIAAAI/IAAIUAIICMLICDEVariableNumber:20EdgeNumber30CIKMPAKDDSIGIRWWWAPWebICDMVariableNumber:20EdgeNumber:18数据挖掘领域的发展数据挖掘领域高速发展,其与机器学习结合日趋紧密Web的研究成为当今数据挖掘领域的重要问题机器学习相关主题频繁模式挖掘等算法Web挖掘等相关主题2000年2006年52Web智能(WI)——“AI之新秀”Internet上的资源取之不尽、用之不竭应用:具有潜在的巨大商业价值理论:在AAAI2006上已成为新的研究专题Web信息的特殊性(“良莠不齐”等)良:Web信息的深层次挖掘(如网上商品的个性化推荐系统等)(注:本课题组在网上汽车评价、个性化推荐上取得了一定的进展)莠:垃圾邮件过滤(SpamFiltering),成为搜索引擎之后的第二大研究领域(注:SEW
本文标题:人工智能回顾与展望84
链接地址:https://www.777doc.com/doc-27279 .html