您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 知识管理与智能信息挖掘(1)
内容管理与智能信息挖掘平台1、作用省电子政务平台的建设以各单位的业务信息为基础,重点解决跨厅、局、委、办的协同办公、信息发布和共享服务等问题,从而进一步实现对政务职能转变的推动,以及为领导决策提供辅助支持。内容管理与智能信息挖掘平台解决跨部门协同、异构信息共享、海量信息处理、领导决策支持等问题,提供各个层面的“内容管理和个性化知识服务”,将信息共享这个信息化建设中最基本的概念和应用全面提升到一个新的层面,丰富并完善了政务信息化的结构空间。智能信息挖掘平台,具有部分人工智能的功能,能处理各类数据。具备以下特性:海量的数据处理智能信息挖掘平台可以对绝大多数形式的信息、文本或基于语音的、非结构化或结构化实际内容的基本理解,不论它保存在哪里、用何种格式创建或者与数据相关的应用又是什么。这就是“基于理解的集成“异构数据集成系统内所有的内部操作及处理几乎都可以彼此互联;而且,该技术本身允许应用间的通讯,不管后端的数据源如何。智能信息挖掘平台在组织内创建一个新的操作层,即智能数据操作层,从而使自动处理数字信息及其应用间彼此通讯在组织中成为可能。自动的信息处理智能信息挖掘平台的智能数据操作层“以数据为中心”,可以进行自动化的信息采集、识别、整理、发布、服务。使整体网络降低成本,更有效地进行运营。个性化的分层服务智能信息挖掘平台的服务模式,提供“以人为本“的宗旨设计方法。通过分析人的兴趣爱好,提供相应的信息资源,并且可以根据行业的特点更新、定制各类服务模型。2、平台原理图一个完整的智能信息挖掘平台见下图:1)智能推理服务智能推理服务是建立在模式识别技术之上,它可以保证手工或全面自动地对类似信息的识别和匹配。自动交叉索引/超链接智能信息挖掘平台的架构可以识别信息间的主要关系,从而实现内容间的交叉索引对照。不论是什么文档或什么系列的文档,智能信息挖掘平台都可以在操作层识别出与其相关联的资料。智能信息挖掘平台可以实时生成超链接,保证立即更新,完全不需要手工将链接插入到内容里面。当文档被查阅时,这些链接可以自动一次性插入到文档中,因此可以将以前写的文档和文章作为当前文档的参考,档案资料也可以链接到最新的新闻或相关资料。特点是:自动超链接可以极大地降低任何环境下非结构化信息的维护成本。降低查找相关信息需要的时间,降低重复劳动,让人们了解信息的更迭以及最新的信息。自动上下文环境总结智能信息挖掘平台还可以对内容中的最主要的概念进行总结。可以根据原始查询的上下文环境进行总结,并且将最适用的动态摘要提交给指定的需求。境相匹配。通常,不同的用户基于不同的原因可能会认为同一条内容是自己需要的,例如,关于对于三个代表的讨论,一个工商和公安领域的用户可能会很感兴趣,而另一位卫生领域的用户也会感兴趣。对这些用户的兴趣进行总结,保证他们能立即看到他们需要的信息。特点是:当显示能力有限时,动态内容总结就特别有用,可以发送高度精确的相关信息。提高用户处理信息的能力,加速政务运作。让人们能更快地做出适当的决策如图8-41首长智能秘书服务系统智智能能推推理理引引擎擎自动分类引擎半规整信息(XML)个性化用户引擎ACIAPI/SOAP不规整信息规整信息(ODBC)ACIAPI/SOAPACIAPI/SOAP模式识别别XML引擎•分类•视觉呈现•题目生成•信息频道•信息群聚类•用户•爱好习惯•个人档案•特长•安全保险语音图像HTTPOA新闻电子邮件用户系统互联网数据库报告文档管理系统XML声音影像HTTP图8-41首长智能秘书服务系统获取和检索智能信息挖掘平台解决方案是可拓展的,可以理解概念,它可以保证极高的准确性和全面性。智能信息挖掘平台独特的识别能力保证强大的获取特性,包括自然语言、概念搜索、示例的精练、管理器、交叉语言搜索和示例的查询。智能信息挖掘平台还支持旧的搜索获取机制,例如关键字,布尔、类似、探测法等。其重要特性之一是示例的精练,它允许用户快速精练他们的搜索,精确地将焦点定位在他们需要的上下文环境上。特点是:提供跨多个数据源的统一搜索,首长智能秘书技术可以让用户找到他们不知道的信息2)自动分类技术智能信息挖掘平台的分类技术,不再需要人工干预或人工处理信息,例如手工帖标签。智能信息挖掘平台的分类服务器具有独特的技术架构,能持续准确地自动对数据进行分类,解决成倍增长的非结构化信息所带来的困扰。其高级模式识别技术,智能推理引擎可以通过上下文环境理解任何信息,能够完全自动地对信息进行分类。通过实现内容访问、受理、分析和发送的自动化,自动分类可以提高组织的生产力,降低整体成本。通过自动分类、聚类、和分类学,智能信息挖掘平台可以使组织控制成倍增长的非结构化数据。智能信息挖掘平台的分类技术可以使数据更具可访问性,为用户提供清晰定义、以及已按业务需要进行结构化处理的信息。自动分类智能信息挖掘平台的智能数据操作层可以自动对信息进行分类,而且不需要任何手工输入。首长智能秘书技术分类器的灵活性可以让你精确地根据非结构化文本中的概念进行分类。它保证根据内容对所有的数据进行最准确的分类。与依赖严格的分类定义规则的传统关键字和布尔操作不同,智能信息挖掘平台的架构是建立在基于概念的模式匹配处理之上的,它可以对文档进行分类,自动插入数据标记,发送内容或将其提示给用户,让用户了解与其档案(profile)密切相关的信息。智能信息挖掘平台可以在24小时内,每个CPU实例可将四百万份文档进行分类,也就是说在每25毫秒内差不多可处理一份文档。智能信息挖掘平台可以支持任何数据库并且可以识别任何格式的数据,可以应用所有的安全和访问控制,从而保证完全的可靠性。自动聚类自动聚类收集大量的文档数据或用户档案信息,并且自动识别出信息内的主要类别。自动聚类可以让IDOL自动地持续一致地计算新的信息应该属于哪个类别。其特点是:可以快速建立对知识库的高度了解,自动识别信息走势,自动跟踪走势和主题,消除知识差距,优化组织的信息流。自动分类生成器根据对概念的理解,智能信息挖掘平台的分类生成器可以自动地持续一致地理解信息并且创建有深层次的等级体系的上下文环境分类。消除手工分类所带来的人为干预和错误,智能信息挖掘平台的以数据为中心的自动分类功能可以让组织根据任何类型的数据建立分类体系,不管这些数据是非结构化的、半结构化的、结构化的,还是音频、音频/视频和图像。通常,手工分类会忽略数据间的共性,忽略有价值而责任管理员或编辑又未考虑到的主题。聚类或其他概念化的操作可以用作该过程的“种子”。例如,一个集合可以被自动拆分为一个分类体系。同样,一个文档也可以用来作为引子,寻找与主题类似的信息,然后再将该领域也拆分为一个分类体系。那么可以根据该分类体系了解特殊信息领域,了解整体信息剖面图,或作为自动分类的培训材料,这样可以把信息放到一个得到正式定义的、被控制的和有确定名称的分类等级体系里面。3)个性化技术基于个人的档案(profile),智能信息挖掘平台可以提供广泛的强大的个性化操作。为用户提供条件,让他们登记自己的兴趣,进行监控,并得到提示,了解与他们个人兴趣喜好相关的信息。智能信息挖掘平台的自动个性化解决方案可以实现对目标产品或内容的高度个性化,提高响应速度,提高其竞争力和收益率。个性化解决方案可以让用户有能力更快地做出正确的决策。自动建立档案智能信息挖掘平台自动建立档案功能可以让组织根据智能信息挖掘平台环境中信息的浏览、使用和提交等准确地理解个人的兴趣。根据直接档案(管理器)和隐含档案(通过点击和提交),可以生成每个用户的多面概念型档案,它可代表用户当前的兴趣所在,而且不需要用户填写任何形式的表格。档案可以通过多种设备产生。例如,通过用户和WAP/PDA进行内容交互就可以生成一个档案,然后,这个档案可以用做在Web上推荐Internet内容或者通过电子邮件或者短消息(SMS)推荐新闻内容的基础。特点是:完全自动地提供相关性高和准确率高的信息给用户,在不需要表格、问卷或隐私条款的情况下,了解更多用户信息,而且不需要任何产品成本。信息发送智能信息挖掘平台技术通过多种渠道包括浏览器、移动设备(电话,PDAs等),或者数字TV等给用户发送个性化的内容。这样针对不同的设备,同样的内容可以有不同的用途,而且,用户通过设备进行交互也可以让首长智能秘书技术了解用户的兴趣和专业技术。4)XML自动化技术智能信息挖掘平台可以解决因为手工创建XML标签所引起的低效率,此外,通过理解标签和相关信息内容的上下文环境,给XML的管理增加一个自动化智能层。标签比较与自动XML标记通常,表面看起来彼此没有联系的两条XML标记过的主题可能有很重要的关系。而且,在很多情形之下,两个信息类别之间可能会有一定程度的雷同,因为该用户可能对两类信息都感兴趣。智能信息挖掘平台基本结构可以根据XML标签包含的内容自动推断出其意义。随着XMLSchema数量的提高,以及组织和其他业务交互操作需求的提高,首长智能秘书技术可以提供一个统一的方案,该方案可以通过比较类似的XML标签及自动将XML标签插入到任何Schema中,使不同的XMLschema和元数据结构无缝地交互操作。在不同的XMLSchema间具备互用性,根据概念的差别从XML数据库中发送准确的信息。5)自动内容综合和精练(各类数据接口)智能信息挖掘平台让组织了解自己现有信息资产的状况,不论信息源、格式或媒介如何,都可以进行统一的操作,智能信息挖掘平台能操作的信息包括非结构化的数据例如HTML页面,字处理文档、电子表格、电子邮件及半结构化数据(XML)和结构化数据例如RDBMS表格和LotusNotes。而且,智能信息挖掘平台技术还可以综合并且理解丰富的多媒体内容,例如音频、视频和图像的概念。综合是从不同的信息数据库里收集、抽取和导入内容、元数据及安全数据以供首长智能秘书技术的智能分析的过程。智能信息挖掘平台技术的产品集包括大量高可拓展组件,它可以自动综合来自最广泛范围数据源的200多种不同格式的内容,这些数据源包括:Internet连接器(HTTP,SSL,POP3,FTP,NNTP等)文档库连接器(Documentum,FileNet,Notes,Exchange等)所有的连接器对综合后的文件进行审计,安全授权(可选)、记录修改、删除和终结报告可以使自动数据在智能信息挖掘平台技术的基本结构和数据源之间保持同步。以数据为中心智能信息挖掘平台的解决方案不依赖任何单一文件或数据格式。智能信息挖掘平台技术可以处理所有类型的信息,包括结构化、半结构化和非结构化数据。自动内容综合及处理任何类型信息的能力则使智能信息挖掘平台技术可以做到以数据为中心。其优点是:处理多来源数据的统一解决方案,自动连接人和内容,降低人力消耗,根据广泛的信息,快速的做出适当的决策,避免重复劳动和时间浪费6)安全智能信息挖掘平台技术的架构是可拓展的、粒状的、可伸缩的、安全的结构,集成了市面上主要的授权和安全验证技术。智能信息挖掘平台技术的严密的、全方位的安全授权可以保证用户只能看他能看的文件。7)可分布式拓展智能信息挖掘平台技术系统可以实现在大型政务网络中进行分布式部署,通过分布式的数据采集、分布式数据智能处理、分布式信息响应来提供大型的智能信息服务。
本文标题:知识管理与智能信息挖掘(1)
链接地址:https://www.777doc.com/doc-9661 .html