您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 多语言舆情分析系统介绍
多语言舆情分析系统一、系统概述舆情分析系统集成了舆情釆集、舆情监测、舆情智能分析、舆情处理、舆情预警、舆情搜索、舆情报告辅助生成、动态图表统计分析等核心功能。实现把互联网“读薄”,把“热点”读懂,萃取舆情,深度透析热点难点,掌握潜在的变化规律。加强互联网掌握社情民意,向领导提供准确、有效的信息分析结果以供决策参考。二、产品架构专题分析热点分析多语言裡翻译多语言舆敵析&情报分析服务对比分析I跨语言检索麵库)纖司提取多语言憧敵析文本摘要多语該本分类Web信息IE^抽取三、产品功能系统管理图一與情振告舆情预警興情简报舆情专振1tt舆情分析引擎舆情管理负面信息自动摘要敏感话题自动聚类近期热点热点发现提取关键词自动分类数据分发舆情采集引擎编码识别正文抽取标题抽取发布者抽取超链分析内容去重发布时间抽取回帖数量抽取关键词1......关键词NURL1URL2URL3URLn互联网搜索引擎论坛博客新闻......贴吧m(主题爬虫图-(一)信息釆集1.主题爬虫:指定信息源,自动、不间断地监测信息源,爬取其中新增的信息。自动、高效增量式釆集全球主流新闻媒体数据。(二)信息处理1.正文抽取:对釆集的原始数据进行预处理,提取需要的正文内容2.文本分类:对预处理后的资讯进行自动文本分类。3.关键词提取:提取文本中的关键词,对资讯进行自动标引。4.情感分析:对文本进行情感分析,对资讯加上情感倾向标签。5.实体识别:识别文本中的命名实体,包括机构、人物、术语等。(三)信息分析1.关系分析:发现信息中包含的实体与实体之间的关系,包括人与机构、机构与机构等。2.热点分析:自动发现每天形成的热点事件和专题。3.舆情分析:监测行业、机构、事件中的舆情指数的变化。4.态势分析:跟踪和监测行业、机构、事件等发展态势的变化。(四)结果应用1.分类浏览:按照行业分类体系,展示釆集和处理过的行业资讯。2.实时监测:根据定制,监测行业中重要的资讯。3.资讯捡索:根据用户查询条件,全文捡索行业资讯。4.热点推荐:系统自动推荐近期热点专题,并展示热点的变化趋势。5.专题分析:根据用户定制,对与定制专题相关的资讯进行分析,包括舆情分析、态势分析、关系分析等,并生成专题报告。6.行业机构:对行业中重要的行业机构进行实时监测,同时分析其变化。7.行业百科:釆集和行业相关的知识,供用户学习和提高。8.统计分析:可按时间、业务量等对数据釆集、数据访问等进行统计。五、产品特点(一)一体化实现行业资讯釆集、处理、存储、检索、分类浏览、专题分析、热点分析、发布等一体化资讯服务流程,为决策提供数据支撑。(二)智能化»专题分析:根据用户定制信息,快速生成指定专题的分析结果。»热点分析:自动发现近期热点专题,推荐给感兴趣的用户,使用户在平台上就能及时了解国内外热点动态。(三)个性化根据用户的特征对其推荐感兴趣的内容,作为用户个人情报夹,避免信息爆炸带来的困扰,提高情报的利用率。(四)定制化根据用户需要定制监测对象、数据源及专题。(五)跨语言检索只需中文捡索,返回所有语种信息。六、我们的案例(一)多语言舆情分析系统1.使用单位»中国工信部下属单位,2014年。2.系统特点»全球500-1000家媒体。»覆盖不同语言:中、英等。»每天24小时热点跟踪。»覆盖政治、经济、文化、科技、社会等领域。»多语言情报机器翻译:提供多语言的理解。»多语言情报文本分类:政治、经济、科技等。»多语言情报情感分析:了解全球舆论导向。»跨语言智能语义捡索:中文捡索、多种语言输出。»全球热点分析:自动监测和跟踪全球热点。»全球专题分析:定制全球特定专题的分析。»全球监测预警:实时跟踪关注信息并预警。(二)航空情报及舆情分析系统1.使用单位»中国商用飞机有限公司,2013年。2.系统特点»全球200-300家航空相关媒体。»覆盖中、英双语。»每天24小时情报及舆情热点跟踪。»覆盖航空领域相关以及公司相关舆情。»公司负面舆情监测及预警。(三)航空航天科技情报服务系统-AAIS1.使用单位»中国航天科工集团三院(航天三院)2.系统特点»全球航空航天工业100家媒体。»覆盖中、英语言。»每天24小时监测。»解决内外网隔离。3.系统展不2015年。辦,_綱![11|獅】AAIS航空肮天情报全周期服努系统◎焦点新闻獅■MBDAcompletessecondtestlaunchofMMPcombatmissile■SaabordersGripenEpneumaticmissileejectlaunchersfromExelis■i?舰獅_身导弹对抗中国g介入勘■Indiatestsnuclear-capablePrithvi-Hmissile■新型反舰导弹将减少对GPS的过度依赖■印膨oMiaam可能配裔陆军技术(顚)-新闻2015-02-18点击量:0空军技术(讓)•新闻2015-02-28点击星;0mm(中国)-5W闻2015-02-13点击量:0陆军技术(讓)-新闻2015-02-20点击星:0中国1餓术信息网(中国)2015-02-28点击星;0国防科技信息网(中国)-国际…2015-02-25点击星:0丨配罝及更多USAFevaluatesSBIRSIncrement2ground...IngenuityDrivesLockheedMartin,sAEH...LockheedMartinHonorsAsianAmericanE...外电臟-20■相空到l棚欧洲台腿娜5n#弹關局开驗无人n页所有3S点关键词订阅站点订阅我的收藏茼圾检索个人中心管理员1(51'数据一S排序:參名称©URL(2)A-CiD-FgG-liJ'L圍M-0幽P-S’站点i了阅丨配罝及更多曰;卫錄品合璧趣示样机匈■帕克画厂加入EPRI綱删印度2015-2016财箱防预算堪加10.9%顧防部长绍帕:俄海織麵漏…麟军总司令:黻动力IMS離洋驗…本想新:1丨查音更多本想新:1CB3安立公司(美国)领阆1AnritsuIntroducesShockLine1-portUSBVectorNetworkAnalyzers■AnritsuJoinsCollaborationtoShowcaseConnectedCarCloudSolutionsatMobileWorldCongr...■Anritsu,CaviumDevelopSmallCellManufacturingTestSolutionthatSupportsCellular,Wireles...□33Curtiss-WrjghtControlsDefenseSolutions(美国)-白皮书■UnderstandingIntel®ProcessorThrottlingforDefenseApplications_Curtiss-WrjghtControlsDefenseSolutions(美国)•博客囹中文囹外文本颇新:3(四)全球新兴产业科技与经济资讯服务平台-GEIS1.使用单位»中国科技部信息中心,2015年。2.系统特点»全球200家媒体。»覆盖中、英语言。»涉及八大领域:新兴金融、节能环保、生物医药、新能源、新能源汽车、新材料、高端装备、新一代信息技术。»每天24小时热点跟踪、监测。»人物及机构监测。»定制专题舆情分析。3.系统展示LI^(内测獅:街Lh午10:00Hff)IGlobalEmergingIndustrialTechnology&EconomichformationSenricePlatfonn今曰新惲:0本月新熠:161792014年至今:715624总望:753252麵全球新兴产业科技与经济资讯服务平台鎢周三机构强推买入6股极度備周三机构一致最看好的10金股OrangeRono智能手机在波兰上市由中兴代工三星正在研发新款智能手表带有腿圈事件催化+U:绩超忖期煶发机构畜好四类券商股周三机构強烈推荐6只牛股•癉根大通预_称油价下跌或致垃圾债大面枳违约•12月2□板块及个股资金迸出大盘点(附股)热词聚焦热度:513驢天气费用质保期中兴少量现车现车充足热点推荐m标致j车马自达6现金优惪1.4万现车兖足荣威W5店内现车兖足价格直降1.88万MGGT店内可试乘试驾最低9.59万起售比2迪G5可试乘试驾价格稳宗暂无优惠七、我们的荣誉(一)多引擎机器翻译系统ZZX_MT»系统多次参与机器翻译领域相关竞赛,名列前茅。»获多项基金支持(1)国家自然科学基金《基于图的机器翻译关键技术研究》(2)教育部博士点新教师基金《基于维基百科的平行语料库自动抽取》(3)软国重开放课题《领域自适应的科技机器翻译技术研究》(4)985高校基础科研业务费《维-汉统计机器翻译关键技术研究》(二)多语言情感分析&文本分类»参加2012年计算机学会组织的“情感分析评测”任务(NLP&CC),在38个单位中综合排名前3。»2013年COAE多语言情感倾向分析,综合排名前3。(三)多语言文本挖掘»获863项目《面向政府管理的大数据内容理解与智能服务》支持八、我们的优势»覆盖全球不同语言、不同国家、不同行业的500-1000家主流媒体信息釆集、统一存储及捡索。»机器翻译、多语言信息处理、复杂数据分析领域的深入研究。»积累了十余年的工作基础。»多语言情报分析&舆情分析领域的项目实践。九、我们的核心技术(一)多引擎机器翻译系统ZZX_MT1.特点»多语言:英、日、韩、越、俄、德、藏、蒙、维。»多引擎:基于统计、基于规则、基于实例、基于Pivot。»多领域:新闻、科技、生物、金融、专利。2.结构图1.特点(二)多语言情感分析&文本分类»多语言:中、英、日、韩、越、俄等»多粒度:篇章级、句子级、词级»多引擎:基于统计、基于规则、基于迁移学习2.结构图1.特点»覆盖200多种人际关系:父子、夫妻、兄弟、师长、同事等(三)关系抽取&人际关系抽取2.举例从自然文本自动抽取关系与事件相结合,分析事件中涉及的人物挖掘人与人之间的关系路径、机构及其关系(四)多语言文本挖掘1.多语言热点发现与跟踪»自动发现当前的热点,对热点进行有效描述,包括概述、关键人物、关键资源等信息»对热点的发展态势进行跟踪;2.多语言专题分析»对选定的专题进行自动摘要、关键词提取、发展态势分析、舆情态势分析。(五)跨语言智能语义信息检索1■特点»研究以汉语为提问语种,其他语种(包括英语、日语、韩语等)为信息语种的跨语言捡索。»面向多语言的查询扩展(1)提问式和文献翻译式方法相结合(2)文献翻译扩展和查询翻译扩展相结合2.结构图十、试用产品台建后构台务前应,构建索引J公共信息原始数据库中文i多语言細返回&4多i吾言机器翻译引擎多语言麵广展J基于实体的1査询t产展消i支
本文标题:多语言舆情分析系统介绍
链接地址:https://www.777doc.com/doc-5084579 .html