您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > ETHINK大数据解决方案介绍100
2014年10月28日目录公司介绍大数据平台解决方案行业案例•安徽象形信息科技是国内大数据分析产品领先厂商,国内自主研发的大数据商业智能品牌ETHINK。•是国内唯一具有大数据可视化数据挖掘平台的产品商,第一家集成大数据挖掘与商业智能的产品服务商。•深厚的技术底蕴与科研背景,与中国科学技术大学等一流院校建立大数据联合实验室,形成产学研创新基地。•8年专注于大数据商业智能领域的高科技创新企业。•持续研发大数据领域的核心技术产品,ETHINK已在电信、金融、烟草、审计、公安、财政、制造业等行业广泛应用.公司简介专利发明以及软件著作等行业客户分布大数据领域软著13个象形ETHINK-业务分析模型引擎软件象形ETHINK-OLAP分析平台软件象形ETHINK-结构化数据搜索分析引擎软件象形ETHINK-高性能OLAP分析服务器软件象形ETHINK-云端商业智能开发平台软件象形ETHINK-Excel服务器软件象形ETHINK-自助分析软件象形ETHINK-数据挖掘软件象形ETHINK-报表软件软件象形ETHINK-商业智能软件……产品介绍产品介绍行业客户中国科学技术大学先进技术研究院由安徽省、中国科学院、合肥市、中国科学技术大学四方共建,一期建设占地575亩,总建筑面积约53万平米,计划博士、硕士最终达到3000-5000人规模;聚焦大数据、微电子、健康医疗、新能源、新材料、量子信息等领域的技术研发与成果转化。中科大-象形大数据商业智能联合实验室,由科大多位博导、教授领衔,集中了30位博士、硕士,30位大数据研发人员的联合研发队伍,在多个大数据技术领域进行技术研究和成果转化。中科大-象形大数据联合实验室介绍•大数据商业智能联合实验室,由中国科大信息学院仿真与智能控制实验室和安徽象形信息科技联合成立。•围绕大数据在基础设施和商业应用两个方面,着重在分析工具、加速计算和应用开发等方向开展理论突破、技术攻关和应用产品开发。•吸纳全球重点是中科大的先进技术成果和高端人才,通过技术攻关、成果转化和人才培养,使联合实验室成为成熟技术的输出中心、大数据人才的培育中心。并扶植合作企业进行市场开拓和技术服务,打造大数据高科技企业集群。将联合实验室打造成国内领先,国际一流的大数据研究和应用中心,以及大数据产业化基地。实验室介绍-实验室目标定位技术基础研究方向研究方向关键任务制高点大数据可视化挖掘1)新型内存迭代数据挖掘算法2)数据挖掘可视化开发平台3)房地产、金融、电信等机器学习模型研究1)基于内存计算的机器学习算法2)面向行业大数据深度机器学习模型3)大数据可视化挖掘产品在国内是空白领域大数据内存计算1)基于内存的迭代算法研究2)内存大数据高速统计分析技术1)基于大数据内存的计算服务器技术2)国内产品空白领域大数据语义分析1)大数据自然语言识别2)非结构化数据的知识发现、集成技术应用于大数据平台的可视化集成目前是空白领域大数据云计算技术1)大数据云计算平台技术2)商业智能云平台技术1)云BI技术及大数据平台的核心技术研究2)大数据云BI在国内应用是未来趋势,有望建成国内第一家云BI平台实验室介绍-技术基础研究方向产学研合作项目合作成果大数据环境下的无重叠视域跟踪技术研究项目1.与38所在智慧城市合作,应用于智慧黄山2.9项大数据视频专利3.多项国家自然科学基金审计行业大数据知识推理系统(国家863项目)1.课题《大数据环境下基于案例的知识推理平台》申请国家863计划2.安徽省审计数据分析平台,建立大数据审计分析模型与算法100多套,目前已推广安徽30多区县,正在推广全国。房地产大数据分析(国内最大房产数据厂商)1.建立房产数据开发服务平台,提供公众服务。2.建立房地产价格指数,房产价格评估模型。安徽省碳交易平台1.大数据碳金融算法与模型建立。2.碳交易与分析平台。制造业大数据健康云图设备健康指数模型、生产健康诊断、质量健康诊断联合实验室产学研成果开创了基于人类视觉智能的动态目标捕捉、跟踪和行为分析的研究,在国内外杂志、会议发表了多篇高水平论文。获得视频识别,知识学习与推理相关发明专利2项,申请发明专利7项。大数据技术,解决视频领域的知识识别,知识发现,知识集成与跟踪,推理等关键技术问题。多项国家自然科学基金,应用于智慧黄山大数据视频分析平台大数据环境下无重叠视域跟踪大数据技术来实现国家经济免疫系统数据接口大数据知识推理系统疑点数据审计数据中心审计跨12个行业,跨地区数据源传统审计大数据审计无法跨地区、跨行业审计跨行业、跨区域审计事后审计、周期性审计连续审计复杂性隐蔽问题难以发现智能化,具有预测功能依据小样本经验地毯式排查大数据分析,建立抵御和预防手段审计行业大数据知识推理系统房地产大数据利用大数据建模技术,实现房地产价格预测指数、房地产价格评估模型,达到了面向公众用户发布房产价格走势服务,辅助房地产评估师快速出具评估报告目的。碳交易利用大数据建模技术,建立全省碳排放计量监测体系的数据体系、技术体系、模型体系和评估体系,形成满足安徽省碳排放计量关系方程和参数利用大数据建模技术,建立工厂健康诊断评估模型,实现工厂健康状况的可量化、健康问题可关联分析的目的。制造业健康云图目录公司介绍大数据平台解决方案行业案例提供专家撰写的政策、行业、宏观类分析报告为高端分析人员提供数据挖掘、分析及深度处理为业务人员提供在线自助式数据服务数据分析、展示、报表、报告、可视化自助分析平台可视化挖掘平台Mysql/Oracle…商业智能可视化平台决策各类存储、计算框架,目前是国际规范的一套体系。hbase,hive,impala,shark等Hadoop/Spark大数据应用架构存储层可视化层挖掘层分析层决策层从分析层到展现决策层,ETHINK大数据平台拥有完善的解决方案。让普通用户、数据分析专家、IT集成商、数据挖掘人员都能够利用ETHINK大数据平台,实现大数据分析。SQLJDBC/ODBC可视化数据挖掘平台自助分析平台多维分析平台事件开发平台可视化设计平台内存计算服务批处理实时流处理交互式查询Hadoop生态系统/关系型数据库报表开发平台一栈式大数据架构基于分布式内存迭代计算框架Spark,全面支持七大应用平台。目前国内涵盖数据存储、数据可视化、数据挖掘最完整产品方案。移动BI分布式存储-hadoop,spark集群支持TB,PB及数据的大数据服务器集群内存数据库支撑的高性能查询数据库计算云存储云性能100倍于hadoop分布式集群与内存计算技术国际标准hadoop大数据内存计算技术数据挖掘越来越多的应用到了各个领域中,主要包括与客户关系管理相关的模型、与风险控制相关的模型、与生产销售预测相关的模型等数据挖掘应用领域产品名ETHINK可视化挖掘概要通过在浏览器内,鼠标拖拽形式实现加载数据、转换、建模、评估、图形以及结果输出特点通过视觉工作方式轻松获得此界面可以保障操作的灵活性在最短的时间内形成最多样的模型大数据挖掘,速度快大数据应用平台-可视化挖掘大数据应用平台-可视化挖掘拖拽式数据挖掘建模–普通业务、管理人员能够用简单的拖拽方式来构建数据挖掘案例,并实现模型的发布、管理可扩展性强–为数据导入和导出、数据转换、建模算法、模型评估和部署方面增加新的应用提供了良好的扩展性,在保持系统架构不变的情况下,增加新的数据挖掘模型丰富的数据挖掘模型–聚类算法(快速聚类、分层聚类、基于密度聚类)–分类预测算法(贝叶斯、逻辑回归、线性回归、岭回归、决策树、时间序列…)–关联规则算法(Apiori、Carma,序列)数据挖掘案例支持重用模式模型适用范围逻辑回归用来拟合事件发生概率的模型,可以用来处理分类问题。SVM一般用于人脸识别、语音识别、医疗诊断、文本分类和故障诊断。朴素贝叶斯预测类成员关系的可能性,如给定样本属于一个特定类的概率。决策树决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。-银行贷款风险线性回归用来拟合一个变量与其他解释变量之间的线性关系。最终呈现回归方程以及模型检验的结果。岭回归岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法。Lasso可以在参数估计的同时实现变量的选择,较好的解决回归分析中的多重共线性问题,并且能够很好的解释结果。KMeans根据数据本身结构特征对数据点进行分类的方法。R等其他算法其他各类算法以及定制算法,包括R语言算法等等。ETHINK-算法模型功能模块金融电信行业1.电信用户流失预测2.基于客户分群的精准智能营销3.基于公司价值评价的证券策略投资电力行业1.电力负荷预测2.自适应防窃漏电实时诊断互联网行业1.电子商务网站用户行为分析2.基于用户行为分析的定向广告投放3.企业信息系统用户服务感知评估制造业行业1.基于水色的水质评价2.水产养殖投入产出预测公共服务业1.空气质量预测2.卷烟消费者购买行为分析3.纳税人偷税漏税评估场景应用示例金融选股建模纳税偷漏税评估窃漏电实时分析电信客户流失分析特点一丰富建模方法特点可拖拽式建模JDBCWebServicesRestfulapi可扩展性强自定义模型,扩充组件特点传统的关系型数据(mysql、Oracle等)列式数据库(Hbase等)非结构化数据(Hdfs、文件系统)大数据(Hbase、Hive等)...R语言、其他算法模型等等特点二大数据处理特点开放型平台将模型结果写入共享库将建模结果与其它人共享BS结构,一站式建模、评估、部署基于内存计算平台内存计算运算速度快特点GBPB特点三大数据处理能力特点基于内存计算平台内存计算执行数据挖掘时,方法论非常重要.因为准确的方法论能够提高作业速度,能系统地减少各种进展状况,所以选择正确的方法论是很重要的.CRISP-DM方法论是全球认可的数据挖掘的标准执行方法论.数据输入ETHINK建模流程数据预处理数据平衡:每10000条数据中只有700条是流失用户,数据偏向非流失用户,导致模型输出结果偏向分流失用户。相关性字段选择人工筛选:取值离散且各数据取值没有明确说明含义的列。相关性筛选:从而筛选出对目标列影响大的分析列。建模评估航空发动机故障预测金融选股预测大数据应用平台-可视化设计平台丰富的控件、图文图形、业务组件大数据应用平台-可视化设计平台五大类设计控件–控件(模型绑定表格、基本组件、控制组件、多表拼接、布局容器)–SQL组件(SQL绑定表格、分层树、下拉列表等)–仪表盘(多种微型图和仪表盘)–图形组件(常见图形展现组件)–业务组件(KPI、业务展现模型、复用组件、公共维度)丰富的可视化数据展现–KPI绩效、决策分析–地图分析、信息图–仪表板、驾驶舱完美图文分析报告–全面支持office格式丰富设计控件,二次开发平台支撑自定义复杂应用需求大数据应用平台-可视化设计平台仪表盘决策分析管理驾驶舱地图分析KPI绩效信息图大数据应用平台-可视化设计平台15种,50个,柱状图,线型图,散点图,饼图等FLASH图形控件常用组件,树,表格,下拉列表,日期,进度等常规控件251515类treemap,关系图,属于矢量图157类微型图,microchart表示趋势,占比,进度20种仪表盘720表单,图片,图文报告,HTML5控件20大数据应用平台-可视化设计平台丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类丰富的图形种类可视化设计平台演示大数据应用平台-报表设计平台•根据结果直观拼接,简单直观–采用结果拼接的方式,所以表格即使无限复杂,只要单表容易拼接,复杂性不受子报表组合影响•全面满足复杂中国式报表设计要求–横向多源分片–纵向分组/重叠分组/按段分组–报表预警/多层表头–拓展区/静态区混合–分组汇总–组件配置非常简单•同比,累计,环比,各类计算丰富全面满足日常业务报表分析与应用需求大数据应用平台-报表设计平台适应中国式报表设计要求
本文标题:ETHINK大数据解决方案介绍100
链接地址:https://www.777doc.com/doc-24213 .html