您好,欢迎访问三七文档
文件-新建-项目建一个analysisservices项目名称即是项目名称,位置就是项目存放的位置,这两个可以自己选取自己想取的名字和存放的位置,其余的就无所谓了。然后就会出现一个ssas的项目右侧的就是这个ssas项目你要配置的东西。1、右键数据源,有个新建数据源选项,点击一下即可,就会出现下面的界面:然后点击下一步,就会出现让你选择数据源:我这里已经创建过几个常用的数据源了,所以可以直接选择,直接选定,然后点完成就可以了,不过我先给你示范下新建一个数据源。点击基于现有连接或者新连接创建数据源,然后点击新建,就出现如下图:这个要注意,不要更改,如果是基于SQLSERVER做的话,不要更改这个。然后就要配置这里的服务器名就是你的数据库所在的服务器的地址,我把服务器地址配置进去后,就是这样了:然后把这里改成选择使用sqlserver身份验证,选择后就会出现让你填写数据库的用户名和密码,填写进去后,可以选择保存密码,以后就不用再重复输入了,然后就是这样了:就会让你选择或者输入一个数据库,这个意思就是让你选择你的数据源是在哪个数据库里,然后下拉框选择,就是这样:就像上一个图一样,选择数据库,然后就可以了,这里我选择的是SCM_VJIA,选择完了后,可以先测试连接一下,测试一下是否创建的正常,如果正常就如下图:然后点击确定,确定就好了,这样我们就创建好了一个数据源。看:这里,就是我们刚才创建的连接,然后点击完成,会出现如下图:这里你可以重命名数据源名称,预览里的东西是你的连接方式、数据源服务器地址、用户名、密码、数据库等信息。然后点击完成,这样数据源就创建完成了。如下图:多了一个叫做SCM_VJIA.ds的数据源是吧。如果数据是从不同的数据库不同的服务器来的,按照刚才的步骤重复添加即可。下面就是配置数据源视图:右键数据源视图,会有一个新建数据源视图,然后点击,就会出现如下界面:然后点击下一步:这个可选的关系数据源是根据你上面的数据源来决定的,你上面配置了一个数据源这里可选的就是一个数据源,你上面配置了两个数据源,这里就会有两个可选的。这里你可以直接点击下一步:这里就会让你选择匹配关系,这时候就直接点击下一步就可以了,然后就出现这个了:这个其实就是让你选择你可能会用到哪些表,你要用到哪些表,然后你选择好就行了。然后点击就可以了。然后刚才选定的就到对面去了:这个是全部转移的意思,就是把全部的可用对象都转到包含的对象里。这个和上面那个是相反地意思。然后就点击下一步:然后点击完成,就好了,然后就如下图了:多了一个SCM_VJIA.dst的数据源视图了。如果你发现你已经选择的表并没有你适合的,你可能不小心漏选了什么表,那么可以去添加的,添加步骤如下:双击数据源视图,就会出现如下图这样的然后点击左上角的这个图标,然后就会出现添加数据表的那一步了,如图因为今天周一,这个数据库负载大,所以库里的表没有及时出现。但是步骤是如此的。现在好了,就像这样然后我新添加了几个表,如下图这里有一个,就是一个支持模糊查询的,我新添了这五张表,然后点击确定,那么就添加完毕了。下面几个里面比较常用的也就多维数据集和维度这两块。继续按列表顺序来说吧。一样的,右键多维数据集,有一个新建多维数据集,点击后,就会出现:然后下一步,就如下图:一般都是选择第一项,使用现有表,然后下一步:在这里我给你明确一个定义,所谓的度量值组表,这里的度量值表就相当于我在前面说数据仓库的定义时说的事实表。也就是度量一个指标的情况,比如销售金额就是一个度量销售的指标。这里我选择orderfrom(订单销售表)作为度量值表。勾选,然后点击下一步即可,出现如图:这里就需要你选择的度量值,也就是最终需要统计并展现的指标是哪些。这里我选择orderform里的userid(用户id),isnew(新老用户标识)这个两个指标,做一个简单的客户数的统计。然后点击下一步就会这样:这里自动出现一个地域的维度,是系统自己认为这个是维度,不需要管它,继续下一步即可:继续下一步:好了,再点击完成后,这样一个多维数据集的设计就完成了。点击完成:你看,多维数据集出现了,然后维度也出现了,都是我们刚才创建的。从开始到现在为止其实都是一个数据准备,下面的这些其实才是数据的处理。先来说一些题外话,做BI开发,一切的一切都是基于业务来进行操作的。这里的业务你可以理解为需求,根据需求进行开发。对度量值按维度进行统计,所以做BI开发的时候,你必须要先明确度量值要的是哪些,维度值是哪些,度量值与维度值之间的关系等等。这些也是一个经验的积累,但是一定要明确你要做什么,然后再去考虑怎么去做。拿我这里的举例来说:统计订单用户数,区分新老用户。这里会有一个延伸,一个扩展。在哪些维度上进行统计,比如按省市县来分别统计各个地区的用户数;按时间(年、季度、月、天、小时等)来分别统计用户数。BI要做的其实就是这种,只不过我刚才说的只是一个简单的例子,实际的情况比这个更复杂更完全。其实做BI的目的还是为了分析,所以就要把握着重点。然后继续说具体的用法:这一块右键可以进行重命名,这里我们把它重命名为订单信息。对于下面的userid、isnew也同样可以这样。把useid重命名为用户数。然后就是这样在这里右键用户数时,会有一个编辑变量值选项,通过这个我们对统计方式进行编辑。如下图:这里有用法、源表、源列。这三个分别对应的是,要对列进行什么操作,具体的操作如下图:你看,用法下拉出来是这些用法,选取其中适合你的用法即可。源表:就是要进行操作的字段是来自哪个表;源列:就是你要进行操作的列;订单信息表是以订单号为主键,所以一个客户购买多件商品时,会有多条记录,所以我们要统计用户数时,需要进行去重然后计数。在语法上是count(distinctuserid),在这里就是:非重复计数。然后选定列为userid,点击一下userid,然后点击确定即可,这样我们就编辑好了,一个关于统计用户数的度量值就编辑好了。然后如果我们要统计金额总和,可以新建一个关于金额度量值,具体操作如下:右键订单信息,新建度量值,然后就出现如下图:这里就是price,也就是订单金额进行加总。如下图:按price统计总和,点击确定,就可以得到一个price的度量值。就会如下图:出现这种的原因,是我们最初选择度量值时只选择了userid和isnew,没有选择price,所以它另起了组,这个无关紧要。然后把price右键重命名为订单金额。就会如下图:好了,关于度量值的创建和修改的初级东西就这样了,下面就是关于维度的创建和设置了。就是这一块了:这个维度是创建多维数据集时,系统自动创建的,先拿这个来说,然后就说新建维度的问题。双击Area.dim,就会出现如下图的:这里我先给你把维度表的数据展现一下,因为维度这块的设置,与表结构设计有很大的关系。先来分析这个表的表结构,areaid就是指地域的id,这个表是县区(这里说的县区是因为对于直辖市来说它的行政级别等同于省份的县)的id,father是指父级地域,这个是个区县表,所以它的父级就是市。这里我拿的是福建省漳州的各个县作为例子的。其实这个表并不是一个很好的地域的维度表,一个很好的正式的地域维度表应该是像下面这种,下面是我自己做的一张地域维度表:你看,这里包含了省市县,有一个层次关系,县-市-省。这样设计在数据钻取(这个一会我弄好了,运行了,展示给你看,到时候你就发现这样做的好处了)时就会体现很大的优势。我们现在把这个维度表给添加进去吧。还记得怎么添加吧。先是在数据源里添加这个表所在的数据库,然后再在数据源视图里添加对应的表。再把原先的Area.dim删除,然后现在就如图了:这里我新建了vjia_dw的数据源、数据源视图、多维数据集和dim_area-1.dim这个维度信息表。然后就是设计展现时的维度了。这里经常要做的就是添加属性里,配置层次结构(如果有的话,层次结构你就理解为父子关系就好了),还有就是在数据源视图里新加列。先从第一个属性来说,属性就是你要在哪些列的基础上展现数据:这个里面我们需要先分析下在地域这一块的维度都有哪些,首先要分别有县-市-省这一个层次结构的统计,然后还有县市省分别的统计。所以我们需要添加areaid、areapid、areappid。我们把这三个从数据源视图中找到对应的字段名然后拖到属性里,如下图:因为最终前台展现的应该是省市县的名称,而不是id,所以我们需要对id进行配置,让它最后展现的是名称。拿areaid作为例子,右键属性,会弹出一个对话框:然后找到源,修改NameColumn这一块点击下图中NameColumn中后面的选择框:点击选择之后会出现:然后选择areaid对应的名称列——area,然后点击确定,就会出现如下图:你看,NameColumn中就变成了名称了,然后ctrl+s保存,随后会出现下图:关闭即可。这样areaid就设置好了,同理把areapid、areappid也把NameColumn修改为对应的areapname、areappname即可。还有就是对areakey进行修改,这个里面我们就把它按照一个完整的省市县进行设置,这时候就需要进行对数据源表Dim_area-1进行一个新增列操作,因为你看上面的表数据中,没有一个完整的省市县的组合。右键数据源视图中表,然后出现如图:点击编辑数据源视图进行,就会出现下图:点开表前面的+号,如图:点击后就出现下图:然后右键:有一个新建命名计算,点击,就会出现如下图:然后就可以自行配置列名和表达式,这里我们配置列名为areaname,然后是省市县的名字的拼接,配置好之后就如下图:表达式里包含的东西其实就是SQL语法的拼接,所以按上面这种就可以的,然后点击确定,这样你看,新的一列就出来了:然后crtl+s保存即可。切换回来dim_area_1.dim设计,就会发现也已经有了这一列:然后就按同样的,右键属性,修改areakey的NameColumn。然后我们再建立省市县的层次结构:注意一个顺序,省-市-县。然后就是去配置属性关系了,点击维度结构旁边的属性关系,就会出现下图:这里,因为上面我们建立了层次结构,所以我们需要调整属性关系,具体调整如下:好了,属性关系配置完了,我们就先单独运行下维度,看下是不是我们想要的结果,右键维度:有个处理,点击处理,出现下图:点击是,会弹出一个界面,双击最大化就是下图:然后点击运行,正常的话是出现下图(不正常的话错误原因就要再继续查了):然后点击关闭,回到这一块:有个浏览器,点开浏览器,即出现下图:先点击重新连接,就会刷新,然后选择层次结构里面的各项:分别点击进去展开:我这边显示层次结构时是如下:这种,选择areakey时就是:然后areaid,areapid,areappid时都是类似的,你看,一个可钻取的地域维度设计就完成了,然后现在再整体运行下。这样就可以看下整体的功能。每一个项目都是可以单独处理的,所以右键我们的vjiadw.cube,如下图:然后点击处理就会出现处理维度时同样的信息,如果一切正常处理完成后。回到下图的模块里的浏览器:然后就可以进行展现了:这里面维度是针对如果有多个维度表的话,选择是哪一个维度表;层次结构可选的值就是这几个:我们前面设置的那几个。运算符就是大于小于等于等等,这种是针对不同的维度来说的,比如有时间维度,我们可以选取某段时间里的相应数据,下面的筛选表达式就是我们的层次结构里包含的具体的值,就相当于where条件。如图:这里面的值就是维度的浏览器里的值。注意看这里:这三部分,你可以直接把左边的条件按照行和列、筛选条件拖过来。比如我按areakey计算订单金额,如下图:你看,每个地区的用户数和订单金额就出来了。微软的BI工具SSAS大致也就是这个流程,当然日常工作里会比这个更复杂,但是整体流程都是一样的,只不过会随着具体的问题变得更复杂而已,如果能不看文档你能自己做到这些,然后也就差不多算是入门了。当然中间肯定会出现种种问题,出现问题再去解决问题了,先根据这个文档把大致的流程走一遍,走通了
本文标题:BI教程
链接地址:https://www.777doc.com/doc-871 .html