关注微信公众号:FocusBI 查看更多文章;加QQ群:808774277 获取学习资料和一起探讨问题。
《商业智能教程》pdf下载地址
链接:https://pan.baidu.com/s/1f9VdZUXztwylkOdFLbcmWw 密码:2r4v
数据行业发展的很快,很多一起做BI的朋友都已转入大数据、云计算、人工智能等高大上的领域去了,而我还停留在原地做BI,导致能一起讨论问题的人越来越少,我还有太多BI领域的知识不会,需要深入学习,只好一个人慢慢前行一点一点的去学。
在做BI实施的过程中,发现重复性的事情太多、比较耗时、而又容易混乱;做BI最大的特点是面向整个企业的各个部门各个管理层级,而不像业务系统面向的是某几个部门;由于这个特点导致需求很难一步把握准确设计合适的数据结构。在项目中做好数据字典管理是非常重要的,因为整个项目的基础是需求和数据表结构,表结构方便项目所有人员了解项目,如果数据字典是用excel 、word 或者是PowerDesigner来管理对于项目人员来说是不方便的也非常容易遗漏搞错;特别是项目上线交付后过段时间有需求要改动或增加,项目人员拿到的数据字典是不完整的这样他得花时间理解之前项目的需求和字段作用及来源,为了方便项目交付及后期维护,我自学了几天c#开发了一个小工具用来管理BI项目,我把它命名为《DW/BI项目管理》,这个工具还有一些功能需要完善,还需要增减 <指标体系建设> 模块。
这次介绍《DW/BI项目管理》中的 <数据库表结构> ,
DW/BI项目管理:登录
首先双击BI项目管理.exe 应用程序,弹出一个登录窗口输入用户名和密码。
DW/BI项目管理:主业
登录成功,会跳转到主业,你将看到 导航条、表结构空值数据、SSIS警告错误信息,
导航条是系统的模块。
表结构空值数据:这个是显示数据库中表和字段没有描述的信息,它有填充功能只要双击表名称或列名称空白格子处就能填写相应的描述,而且这些描述填好后按回车键就能保存到数据库中,表名称和列名称都填写了就会在这里消失;数据库的下拉框是让你选择服务器上的任何数据库,选择好后单击 查询按钮就能把空值显示出来。这个功能有什么作用了,它就是随时提醒开发人员你给表增加了字段或增加了表要随时做好说明方便整个项目人员知道这个事情,如果遗漏过段时间自己都不记得做的是什么。
SSIS警告错误信息:这里会显示ETL执行后所有的警告和错误信息,日期选项框可以选择你要查看的日期,类型选项框可以选择要查看警告还是错误的信息。当日期和类型选择好后单击查询按钮就能查看你想看的信息,
DW/BI项目管理:数据库表结构
《DW/BI项目管理》的数据库表结构模块包含三个子模块分别是:数据字典管理、数据空间管理、数据空值率。
数据库表结构:数据字典管理
数据字典管理模块能随时看到你想看的数据库全部表结构,它有导出excel 的功能,因为数据字典也是BI项目交付给客户的一部分。这里也能对表说明和列说明进行修改。
数据库表结构:数据空间管理
数据空间管理能清楚的知道目前表中有多少行数据、数据量使用了多少空间、索引空间等。如果每天把这些数据保存起来通过循环相减就能知道每天的增量是多少。作用是当数据量达到某个点的时候是否要考虑表分区管理等。
数据库表结构:数据空值率
数据空值率能知道某个表的某个字段有多少空值数据,有可能这些数据并不是无效的是在某种规则下容许为空值,但是数据仓库是不容许空值存在的这属于噪音数据;知道这些空值后希望BI开发人员能查明原因或修正取数规则,方便后期核对数据时说明空值原因;如果前期开发时就检查好空值数据项目结尾核对数据时会节省很多时间。这个模块有一个BUG正在修复中。
历史文章:
FocusBI: 使用Python爬虫为BI准备数据源(原创)