什么是数据仓库,以下是我对数据仓库的认识:
假设你有很多很多的衣服。有些是经常穿的,有些是不经常穿的。都放在柜子里。经常穿的,你可能隔三五天就取出来穿,穿完后再放回去。不经常穿的,可能搁在那儿,八辈子也不会动,有点像鸡肋,放着占地方,丢掉又很可惜,而且,说不定什么时候还会穿上一把呢?
把这两种衣服放在一个柜子里,是不是会觉得很乱,不方便啊?
这时候,就应该把常穿的衣服放在一个方便存取的柜子里,而把不经常穿的衣服放到其他的柜子里。
随着时间的推移,不经常穿的衣服越积越多,一个柜子放不下,你可能得添加新柜子【不考虑把不经常穿的衣服处理掉】,柜子数会从1个增加到两个,三个。后来你会发现为装旧衣服而买柜子不合适,你就会把很旧的衣服用油纸包包好,放到储藏室,反正一般也不会用到,所以打包很合适。
经常穿的衣服,放入柜子中的时候,最好是挂起来,虽然占地方,但是找起来方便,放回去也方便。
不经常穿的衣服,可不能挂在柜子中,应该叠起来再放进去。这一放,可能会放置很久,为了能记住一些信息,你需要找个地方标志出这件衣服是什么时候放到柜子里的,什么时候买的,从哪儿买的,买的时候的价格是多少等。如果买的时候是用美元,建议你把美元换算成人民币,有利于以后统计。这就是整理,旧衣服入柜之前,是需要整理的。
而且放置的时候最好分门别类放置,例如按春夏秋冬,品牌,颜色,衣服类型等。
出于某种需要,你想清点一下你的衣服,想知道春夏秋冬衣服各有多少件,每一类合计多少钱,每个品牌的衣服多少件,每个品牌合计多少钱,每种颜色的衣服有多少件,每种颜色合计多少钱等。如果把柜子,包裹打开,一件一件的数衣服,是件很麻烦的事情,可操作性也差,那该怎么办呢?
首先,在放入柜子或包裹的时候,要分门别类。
其次,可以在柜子或包裹上贴一张纸条,在纸条上标出该处春夏秋冬的衣服都有多少件,占多少钱,各品牌的衣服都有多少件,多少钱,各颜色的衣服有多少件,占多少钱。
这样,如果你想要知道上面问题的答案,只要根据这些纸条上的内容就算就可以了。
如果你觉得去柜子或包裹旁边看纸条太费劲,你把纸条上的信息抄下来,抄到一个本子上,或输入到电脑中,这样统计的时候,直接看本子或电脑就可以了。不过注意要让本子或电脑与纸条保持同步,否子本子或电脑中反应的数据就会失去他们的真实性。这个本子或电脑中的记录,就是数据集市。
你可以根据纸条的信息,形成一个本子,偏重对春夏秋冬衣服的统计。
你媳妇也可以根据纸条信息,形成一个本子,偏重对品牌的统计。
你根据分析你发现某一段时间,衣服的购买量比平均值明显的多,或者少,你就会疑惑这是为什么呢?你怎么去寻找原因呢?靠脑子,可能记不住,那么是不是原因很难找?
你可以找个地方记录一些你生活中的大事,还有社会上的大事。
如果你发现2006年3月买的衣服多了,你找到记录一看,是不是在这段时间家里有什么大事发生?是不是社会上有什么大事发生啊?一看就明了了。这就是上下文信息。