在维度建模的数据仓库中,客户维度通常是最有挑战性的维度。一般来说,客户维度有如下三个特点,记录很多,有可能有百万数量级;属性很多,有可能几十或者上百;缓慢变化,有时变化也很快。
对于建立基于Web环境的数据仓库来说,客户维度表中通常有两类客户,一类是没有注册过的访问者,另一类是注册过的客户。未注册的客户是匿名的,有可能和企业有多次业务交易,但是企业并不知道客户的详细信息。尤其是在Web环境中,我们通过Cookie可以知道一个未注册的访问者回来了,但是我们没有他们很有意义的数据。而注册过的客户,我们通常知道他们的名称、地址等我们比较关心的信息。
通常我们对未注册的客户分析时,主要关注在三个特性,分别为最后访问时间、访问频率和交易次数(或交易金额)。而对已注册的客户进行分析时,由于用户填写了信息,所以分析的属性可能几十个。将未注册客户和已注册客户合在一起建立如下的客户维度表。
Shopper_Key 代理键
Shopper_ID 自然键
Recency_Date 最近访问日期,Type 1
Frequency 访问次数,Type 1
Intensity 交易数量,Type 1
还有更多的是已注册客户特有的属性,如名字属性、地址属性、付款行为属性、信用属性等等。