数据挖掘 应用案例集
数据挖掘应用目前在国内的基本结论是“大企业成功案例少,中小企业需求小”。但是对于市场来说,如果不是真的“没有人买”所以“没有人卖”,那一定是创新的机会所在。个人的判断是,一个数据库只要有几十万以上记录,就有数据挖掘的价值。
搜集以下案例,希望有一定的启发和学习价值。
1. 哪些商品放在一起比较好卖?
这是沃尔玛的经典案例:一般看来,啤酒和尿布是顾客群完全不同的商品。但是沃尔玛一年内数据挖掘的结果显示,在居民区中尿布卖得好的店面啤酒也卖得很好。原因其实很简单,一般太太让先生下楼买尿布的时候,先生们一般都会犒劳自己两听啤酒。因此啤酒和尿布一起购买的机会是最多的。这是一个现代商场智能化信息分析系统发现的秘密。这个故事被公认是商业领域数据挖掘的诞生。
另外,大家都知道在沃尔玛牙膏的旁边通常配备牙刷,在货价上这样放置,牙膏和牙刷才能都卖的很好。
2. 库存预测
过去零售商依靠供应链软件、内部分析软件甚至直觉来预测库存需求。随着竞争压力的一天天增大,很多零售商(从主要财务主管到库存管理员)都开始致力于找到一些更准确的方法来预测其连锁商店应保有的库存。预测分析是一种解决方案。它能够准确预测哪些商店位置应该保持哪些产品。
使用 Microsoft(R) SQL Server(TM) 2005 中的 Analysis Services 以及 SQL Server 数据仓库,采用数据挖掘技术可以为产品存储决策提供准确及时的信息。SQL Server 2005 Analysis Services 获得的数据挖掘模型可以预测在未来一周内一本书是否将脱销,准确性为 98.52%。平均来说,预测该书是否将在未来两周内脱销的准确性为 86.45%。详情见https://www.microsoft.com/china/technet/prodtechnol/sql/2005/ipmvssas.mspx
3. 股票预设
预测一支股票的走势几乎是不可能,但是通过相关分析,可以找出一支股票的走势与另一只股票走势的潜在规律,比如数据挖掘曾经得到过这个结论:“如果微软的股票下跌4%,那么IBM的股票将在两周内下跌5%”。
4. NBA教练如何布阵以提升获胜机会?
美国著名的国家篮球队NBA的教练,利用IBM公司提供的数据挖掘工具临场决定替换队员。想象你是NBA的教练,你靠什么带领你的球队取得胜利呢?当然,最容易想到的是全场紧逼、交叉扯动和快速抢断等具体的战术和技术。但是今天,NBA的教练又有了他们的新式武器:数据挖掘。大约20个NBA球队使用了IBM公司开发的数据挖掘应用软件Advanced Scout系统来优化他们的战术组合。例如Scout就因为研究了魔术队队员不同的布阵安排,在与迈阿密热队的比赛中找到了获胜的机会。
系统分析显示魔术队先发阵容中的两个后卫安佛尼.哈德卫(Anfernee Hardaway)和伯兰.绍(Brian Shaw)在前两场中被评为-17分,这意味着他俩在场上,本队输掉的分数比得到的分数多17分。然而,当哈德卫与替补后卫达利尔.阿姆斯创(Darrell Armstrong)组合时,魔术队得分为正14分。
在下一场中,魔术队增加了阿姆斯创的上场时间。此着果然见效:阿姆斯创得了21分,哈德卫得了42分,魔术队以88比79获胜。魔术队在第四场让阿姆斯创进入先发阵容,再一次打败了热队。在第五场比赛中,这个靠数据挖掘支持的阵容没能拖住热队,但Advanced Scout毕竟帮助了魔术队赢得了打满5场,直到最后才决出胜负的机会。
Advanced Scout是一个数据分析工具,教练可以用便携式电脑在家里或在路上挖掘存储在NBA中心的服务器上的数据。每一场比赛的事件都被统计分类,按得分、助攻、失误等等。时间标记让教练非常容易地通过搜索NBA比赛的录像来理解统计发现的含义。例如:教练通过Advanced Scout发现本队的球员在与对方一个球星对抗时有犯规纪录,他可以在对方球星与这个队员“头碰头”的瞬间分解双方接触的动作,进而设计合理的防守策略。
Advanced Scout的开发人,因德帕尔.布罕德瑞,开发该应用时他正在IBM的ThomasJ.Watson研究中心当研究员,他演示了一个技术新手应该如何使用数据挖掘。布罕德瑞说:“教练们可以完全没有统计学的培训,但他们可以利用数据挖掘制定策略”。与此同时,另一个正式的体育联盟,国家曲棍球联盟,正在开发自己的数据挖掘应用NHL-ICE,联盟与IBM建立了一个技术型的合资公司,去年11月推出一个电子实时的比赛计分和统计系统。在原理上是一个与Advanced Scout相似的数据挖掘应用,可以让教练、广播员、新闻记者及球迷挖掘NHL的统计。当他们访问NHL的Web站点时,球迷能够使用该系统循环看联盟的比赛,同时广播员和新闻记者可以挖掘统计数据,找花边新闻为他们的实况评述添油加醋。
5. 出了一个新成品,哪些老客户最可能购买?
蒙特利尔银行是加拿大历史最为悠久的银行,也是加拿大的第三大银行。在 20 世纪 90 年代中期,行业竞争的加剧导致该银行需要通过交叉销售来锁定 1800 万客户。银行智能化商业高级经理 Jan Mrazek 说,这反映了银行的一个新焦点--客户(而不是商品)。银行应该认识到客户需要什么产品以及如何推销这些产品,而不是等待人们来排队购买。然后,银行需要开发相应商品并进行营销活动, 从而满足这些需求。
在应用数据挖掘之前,银行的销售代表必须于晚上 6 点至 9 点在特定地区通过电话向客户推销产品。但是,正如每个处于接受端的人所了解的那样,大多数人在工作结束后对于兜售并不感兴趣。因此,在晚餐时间进行电话推销的反馈率非常低。
几年前,该银行开始采用 IBM DB2 Intelligent Miner Scoring,基于银行账户余额、客户已拥有的银行产品以及所处地点和信贷风险等标准来评价记录档案。这些评价可用于确定客户购买某一具体产品的可能性。该系统能够通过浏览器窗口进行观察,使得管理人员不必分析基础数据,因此非常适合于非统计人员。
"我们对客户的财务行为习惯及其对银行收益率的影响有了更深入的了解。现在,当进行更具针对性的营销活动时,银行能够区别对待不同的客户群,以提升产品和服务质量,同时还能制订适当的价格和设计各种奖励方案,甚至确定利息费用。"
蒙特利尔银行的数据挖掘工具为管理人员提供了大量信息,从而帮助他们对于从营销到产品设计的任何事情进行决策。
6. 电子商务网站公共页面该放哪些内容最可能产生购买行为?
圣地亚哥的 Proflowers.com 通过采用 HitBox,即 WebSideStory 的数据挖掘 ASP 服务,使企业的计划者在业务高峰日也能够对销售情况做出迅速反应。由于鲜花极易枯萎,Proflowers 不得不均匀地削减库存,否则可能导致一种商品过快地售罄或库存鲜花的凋谢。
由于日交易量较高,管理人员需要对零售情况进行分析,比如转换率,也就是多少页面浏览量将导致销售产生。举例来说,如果 100 人中仅有 5 人看到玫瑰时就会购买,而盆景的转换率则为 100 比 20,那么不是页面设计有问题,就是玫瑰的价格有问题。公司能够迅速对网站进行调整,比如在每个页面上都展示玫瑰或降低玫瑰的价格。对于可能过快售罄的商品,公司通常不得不在网页中弱化该商 品或取消优惠价格,从而设法减缓该商品的销售。
采用 HitBox 的优势在于借助便于阅读的显示器来展现销售数据和转换率。Proflowers 营销副总裁 Chris d'Eon 说:"自己分析数据是浪费时间。我们需要一种浏览数据的方式,能够让我们即刻采取行动。"
7. 登录网站的当前用户现在最可能购买什么东西?
丹佛的 eBags 旨在针对常旅客销售手提箱、手提袋、钱包以及提供其它旅行服务。该公司采用 Kana 软件公司的 E-Marketing Suite 来整合其网站的 Oracle 数据库、J.D. Edwards 财务系统、客户服务电子邮件和呼叫中心,从而获得客户购买行为习惯方面的信息。数据分析能够帮助公司确定是哪个页面导致了客户的高采购率,并了解是什么内容推动了销售。
eBags 技术副总裁 Mike Frazini 说:"我们尝试展示不同的内容,来观察哪些内容的促销效果最好。我们最终的目标是完全个性化。"与设计页面以鼓励大部分消费者采购的做法不同,一个个性化的解决方案将不停地创建页面以适合每个具体的访问者。因此 ,如果访问者的浏览记录显示其对手提包感兴趣,网站将创建突出这些商品的客户化页面。Frazini 指出,用于当前实施数据挖掘的分析方法也能用于部署自动化的网站定制规则。
寻找基于较少的数据和商业规则来创建个性化网页是客户化网站减少资源耗费的方法之一。开利(Carrier)公司--位于美国康涅狄格州 Farmington 的一家空调制造厂商--声称,仅仅通过利用邮政编码数据,其升级版 B2C 网站的每位访问者所产生的平均收益在一个月内从 1.47 美元提高到了 37.42 美元。
当客户登录网站时,系统将指示他们提供邮政编码。这些邮政编码信息将被发送到 WebMiner 服务器,也就是一个数据挖掘ASP。然后,WebMiner 的数据挖掘软件将对客户进行假设,并基于这些假设来展示商品。例如,如果客户来自富裕的郊外地区,网站将显 示出带有遥控器的空调机;如果客户的邮政编码显示邻近大量公寓楼,则弹出式广告将展示窗式空调机。
通过采用这种相对简易的方法,该公司能够在数秒内生成网页。Carrier 全球电子商务经理 Paul Berman 说:"与通常的想法相反,客户化电子商务在创建有针对性的服务时并不需要询问客户8条或9条信息。我们只需要 1 条信息,而且实际证明效果确实不错。"
和 Carrier 一样,"音乐家之友"(Musician's Friend)也正在减少用于确定客户化内容的商业规则。它是 Guitar Center 有限公司的目录和 Web 分支机构。