一切规律都存储在关系中,就看你能不能找得到他了,这也是数据挖掘的魅力。错综复杂的数据之中,能不能找到一个稳定存在的缝隙,让你切入,找到那个隐藏在背后的规律,这个规律在应用中能展示自己的价值与威力。
如果有两类对象A和B,关系是$Rsubset A imes B$。
如果A和B都是数量,且关系比较接近线性,可以考虑相关系数。
如果A和B都是数量,但关系非线性很强,甚至不单调,可以考虑离散相关系数。
如果A和B其中一个是数量,一个是离散量,那么可以考虑条件分布/统计值。
如果A和B都是离散量,可以考虑A和B构成一个二部图,在图上找规律。还可以将A看作节点,B看作超图的边。超图:http://en.wikipedia.org/wiki/Hypergraph