在David M.Blei 的Distance Dependent Chinese Restaurant Processes 中提到:DDCRP 的一个重要性质,也是和dependent DP 的一个区别,就是"In general ,dependent DPs exhibit marginal invariance while distance dependent CRPs do NOT " 。文章中对Marginal invariance 的定义是: "The traditional CRP is marginally invariant : marginalizing over a particular customer gives the same probability distribution as if that customer were not included in the model at all."那么疑问是:marginalize 是一种什么样的操作?
Marginalization distribution 直译是"边缘分布"这里来看一下其具体的含义:
(以下内容来自course中的Probabilistic Graphical Models 1: Representation 斯坦福大学)
这里所说的marginalize I 就是对I 的所有取值进行积分或者求和。下面是两道例题用来区分reduction和marginalization:
那么将这种理解放到原文中解释就是,对于传统的中餐馆过程,我们通过积分将某一个顾客变量积掉和模型中原先就没有这个顾客变量的效果(也就是其余顾客变量的联合分布)是一样的。而在距离依赖中餐馆过程中,就不存在这种性质。