什么是长尾long tail?
长尾效应,英文名称Long Tail Effect。“头”(head)和“尾”(tail)是两个统计学名词。正态曲线中间的突起部分叫“头”;两边相对平缓的部分叫“尾”。从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的数量上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。 --------百度百科
机器学习与长尾效应
尽管大数据时代或许我们拥有很大的数据集,由于长尾效应,对于某些特定的感兴趣的情况的有效数据点可能相当小。
长尾效应在许多领域存在。这意味着一些事情非常常见,但是大多数事情非常罕见。
这意味着,一些核心统计问题,即从相对较小的样本量中归纳出来的问题,即使在大数据时代,也是非常相关的。