• 数据挖掘特征关于数据挖掘的几个概念


    时间紧张,先记一笔,后续优化与完善。

        整顿的数据挖掘基本概念一书中的第一章的知识点

        数据挖掘:从数据中提取有效模型的过程。其中,提出的模型可所以数据的汇总结果,不过一般情况下是数据中极端的特征所组成的集合。

        邦弗朗尼道理:数据挖掘中考核数据的一个误区,指某个明显的特征如果是很有可能在随机数据中涌现的话,那么根据这个明显的特征所取得的数据就具有不可依赖性。

        TF.IDF:计算词频和词语重要度的一个计量指标

        幂定律:类似于马太效应,可以表现为y=cxa,a为x的指数,此处a就是幂。这个定律在很多地方使用

        每日一道理
    古人云:“海纳百川,有容乃大。”人世间,不可能没有矛盾和争吵,我们要以磊落的胸怀和宽容的微笑去面对它 。哈伯德也曾说过:“宽恕和受宽恕的难以言喻的快乐,是连神明都会为之羡慕的极大乐事。”让我们从宽容中享受快乐,从谅解中体会幸福吧!

        比如pageRank,商品销量,包括TF.IDF词频统计中。

        哈希,索引,这些也很重要,就不分析了~~

        ps:现阶段的数据挖掘中,机器学习和人工分析对于实际效果而言,并无明显优势

    文章结束给大家分享下程序员的一些笑话语录: 姿势要丰富,经常上百度!

    --------------------------------- 原创文章 By 数据挖掘和特征 ---------------------------------

  • 相关阅读:
    extgcd 扩展欧几里得算法模板
    51nod 1073约瑟夫环
    UVA 11806 Cheerleaders (容斥原理
    HDU 1863 畅通工程 (最小生成树
    并查集模板
    51NOD 1072 威佐夫游戏
    Java基于JAX-RD开发Restful接口
    tomcat的webapps下放置多个项目时会出现很多exception
    带滚动条的表格
    禁止apache显示目录索引的常见方法
  • 原文地址:https://www.cnblogs.com/xinyuyuanm/p/3095528.html
Copyright © 2020-2023  润新知