• IntroductionToDataMining章1绪论_by二卷


    keywords: 数据挖掘

    author: 二卷(2017.03.07)


    这章没啥,就是二卷对着书边看边自言自语了一通。
    在绪论的开篇,书里提到,数据挖掘也会用于分子生物学,二卷其实就是药学院的,虽然不是研究基因,但是还是好感动啊,我对医药有特殊的感情。


    ## **
    1.什么是数据挖掘
    ** 书上说的很多,二卷认为数据挖掘是从一堆数据中挖掘出有用的模式,这些数据通常存放在数据库中。在数据挖掘之前会做一些预处理,比如清洗数据、整理数据的存储格式;在这些数据被挖掘后,再进行后处理,得到一些直观有用的信息。
    ## **
    2.数据挖掘要解决的问题
    ** 就二卷现在研究僧所研究的专业方向来看,数据挖掘并不是万能的,还有很多问题它并不能很好的解决,尤其是生物体内一些微观世界的复杂问题。所以说,数据挖掘还需要解决自身的很多问题,书上有说,但是不是二卷学习的重点,跳过。
    ## **
    3.数据挖掘的起源
    ** 起源嘛,肯定是现有的技术不足以解决现在的问题,所以需要发展新的技术方法。数据挖掘的学习需要统计学的背景,同时也需要建模方面的知识,还需要IT技术方面的支持。
    ## **
    4.数据挖掘任务
    ** 可以分为俩大类:**预测任务** 、**描述任务**
    本书主要讲四种数据挖掘的任务: ### **1)预测建模** 主要有分类(用于离散的数据)和回归(用于连续的数据) ### **2)关联分析** ### **3)聚类分析** ### **4)异常检测**
    (从字面含义就可以大概知道这四种任务是做什么的,但是我认为为了完成一个好的数据挖掘,可能需要交叉使用这四种方法。还有就是数据挖掘有时候得到的模型并不一定是完全准确的,但是已经尽可能的贴近现实情况)




    -------------------------------------------我是求打赏的分割线-------------------------------------------

    大海中的一颗星辰,天空中的一枚卷花

    作者:二卷

    出处:http://www.cnblogs.com/erjuan/

    本文版权归二卷和博客园共有,欢迎转载,但未经二卷同意必须保留此段声明哦,且在文章页面位置给出二卷的原文连接

    有错误的话也可以联系二卷指正哦(鞠躬)

  • 相关阅读:
    ABAP 动态内表构建 Dynamic internal table
    RFC权限分配
    ERP从业来的总结
    WORD中插入VISIO图形,打印乱码解决
    SAP中程序间的相互调用,SUBMIT关键字的用法
    SDva01的屏幕增强
    STL中的binder
    C++中的new
    C++数组中多态问题分析
    Gdiplus中实现双Buffer绘图
  • 原文地址:https://www.cnblogs.com/erjuan/p/6516429.html
Copyright © 2020-2023  润新知