IntroductionToDataMining章1绪论_by二卷

keywords: 数据挖掘

author: 二卷（2017.03.07）

这章没啥，就是二卷对着书边看边自言自语了一通。
在绪论的开篇，书里提到，数据挖掘也会用于分子生物学，二卷其实就是药学院的，虽然不是研究基因，但是还是好感动啊，我对医药有特殊的感情。

## **

1.什么是数据挖掘

** 书上说的很多，二卷认为数据挖掘是从一堆数据中挖掘出有用的模式，这些数据通常存放在数据库中。在数据挖掘之前会做一些预处理，比如清洗数据、整理数据的存储格式；在这些数据被挖掘后，再进行后处理，得到一些直观有用的信息。
## **

2.数据挖掘要解决的问题

** 就二卷现在研究僧所研究的专业方向来看，数据挖掘并不是万能的，还有很多问题它并不能很好的解决，尤其是生物体内一些微观世界的复杂问题。所以说，数据挖掘还需要解决自身的很多问题，书上有说，但是不是二卷学习的重点，跳过。
## **

3.数据挖掘的起源

** 起源嘛，肯定是现有的技术不足以解决现在的问题，所以需要发展新的技术方法。数据挖掘的学习需要统计学的背景，同时也需要建模方面的知识，还需要IT技术方面的支持。
## **

4.数据挖掘任务

** 可以分为俩大类：**预测任务** 、**描述任务**
本书主要讲四种数据挖掘的任务： ### **1）预测建模** 主要有分类（用于离散的数据）和回归（用于连续的数据） ### **2）关联分析** ### **3）聚类分析** ### **4）异常检测**
(从字面含义就可以大概知道这四种任务是做什么的，但是我认为为了完成一个好的数据挖掘，可能需要交叉使用这四种方法。还有就是数据挖掘有时候得到的模型并不一定是完全准确的，但是已经尽可能的贴近现实情况)

-------------------------------------------我是求打赏的分割线-------------------------------------------

觉得二卷写的有帮助的话，就打个赏鼓励一下下呗~么么哒

支付宝微信

大海中的一颗星辰，天空中的一枚卷花

作者：二卷

出处：http://www.cnblogs.com/erjuan/

本文版权归二卷和博客园共有，欢迎转载，但未经二卷同意必须保留此段声明哦，且在文章页面位置给出二卷的原文连接

有错误的话也可以联系二卷指正哦（鞠躬）

相关阅读:
ABAP 动态内表构建 Dynamic internal table
RFC权限分配
ERP从业来的总结
WORD中插入VISIO图形,打印乱码解决
SAP中程序间的相互调用，SUBMIT关键字的用法
SDva01的屏幕增强
STL中的binder
C++中的new
C++数组中多态问题分析
Gdiplus中实现双Buffer绘图

原文地址：https://www.cnblogs.com/erjuan/p/6516429.html