1.机器学习
机器学习是人工智能核心研究领域之一,其研究动机是为了让计算机系统具有人的学习能力,以便实现人工智能。目前最广泛采用的机器学习定义是“利用经验来改善计算机系统自身的性能”。由于经验在计算机系统中主要以数据的形式存在。因此机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析的创新源之一,并且为此受到越来越多人的关注。
机器学习概念1:机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,并重新组织已有的知识结构使之不断改善自身。
机器学习概念2:AI系统自己获取知识的能力,即从原始数据中提取模式的能力,这种能力称为机器学习。具体讲就是计算机从数据中学习规律和模式,以应用在新的数据上做预测的任务。
机器学习概念3:机器学习是人工智能的一个分支,我们使用计算机设计一个系统,使它能够根据训练数据按照一定的方式来学习;随着训练次数的增加,该系统在性能上不断学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出。
机器学习概念4:对于某类给定的任务T和在合理的性能度量P的前提下,某计算机程序可以自主学习任务T的经验E,随着提供大量、优质、合适的经验E,使得该程序完成任务T的性能度量P逐步提升。这里面经验E的本质是数据。
首先让我们一起来翻阅一下迄今两本最具代表性的机器学习教材,一本是“米歇尔”老师1997年版《机器学习》,一本是周志华老师2016版《机器学习》教材,这两本书至今深受包括我在内的广大学习者推崇。
2.数据挖掘
所谓数据挖掘就是识别出巨量数据中有效的、 新颖的、潜在有用的、最终可理解的模式的非平凡 过程”。顾名思义,数据挖掘就是试图从海量数据中找出有用的知识。数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。数据挖掘主要理解各种不同的数据挖掘任务。比如:分类、回归、聚类、关联分 析、异常分析、演变分析等等。
首先让我推荐一下迄今两本最具代表性的数据挖掘教材,一本是数据挖掘概念与技术(第3版) , Jiawei Han等著, 范明等译, 2012。另一本是数据挖掘导论, Pang-Ning Tan等著, 范明等译, 2006年。
2.人工智能
人工智能=人工+智能
智能=智力+知识
智力=感知能力+记忆能力+思维能力+学习能力+行为能力
感知能力=视觉+听觉+触觉+嗅觉+味觉
记忆能力
思维能力=逻辑思维+形象思维+灵感思维
学习能力=有监督学习+强化训练+无监督学习
行为能力
3.机器学习的分类
(1)监督学习:
分类预测
回归分析
(2)无监督学习:
聚类
关联规则
(3)强化学习:
Q-leaning
时间差学习
4.目标函数
5.损失函数
6.梯度下降
7.欠拟合/过拟合
8.正则化
9.训练集、测试集和验证集
未完待续!