机器学习概念:
机器学习是一门从数据中研究算法的科学学科。机器学习直白来讲,是根据已有的数据,进行算法选择,并基于算法和数据构建模型,最终对未来进行预测。来看看大佬对机器学习的定义吧,美国卡内基梅隆大学(Carnegie Mellon University)机器学习研究领域的著名教授TomMitchell对机器学习的经典定义如下:
对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供大量、合适、优质的经验E,该程序对于任务T的性能会逐步提高。
其中重要的机器学习对象:
- 任务Task T,一个或多个
- 经验Experience E
- 度量性能Performance P。
我们期望随着任务的不断执行,经验的累积会带来计算机性能的提升。
机器学习的应用场景:
- 个性化推荐:(电商商品推荐,好友推荐等)个性化指的是根据各种因素来改变用户体验和呈现给用户内容,这些因素可能包含用户的行为数据和外部因素;推荐常指系统向用户呈现一个用户可能感兴趣的物品列表。
- 精准营销:(DMP,基于用户的历史行为,给用户推荐各种产品)从用户群众中找出特定的要求的营销对象。
- 客户细分:试图将用户群体分为不同的组,根据给定的用户特征进行客户分组。比如说,用户分为VIP、高级VIP等,划分粒度和具体场景有关
- 预测建模及分析:根据已有的数据进行建模,并使用得到的模型预测未来。
机器学习主要领域:
- 计算机视觉(视频,图像处理)
- 语音识别(声音处理)
- 自然语言处理(文本处理)
人工智能、机器学习、深度学习之间的关系?
- 机器学习是人工智能的一个子类;
- 深度学习是机器学习的子类;
- 深度学习是基于传统的神经网络算法发展到多隐层的一种算法体现。
机器学习、数据分析、数据挖掘区别与联系?
- 数据分析:数据分析是指用适当的统计分析方法对收集的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程。在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分为统计分析、探索性数据分析和验证性数据分析三大类。
- 数据挖掘:一般指从大量的数据中通过算法搜索隐藏于其中的信息的过程。通常通过统计、检索、机器学习、模式匹配等诸多方法来实现这个过程。
- 机器学习:是数据分析和数据挖掘的一种比较常用、比较好的手段。
机器学习常用框架:
- Python:sciket-learn() http://scikit-learn.org/stable/
- Spark(java、scala、Python、R):http://spark.apache.org/
- TensorFlow
- Mahout:http://mahout.apache.org/