深入了解机器学习
https://www.jianshu.com/p/2fafcdebf915
摘要: 了解机器学习发展史、机器学习是什么?机器学习有什么?看看本文就够了。
如今机器学习已经成为了这个时代的热门话题。机器学习已经存在了几十年,但直到最近我们才得以利用这项技术。
接下来,让我们一起回顾一下机器学习的发展历史:
它是怎么运行的呢?
机器学习(ML)的处理系统和算法主要通过在数据和通过找出数据里隐藏的模式进而做出预测的识别模式。这里值得一提的是,机器学习属于人工智能(AI)领域,而人工智能又与更广泛的数据挖掘和知识发现领域相交叉。
机器学习(ML)其他用法的例子:
机器学习还可以用于下列内容:
·医疗保健:识别高危客户;优化诊断准确性;改进健康计划成本。
·社会:预测广告活动效果;预测消费者情绪或其反馈。
·航空:预测火箭发动机爆炸;预测试点能力;预测航线。
还有其他一些行业也希望通过利用这种技术来获得商业价值。事实上,根据普华永道2017年全球数字智商调查,54%的机构正在大量投资人工智能和机器学习。
它是如何完成的呢?
机器学习任务分为三类。
1. 监督ML:
大多数情况下,机器学习依赖于被标记为真或假的数据。
示例:教计算机学会根据人类完成的交易标签来识别潜在的欺诈性或非欺诈性交易,以确保获得高质量的数据。了解到欺诈性交易与非欺诈性交易之间的差异后,ML会自动对新交易数据进行分类以获得潜在的欺诈性活动。
2. 未受监督的ML:
与监督学习依赖于标签有所不同,该种类型的算法需要对象的各个方面提供大量的数据。
示例:在欺诈发生的情况下,提供欺诈者的各种属性以及一些交易价值,根据交易的固有特征和描述特征,无监督ML可以将交易分为两个不同的组。
3. 强化学习的ML:
示例:学习玩流行的棋盘游戏奥赛罗,ML会收到关于玩家是赢还是输的信息。该程序没有将数据库中的所有的动作都标记为赢了或输了,但却能知道整个游戏的最终结果。然后,ML可以进行多种游戏,每次都重视那些导致获胜组合的动作。
一些流行的方法:
ML中采用了多种学习方法,下面将为大家介绍一些最为常见的方法。
决策树学习:
一个预测模型,通过映射关于项目的观察结果,得出结论;使用决策节点的层次结构,当逐步回答时,可以将交易分类为欺诈或非欺诈。
回归学习:
回归学习是最重要和广泛使用的机器学习和统计工具之一。它能够通过学习依赖变量和预测变量之间的关系做出数据预测。
朴素贝叶斯学习:
这是一个概率图形模型,表示一组随机变量及其条件独立性;例如,欺诈者与交易金额,年龄,行为等之间的概率关系。
神经网络学习:
神经网络学习由多个隐藏层组成,模仿人脑的行为。深度学习包括多个一个接一个的神经网络。
使用机器学习打击金融诈骗:
由于金融诈骗给企业带了很大的信誉损失和财务破坏,引起了全球很多方面的关注。每年都有数百万的家庭遭受金融诈骗,经济损失达数亿美元。
曾经,有一家金融界被称为佼佼者的机构同意支付165亿美元来解决金融诈骗案。考虑到所有这些情况,将数据挖掘工具和技术用于检测可能的欺诈活动或事件变得很重要。
在研究可帮助我们识别欺诈活动的数据挖掘技术之前,首先根据2016年普华永道经济犯罪调查来查看欺诈行为。
排名前三的风险预测算法和案例:
三大风险预测算法和案例如下:
·分类方法:用于生成可能的值(即true,false,yes,no,o,1等)。这种机器学习技术可以根据各种预测变量来分类特定债务会变成“好”还是“坏”。
·神经网络:在包含神经元和具有输入、输出和隐藏层节点的大型数据集上显示更好的结果。这种方法通常用于使用各种人口学,年龄和其他变量作为输入来执行信用评级预测。
·随机决策森林:分类的集合学习方法。他们在培训和输出种类时(即分类模式)构建了许多决策树。这被广泛用于执行信用风险预测。
Beneish M-Score是另一个在财务报表欺诈领域受欢迎的新兴数学模型。该模型使用财务比率和八个变量来确定一个组织是否操纵了其收入。这些变量是根据公司财务报表中的数据构建的,一旦计算出来,就会创建一个M-Score来描述盈余被操纵的程度。请注意,作为概率模型,它不会识别100%准确度的操纵器。
结论:
机器学习的好处主要是:
·通过快速集成进行数据驱动的决策:机器学习利用各种数据,帮助企业根据最新的数据模式不断升级其策略。
·加速洞察力:机器学习能够加快识别相关数据的速度使得利益相关者能够及时行动。例如,机器学习可以不断优化客户的下一个最佳报价,因此客户在中午可能看到的内容可能与同一个客户在晚上看到的内容不同。
·风险规避:机器学习给企业提供了防止诈骗者陷入困境并减轻潜在货币和监管复杂化的能力。
本文由阿里云云栖社区组织翻译。
文章原标题《Deep Dive Into Machine Learning》
作者:Sunil Kappal
译者:乌拉乌拉,审校:袁虎。