前言
以下内容是个人学习之后的感悟,转载请注明出处~
简介
目前,机器学习已经应用在很多领域,比如现在比较火的微软的kinect,google的自动驾驶汽车等。那么
在机器学习的应用开发时,需要注意些什么呢?
流水线式开发
比如Photo OCR技术,如下图所示,分为好几个模块,模块的输入是上一个模块的输出。这样可以便于分工,
更便于找出需要投入较多时间的模块,合理分配资源等。
人工数据合成
流水线式分工,意味着多了很多中间环节,而中间模块的输入是前面模块的输出。那么各个模块在并行开发的时
候,我们需要的输入数据该从哪来呢?对,人工数据合成。
我们可以给正确的数据加入各种各样的噪音,这样就可以得到更加全面的数据。本文以图片为例,如下图所示:
此外,我们还可以从网上下载别人已经设置好的数据包。
上限分析
通过上限分析,我们可以知道,如果对每一个模块进行改善,它们各自的上升空间是多大。这里以人脸识别为例,
如下图所示,脸部识别、眼睛识别和最后的逻辑回归給系统性能带来了很大的提升,此时我们可以考虑在这几个部分,
多花时间精力去改善。
以上是全部内容,如果有什么地方不对,请在下面留言,谢谢~