前言:
2014年6月,微软发布了Microsoft Azure Machine Learning 服务要上线的消息,详情参见以下链接报道:
TechTarget云计算:微软新Azure服务能否创造新的未来?http://www.searchcloudcomputing.com.cn/showcontent_83226.htm
Techcrunch中国:微软发布云计算机器学习平台Azure ML http://techcrunch.cn/2014/06/17/microsoft-announces-azure-ml-cloud-based-machine-learning-platform-that-can-predict-future-events/
微软中国官方博客:微软提供更多技术创新和产品扩展,以满足云时代需求 http://blog.sina.com.cn/s/blog_6b8988220102uwzp.html
本月,发布了Azure ML公开预览版,Jiahua Jin先行进行了试用:http://www.cnblogs.com/jiahuaking/p/3845399.html
本文将从官方创建实验示例说明入手,详细介绍Azure Machine Learning Preview中的使用方法。
一、简介
Azure机器学习,是一项提供给微软合作伙伴完成在短时间内为客户构建先进的分析云服务,大大减轻在数据推动的现代应用中部署机器学习的繁重负担。MAX451、OSIsoft、Neal Analytics和Versium等已经使用这种服务为包括Pier 1 Imports、卡耐基梅隆大学、树屋和百万富翁慈善俱乐部等客户提供解决方案。
此外,Azure ML支持开源项目Project R的300多个包,而这一开源项目目前被许多数据科学家使用。
二、实验过程
看完了一系列介绍后,还是点击Portal进入Azure门户开始创建Machine Learning服务:
然后进入创建的服务,点击图中的链接进入ML studio:
粗略看过这些介绍后,直接点击Experiment依照示例开始实验
改过名称后,开始五步骤实验的第一步【获取数据】:直接在搜索框中搜索了"automobile",然后把它拖进了操作容器里,如下图:
在点击上图Visualize选项后能够查看详细的数据,这个后续会展示,然后继续【第二步:数据预处理】:找到 Convert To Dataset,然后拖进去,鼠标点击上边的点,从下往上连到Automobile price data见图:
接着拖进Project Columns:
然后点launch column selector修改选择需要的数据,见下图:
然后拖进 Missing Values Scrubber ,完成下图设置:
点击最下面的run:
执行完毕后,点最下的点,然后Visualize,看到下图的数据了:
接着,拖进Project Columns,进行设置:
选择列:
然后拖进 Metadata Editor, 选择"price" column,如下图:
继续拖进一个Metadata Editor,如下图设置:
完成后,执行,Visualize,看到下图:
接着,拖进分拆器和机器学习算法中的决策树:
完成连线,和column的选择:
然后Visualize看输出数据:
修改决策树属性:
run以后Visualize:
然后拖进Training Model:
接着Score Model:
run以后:
最后,Evaluate Model:
run:
出现了Error :(
查看下用户的回复,都有问题。。。
三、总结
Azure Machine Learning preview从使用上来看还是比较方便的,5个环节下来也没有花费多长的执行时间,本次没有体验开源库R的实验,对R不熟悉。。。
倚靠Microsoft Azure技术,确实减轻了硬件计算负担,也方便了对大数据进行处理,所提供的官方说明文档也很丰富,但是Web Service还是没有发布。。。期待正式版吧。
最后,介绍下关于Azure Machine Learning的视频说明资料吧,依旧Channel 9:
http://channel9.msdn.com/Search?term=Azure%20ML#ch9Search&pageSize=15