文|邓凯
数据分析重要性
越来越多的管理者意识到数据分析对经济发展、企业运营的重要意义。
在古代,得琅琊阁者得天下 现在,得大数据者得天下。
我总结的数据分析五步走:
1、锁定分析目标,梳理思路,叫纸上谈兵;
2、把杂乱的数据整理出图表报表,用数据探业务,叫自问数答;
3、锁定核心抓重点,设定最终算法,叫挟天子以令诸侯;
4、梳理重点发现,准备剧本开拍,接受PK,叫才辨无双;
5、效果梳理,总结经验,叫内视反听。
知道了数据的重要性,也了解了数据分析的步骤,那么如何更好的学习并运用呢
现在学习的途径很多,数据君整理几个大家不知道的网站,让你开开眼界:
都是国外的学习站点,所以有时候打不开,原因你懂的
一、如何用R的处理大数据
http://www.xmind.net/m/LKF2/
二、R语言的工具包
https://cran.r-project.org/web/views/
里面含机器学习,自然语言处理,时间序列分析,空间信息分析,多重变量分析,计量经济学,心理统计学,社会学统计,化学计量学,药物代谢动力等
三、帮你获得python大数据处理工具大全
http://www.xmind.net/m/WvfC
四、学习Python语言的,个人强烈推荐
https://learnpythonthehardway.org/book/
说实话Python最近今年太火了,静下心学这个语言没有错!
五、SAS图例集
http://robslink.com/SAS/Home.htm
用SAS也可以做出很漂亮的图形,这里就要提到一位大牛:Robert Allison。在他的网站上给出了非常全面的SAS图例和相应的实现代码
六、美国布朗大学概率和统计的可视化导论,一个非常棒的可视化概率及统计的学习网站
http://students.brown.edu/seeing-theory/?vt=4
七、教你玩动态的GIF图表
http://lenagroeger.com/
教你如何把手中的数据变成炫酷的GIF动图? 这个网站有各种类型的GIF图
八、如何选择机器学习算法
http://blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/
九、一套数据,25种可视化
http://flowingdata.com/2017/01/24/one-dataset-visualized-25-ways
仔细看了一下受益匪浅,同一组数据做出来的效果不同,看数的角度也不同
十、大数据数据处理资源
http://usefulstuff.io/big-data/
从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等
十一、里面蕴含编程语言、机器算法、大数据等,内容巨丰富
https://www.analyticsvidhya.com/blog/2017/02/top-28-cheat-sheets-for-machine-learning-data-science-probability-sql-big-data/
十二、推荐排名前50个开源的Web爬虫
十三、学习数据挖掘、机器学习的好网站,写的很全面很系统,适合各个级别的高手
https://www.autonlab.org/tutorials
via:datakong
End.