机器学习(Machine Learning,简称 ML)和计算机视觉(Computer Vision,简称 CV)是非常令人着迷、非常酷炫、颇具挑战性同时也是涉及面很广的领域。本文整理了机器学习和计算机视觉的相关学习资源,目的是帮助许多和我一样希望深刻理解“智能”背后原理的人,用最为高效的方式学习最为前沿的技术和知识。
另外请见我后一篇博客里列的数据挖掘的学习资源。
wikipedia.org,历史,领域概述,资源链接:
Machine learning,介绍了ML所处理的问题、常用算法、应用、软件等,右侧列举了细分条目;
List of machine learning concepts,Category:Machine learning,列举出了更多ML相关概念和条目;
Computer vision,同样,介绍了CV所处理的问题、常用方法、应用等,底部列举了细分条目;
List of computer vision topics,Category:Computer vision,列举了更多CV相关条目。
大学课程、在线教程:
Stanford 关于ML和CV计算机课程(按推荐排序):cs229 Machine Learning,cs229T Statistical Learning Theory,cs231N Convolutional Neural Networks for Visual Recognition,cs231A Computer Vision:From 3D Recontruct to Recognition,cs231B The Cutting Edge of Computer Vision,cs221 Artificial Intelligence: Principles & Techniques,cs131 Computer Vision: Foundations and Applications,cs369L A Theoretical Perspective on Machine Learning,cs205A Mathematical Methods for Robotics, Vision & Graph,cs231M Mobile Computer Vision,这些课程大都可以下载PPT,更多课程请见Courses | Stanford Computer Science,Open class room的ML课程Machine Learning,Unsupervised Feature Learning and Deep Learning,Coursera的ML课程:Machine Learning,以及Stanford在线教程Deep learning tuorial;
更多大学课程可以用“machine learning course”或“computer vision course”为关键字搜索,这里是Google的国内镜像,这样就不需要FanQiang了。
ML:
机器学习,周志华,2016;
统计学习方法,李航,2012;
Deep Learning: Methods and Applications, Li Deng and Dong Yu, 2014;
Introduction to Machine Learning (3rd ed.), Ethem Alpaydin, 2014;
Machine Learning: An Algorithmic Perspective (2nd ed.), Stephen Marsland, 2015;
Deep Learning,一本在线书籍;
Neural Networks and Learning Machines (3rd ed.), Simon O. Haykin, 2008;有中文译本:神经网络与机器学习;
Pattern Recognition and Machine Learning, Christopher Bishop, 2006;有中文译本:模式识别与机器学习;
Machine Learning: a Probabilistic Perspective, Kevin P. Murphy, 2012;
CV:
Concise Computer Vision: An Introduction into Theory and Algorithms, Klette, Reinhard, 2014;
Computer Vision: Algorithms and Applications, Szeliski, Richard, 2011;有中文译本:计算机视觉——算法与应用;
Multiple View Geometry in Computer Vision (2nd ed.), Richard Hartley and Andrew Zisserman, 2004;
An Invitation to 3-D Vision: From Images to Geometric Models, Yi Ma, Stefano Soatto, Jana Kosecka, S. Shankar Sastry, 2004;
Robot vision, Berthold K. P. Horn, 1986;有中文译本:机器视觉;
Image Processing, Analysis, and Machine Vision (3rd ed.), Milan Sonka, Vaclav Hlavac, Roger Boyle, 2007;有中文译本:图像处理、分析与机器视觉;
推荐一个非常好的搜索英文电子书的网站:Library Genesis。
学术论文:
ML、CV领域的顶级期刊:TPAMI,IJCV,学术会议:ACL,CVPR,ICML,ICCV,NIPS,ECCV,ACCV等;
CVPapers 对CV领域学术论文做了很好的整理;
ImageNet 每年举办的图像识别比赛很能代表CV最高水平,MS COCO是类似比赛,KITTI上有很多数据以及CV算法的排名,这里是一个数据集的列表,这里是CV数据集;
arXiv.org,很多最新论文首先发表在这里;
当然还是推荐Google Scholar,这里是一个镜像网站。
学习网站:
deeplearning.net:一个非常好的机器学习网站,有dataset、software、reading list连接;
VisionBib.Com:学术大牛整理的CV资源;
CVonline有一个非常全面的资源链接;
新智元和机器之心是很好的机器学习资讯平台,另外推荐一些微信公众号:机器学习研究会,程序媛的日常。
程序、库:
OpenCV:一个C++视觉库,使用广泛;
Torch, Theano:两个很强大的支持CUDA显卡加速的Python机器学习库;
Caffe:很多研究者使用的Deep Learning库;
R语言:一个方便开发机器学习程序的环境;
更多的程序库,这里做了很好的总结。