学习路线图
本书由两部分组成。第一部分(机器学习基础)由下列主题组成:
- 什么是机器学习?他想要解决什么问题?机器学习系统中,主要的分类和基础概念有哪些?
- 典型的机器学习项目由哪些部分组成。
- 拟合数据进行学习
- 优化成本函数。
- 处理、清洗、准备数据。
- 特征选择及特征工程。
- 选择模型并使用交叉验证来调整超参数。
- 机器学习的主要挑战,拟合不足和过度拟合(偏差和方差的权衡,也就是Varience和Bias的权衡)。
- 降低训练数据的维度以对抗维度灾难。
- 最常见的机器学习算法:线性回归和多项式回归、逻辑回归、K-近邻、支持向量机、决策树、随机森林和集成算法。
第二部分(神经网络和深度学习)由下列主题组成:
- 神经网络是什么?他们擅长处理那些问题?
- 使用TF构建和训练神经网络
- 最重要的神经网络架构:前馈神经网络、卷积网络、递归网络、长期短期记忆(LSTM)神经网络和自动编码器。
- 训练深度神经网络的技术。
- 强化学习。
第一部分主要都基于Scikit-Learn,而第二部分则基于TF。
- 不要太着急进入深水区,深度学习无疑是机器学习中最令人兴奋的领域之一,但是我们必须先理解基础知识。大多数问题仍然可以用更简单的技术很好的解决。如果你拥有足够的数据、计算能力和耐心,深度学习非常适合复杂的问题,如:图像处理、语音识别、自然语言处理。