分类
工具使用
大规模数据处理
- 使用 MapReduce 实现大规模稀疏矩阵相乘
- Spark学习路径:基本介绍
- Spark学习路径:RDD vs DataFrame vs DataSet
- Spark学习路径:性能调试
- Spark学习路径:使用Spark Accumulators的注意事项
机器学习
- 理解 ROC 和 AUC
- 理解 FTRL 算法
- 从 Odds 角度理解 Logistic Regression 模型的参数
- 面向稀有事件的 Logistic Regression 模型校准
- 使用 Isotonic Regression 校准分类器
- EM算法原理及其应用
- 机器学习领域的tutorials (Since 2016)
- 理解 product quantization 算法
年度总结
阅读笔记
- 201601 阅读笔记
- 201602 阅读笔记
- 201603 阅读笔记
- 201604 阅读笔记
- 201605 阅读笔记
- 201612 阅读笔记
- 201701 阅读笔记
- 201702 阅读笔记
- 201703 阅读笔记
- 201704 阅读笔记
- 201705 阅读笔记
- 201706 阅读笔记
- 201707 阅读笔记
- 201708 阅读笔记