根据Andrew Ng在斯坦福的《机器学习》视频做笔记,已经通过李航《统计学习方法》获得的知识不赘述,仅列出提纲。
1 应用举例
照片OCR(Optical Character Recognition)
OCR流水线:
- 文本检测text detection
- 字符分离character segmentation
- 字符分类character recognition
滑动窗口分类器:
选取一个固定大小的矩形,然后根据步长移动该矩形,每次都用分类器进行判断。结束后,用更大尺寸的矩形继续重复上面步骤。
获取大量数据和人工数据
原因:低偏差,增加训练集数量
- 使用不同字体
- 人工拉伸/扭曲
- 语音识别:引入额外的语音失真(嘈杂的背景音)
上限分析
将前面所有模块正确的输出作为输入给下一个模块,得到该模块准确率上线。可以了解到每个模块的改善上限。