在杂七杂八的事中坚持处理表格的OCR,历经一周时间,终有阶段结果。
主要工作:
自动分区、文字识别。
象这样一个表格:
自动分区后,得到正确分区效果:
其中,各分区模块颜色配置:
文字识别结果:
识别正确率在70%-80%。可以手动校对:
剩下的工作是自动生成WORD与PDF。这两项工作完成后,可以定一版了。
6.10前预交付市场。
在杂七杂八的事中坚持处理表格的OCR,历经一周时间,终有阶段结果。
主要工作:
自动分区、文字识别。
象这样一个表格:
自动分区后,得到正确分区效果:
其中,各分区模块颜色配置:
文字识别结果:
识别正确率在70%-80%。可以手动校对:
剩下的工作是自动生成WORD与PDF。这两项工作完成后,可以定一版了。
6.10前预交付市场。