推荐阅读EAST论文,二篇论文比较相似
论文地址:https://arxiv.org/abs/1811.12786
概述:损失函数由三部分组成
1 TS:预测文本/非文本
该损失函数采用交叉熵,利用了OHEM
2 TCBP:预测文字山峰
这二个式子主要保证离哪条边越近,其中相对越小
3 TCD:预测文字方向
这式子主要保证离哪条边越近,其方向向量权重越大
论文显示在rctw2017数据集上表现不错,结果如下:
在代码实现上没什么难度,只是训练速度很慢
训练效果:
TCBP
TCD
左侧实际标签,右侧预测标签