
connected papers 上查找相关的论文。


其中2022年的文章发表在ECCV

准备调研一下这篇论文。
论文提出了 DocGeoNet 扭曲文档图片矫正算法。思路是3D形状为矫正扭曲的文档图像提供了全局的不扭曲线索,同时忽略了局部结构。文本线补充地为局部提供显式几何约束。
DocGeoNet 利用了变形文档图片的两个属性:
1)3D形状(提供全局细节);
2)文本线(提供局部细节)。

DocGeoNet 主要由三个部分组成:
1)预处理模块将前台文档从集群背景中分离出来;
2)结构编码器和文本线提取器,分别对变形文档的三维形状进行建模和提取弯曲的文本线;
3)校正解码器,用于估计失真校正的翘曲流量。







测试的效果没有想象的好。