Rethinking Table Recognitionusing Graph Neural Networks
会议: ICDAR 2019
论文地址:https://arxiv.org/abs/1905.13391
github: https://github.com/shahrukhqasim/TIES-2.0
[TOC]
摘要
文档结构分析,例如区域分割和表格识别,是文档处理中的复杂问题,并且是一个活跃的研究领域。深度学习在解决各种计算机视觉和机器学习问题方面的近期成功尚未反映在文档结构分析中,因为传统的神经网络不适合该问题的输入结构。本文提出了一种基于图网络的架构作为标准神经网络更好的替代方案来识别表格。我们主张图网络对于这些问题是一种更自然的选择,并探索了两种基于梯度的图神经网络。我们的提出的架构结合了卷积神经网络用于视觉特征提取以及图网络用于处理问题结构的好处。我们在实验上证明,与基线相比,我们的方法具有显著的优势。此外,我们还指出大规模数据集缺乏是结构分析领域深度学习研究的主要障碍,并提出了一个针对表格识别的新大规模合成数据集。最后,我们开源了我们的数据生成和图网络训练框架实现,以促进这一方向上的可重复研究。
**关键词:表格识别;结构分析;图神经网络;文档模型;图形模型;数据集 **
查看全文 >>