羚羊工业互联网申请文档识别等专利,能够兼顾文档识别效率和识别精度

金融界2024年9月26日消息,国家知识产权局信息显示,羚羊工业互联网股份有限公司申请一项名为“文档识别方法、智能对话方法及相关装置、设备和介质”的专利,公开号 CN 118692095 A,申请日期为2024年8月。

专利摘要显示,本申请公开了一种文档识别方法、智能对话方法及相关装置、设备和介质,其中,文档识别方法包括:基于待识别文档进行拆分,得到若干待识别页面,并基于待识别文档的文档属性,在若干文档识别器中选择目标识别器;对待识别页面进行版面分析,得到分析结果,并基于目标识别器,确定是否调用公式检测器,以及基于目标识别器对待识别页面进行识别,得到识别结果;其中,公式检测器用于对待识别页面进行检测,得到检测结果,且在检测结果包括公式区域的情况下,调用公式解析器解析公式区域,得到解析结果;基于识别结果、分析结果以及由检测结果所连带解析结果,得到目标识别页面。上述方案,能够兼顾文档识别效率和识别精度。