来自拉夫堡大学和 Xceptor(自称为无代码数据自动化平台)的团队创建了一个用于自然语言处理(NLP) 的深度学习模型,可以分析发票、税单和其他数字的内容和结构文档并将信息分类。
改进后的系统将通过加快欺诈检查和从身份证件中提取详细信息来简化流程,例如设置银行账户、批准抵押贷款、响应客户查询和处理保险索赔。
拉夫堡计算机科学系的首席开发人员张超博士表示,该技术比现有系统更快、更便宜,后者执行相同任务,并将有利于银行、金融服务和保险部门的类似任务。
他说:与传统的基于规则或模式匹配的方法相比,开发的 NLP 可以识别术语、学习语言结构、提取上下文相关性并将文本分类为语义组和子句,例如发票号码、收款人地址、交易对手名称等。以及区分到期日 [与] 发票日期。
AI 模型经过训练可以处理复杂的自由形式内容,并可靠地提取与上下文相关的信息,而不是依赖于文本中的预定义模板,并且建立在最先进的深度学习技术之上。
在学习过程中引入了图建模的概念,以提高复杂文档的模型性能,其中可能包括带有空间对齐信息的表格和块状文本。此类文档比段落中的纯文本更难处理。
来自拉夫堡理学院的学术带头人李百华教授说:目前,从大量文档中提取所需信息是一个非常耗时的手动过程。开发人工智能解决方案来学习复杂结构文档中呈现的上下文含义和相关性是一项非常重要的工作。极具挑战性。
我们很高兴拉夫堡大学的 NLP 和机器学习专家正在与 Xceptor 合作开展这项改变游戏规则的创新,并能够成功地将 AI 自动化功能集成到公司的智能文档分析平台中,以提高速度和准确性。