Mercatus推出人工智能和机器学习PDF解析器解决方案
Mercatus宣布推出PDF Parser,这是一种技术增强的专用于私人市场的PDF数据提取。Mercatus平台的PDF Parser功能是一系列新增强功能中的最新功能,极大地减轻了数据加载的挑战,消除了手动提取资产报告,投资者备忘录和其他自定义报告的麻烦。
Mercatus首席执行官Haresh Patel表示:“从PDF抓取数据是一个耗时,昂贵且手动的过程,容易出错,并经常导致数据质量不佳 。” “借助PDF解析器,我们消除了处理,提取,清理和上传PDF数据的繁琐工作。通过使流程自动化,企业可以在两到三分钟内完成传统上需要三到三天的工作。对于管理50个活跃投资的典型基金经理来说,每个报告周期减少了24万美元。”
由于PDF是为人类而非计算机而设计的,因此它们没有定义好的结构,使用户可以轻松地从中收集数据。借助可靠的后端提取工具,Mercatus数据管理平台使用户可以有效地从任何PDF文档中查询,搜索,过滤,合并,排序和提取文本和图像。功能包括:
文档解析器模板– 利用可配置的文档解析器模板从资产,绩效报告,投资者备忘录等中自动和可重复地提取数据。
批处理和历史输入–一次 上传一批PDF,以加载单个或多个实体的数据。在数分钟而不是数月的时间内上传数十年的数据。
审计和治理– 在整个投资组合中构建强大的数据沿袭。跟踪和审核数据来自何处,如何使用以及谁在使用。
“私人市场投资者依赖于多样化且快速变化的非结构化文件。传统的(光学字符识别)OCR和数据提取技术无法在具有标准文档的相邻市场中使用,” Mercatus首席技术官 Jason Adams说。“通过将AI和机器学习的先进技术与循环中的人的处理相结合,我们提供了一种解决方案,可以满足与这些文档进行大规模交互的需求。现在,最终锁定在非结构化文档中的关键业务数据可以通过自动化方式进行大量访问和提取。
晏庇隆,合伙 Ktlaysis,补充说:“如果能够分析一个有系统的方式非结构化数据是今天必须具备的。在人工智能,机器学习和自然语言处理(NLP)等颠覆性技术的推动下,计算机的计算能力从未如此强大。到现在为止,必须手动处理,读取和写入其他文档,系统和数据库。Mercatus的最新版本是过程自动化的真正升级,到目前为止,它一直是手工操作。”