excel学习库

excel表格_excel函数公式大全_execl从入门到精通

合合信息的OCR技术在智能文档处理方面有哪些具体的应用案例?

智能文档处理(IDP)是利用人工智能技术,自动从复杂的非结构化和半结构化文档中抽取关键数据,并将其转换成结构化数据的技术能够自动识别提取并结构化处理文档中的关键信息这种技术通常基于自然语言处理NLP计算机视觉等先进技术可以应用于各种类型的文档如PDFWordExcel图片等

合合信息智能文档抽取的主要功能包括

1.文本抽取从文档中提取出所有文字内容包括标题正文表格等

2.实体识别识别文档中的特定实体如人名地名组织名日期金额等

3.关键信息提取根据预设的规则或模型从文档中提取出关键信息如合同条款财务数据项目进度等

4.结构化输出将提取出的信息以结构化的形式输出如JSONXMLCSV等

5.自动化处理可以与业务流程集成实现自动化的文档处理提高工作效率

6.智能文档抽取在许多领域都有广泛的应用如金融法律医疗人力资源

下面将以金融场景为例对金融大数据业务场景进行详细介绍

在金融大数据服务行业尤其是在财报和年报季企业面临着巨大的数据处理挑战传统的数据录入方法依赖于数据清洗和正则表达式来提取网页内容然而这些方法在处理格式多样版面复杂的文档时效果不佳这导致重要信息难以高效准确地转换为可用数据给企业带来了很大的困扰

通过使用合合信息的文档解析工具企业可以在短时间内处理大量数据输入

革新券商综合柜面业务应用

综合柜面业务文件种类多版式不一复杂版面多处理难度大合合信息智能文档抽取产品融合了OCR文字识别版面解析语义理解Embedding结构化提取等多项技术具备在多种复杂场景下实现高精度文档抽取的能力将以智能文档抽取技术为核心的解决方案应用于综合柜面业务系统能够在满足安全与合规要求的前提下显著提升业务运行效率降低运营风险

合合信息智能文档处理平台针对综合柜面业务的场景提供开箱即用的文档抽取能力涵盖

  • 客户风险承受能力测评及告知函

  • 法人开户申请表法人开户申请表产品个人开户申请表

  • 三方存管协议 产品适当性评估结果确认书

  • 业务授权委托书 业务受理单

  • 证券开立申请表及证券业务办理须知 证券业务申请表及业务办理须知

  • 证券账户开立申请表及办理须知 证券账户业务申请表适用于办理证券账户关联关系确认转挂业务

  • 证券账户业务申请表适用于开放式基金账户资料查询场内外对应关系维护销户申请表

  • 更多......

以版式各不相同的三方存管协议为例三方存管协议主要用于个人开户业务机构开户业务合同企业开户业务私募产品开户业务单资金户和休眠户激活等业务协议格式多样抽取内容文字信息如投资者姓名身份证件类型证件号码等信息还会涉及签署日期的手写字体识别投资者签章机构公章经办签章复核签章的公章识别

创新点开箱即用零样本抽取

合合信息的智能文档抽取产品具备开箱即用的特点无需预先提供标注样本即可实现高效文档抽取

这一零样本抽取能力得益于平台内置的丰富模型和算法库使系统在初次部署时就能快速适应并处理各种类型的文档相比传统方法省去了大量前期的数据标注和模型训练工作从而极大减少了准备工作的时间和成本用户只需简单配置即可投入使用大幅提升了部署效率和应用便捷性

此外在处理突发业务需求时平台能够迅速响应和调整满足各种复杂业务场景下的文档处理需求

银行函证业务的数字化领航者

银行询证函是注册会计师投行IPO项目组询证者直接从银行获取书面答复作为审计证据的过程具备独立性特点根本目的是核对账目所确定的内容更多集中在应收应付账款的真实性与准确性用于发现财务舞弊

01函证审核

会计师/IPO项目组发函给商业银行银行需要对函证中盖章规范性进行审核并判定询证函格式是否符合银行规范在回函之前需要将回函件与用印件比对查看风险差异项

合合信息智能文档处理平台的印章检测识别模型可同时判断印章存在性印章类型颜色形状并进行印章内容抽取智能化实现印章合规性审核平台同时提供文档比对模型支持PDFWord图片Exceltxt等多种文档格式包含印刷体/手写体表格印章比对等

■ 印章检测识别

支持智能识别印章类型涵盖公章合同专用章法定代表人章财务专用章发票专用章业务专用章等同时可识别印章颜色印章形状涵盖主体名称的印章内容并提供印章图像切片

■ 询证函格式比对

支持修改删除增加三种不同类型差异显示原文高亮展示文本差异处信息可左右文档同步预览或异步预览快速定位直观比对差异点将自动过滤骑缝章授权章及回函章等的影响支持同步滚动展示模式文档差异点按条款聚合一目了然

02函证回复

根据银行函证工作操作指引适用于注册会计师执行财务报表审计业务的询证函有两种格式

格式一由注册会计师根据根据被审计单位相关信息填写银行接收到格式一询证函后需要采集函证内14大类信息与行内业务系统中客户数据比对回复是否相符如不符还应提供详细信息

格式二由注册会计师填写扣款银行账号以及供银行识别函证范围所需信息银行接收到格式二询证函后需要抽取被审计单位的账户信息对接内部数据库填写具体信息后回函

合合信息智能文档抽取产品支持格式一格式二两种版式银行询证函的关键信息抽取涵盖银行存款银行借款担保等14大类信息及被审计单位账户信息依托合合信息自研的垂直领域语义模型实现开箱即用的零样本抽取辅助业务人员智能化完成信息抽取与比对

覆盖函证字段

1. 银行存款账户名称银行账号币种利率账户类型账户余额是否属于资金归集起始日期终止日期是否存在使用限制备注
2. 银行借款借款人名称借款账号币种余额借款日期到期日期利率押品/担保人备注
3. 注销的银行存款账户账户名称银行账号币种注销账户日
4. 被审计单位作为委托人的委托贷款账户名称银行结算账号资金借入方币种利率余额贷款起止日期备注
5. 被审计单位作为借款人的委托贷款账户名称银行结算账号资金借出方币种利率余额贷款起止日期备注
6. 担保被担保人担保方式币种担保余额担保到期日担保合同编号备注
7. 银行承兑汇票银行承兑汇票号码结算账户账号币种票面金额出票日到期日押品
8. 已贴现而尚未到期的商业汇票商业汇票号码承兑人名称币种票面金额出票日到期日贴现日贴现率贴现净额
9. 被审计单位为持票人的商业汇票商业汇票号码承兑人名称币种票面金额出票日到期日
10. 不可撤销信用证信用证号码受益人币种信用证金额到期日未使用金额
11. 外汇买卖合约类别合约号码贵行卖出币种贵行买入币种未履行的合约买卖金额汇率交收日期
12. 证券或其他产权文件证券或其他产权文件名称证券代码或产权文件编号数量币种金额
13. 未到期银行理财产品产品名称产品类型封闭式/开放式币种持有份额产品净值购买日到期日是否用于担保或存在其他使用限制
14. 资金归集资金提供机构名称资金提供机构账号资金使用机构名称资金使用机构账号币种资金余额备注

03 发送回函

合合信息智能文档抽取产品可智能化抽取函证中的回函地址联系人等信息对接快递系统下单

基金合同信息自动提取

合合信息智能文档处理平台重磅上线基金合同抽取模型内置30+常用字段智能抽取包括基金名称产品名称存续期限是否节假日顺延运作方式产品类型募集币种管理人名称托管人名称产品风险级别投资者风险承受能力管理人网站基金服务机构全称注册登记编码代销机构全称最低募集金额最低投资者人数最高投资者人数首次投资最低金额追加认购最低金额认购失败利息处理方式认购期利息处理方式是否收取认购费赎回限制天数认购费归属封闭期申购费归属赎回费等

除内置字段外合合信息智能文档处理平台的基金合同抽取模型还支持自定义配置抽取字段开箱即用无需标准训练即可实现抽取

· 功能亮点

1.开箱即用内置30+常用字段同时支持自定义配置字段无需标注训练即可实现抽取

2. 泛化性强兼容不同版式的基金合同

3. 复杂版面解析准确还原复杂表格含少线表无线表合并表格

4. 多模态抽取支持抽取多种文件格式及手写体印章整表等元素

5. 长文本抽取支持抽取多达数百页的基金合同

6. 具备通用及基金领域知识基于高质量语料库应用具备基金领域的专项知识

·应用场景

合合信息智能文档处理平台的基金合同抽取模型适用于基金公司证券资管保险资管证券/银行托管等机构业务这些机构每日需要处理大量的划款单邮件或传真指令开户表单对账单基金宣传材料基金合同托管协议公司行动公告等非结构化文本合合信息智能文档处理平台基于文档解析文档抽取文档审核文档比对等核心AI技术能力可自动化处理海量业务文档无缝对接业务系统提升业务效率驱动业务智能化升级

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接