paint-brush
使用基于 Python 的光学字符识别实现保险承保自动化经过@marutitechlabs
2,690 讀數
2,690 讀數

使用基于 Python 的光学字符识别实现保险承保自动化

经过 Maruti Techlabs 5m2025/01/08
Read on Terminal Reader
Read this story w/o Javascript

太長; 讀書

Maruti Techlabs 提供端到端的产品开发。我们的专家团队将指导您进行创新、验证和发布。

People Mentioned

Mention Thumbnail

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - 使用基于 Python 的光学字符识别实现保险承保自动化
Maruti Techlabs  HackerNoon profile picture

提供专业知识

后端、数据科学和 QA

行业

保险

我们的客户,

美国最大的保险经纪公司之一,拥有超过 25 年的经验。他们在 40 多个地点提供服务,包括汽车、摩托车、船舶、人寿、健康、宠物和其他保险服务。


作为保险经纪人,我们的客户还为美国各地的众多保险公司提供承保服务。

项目范围

保险公司通过承保来验证客户保险单的真实性,这些保险单包含个人和财务信息。这个过程通常是手动完成的,但可以使用基于人工智能的技术(如机器学习、自然语言处理和认知计算)实现自动化。


随着客户数量的大量涌入,引入自动化来提高客户参与度并减少手动工作量已变得至关重要。


我们客户的项目范围围绕承保任务的自动化。其中包括核实索赔登记期间提供的客户信息并将其数字化。


这些文件包括:

  • 机动车记录 (MVR) 包括索赔人的姓名、驾照号码、出生日期、性别、保单号码等。
  • 索赔人的签名(电子签名或照片签名)。
  • 车辆详细信息:制造年份、品牌、型号和车辆识别号 (VIN)。
  • 交叉验证索赔人的银行凭证。

挑战

承保可能是一个繁琐的过程,传统上需要手动验证各种文件和证明。在评估时,承保人必须高度细心,因为他们主要要保障公司的风险。


如此漫长的销售周期的手动验证过程需要大量的时间、精力和人力,而且还容易出现错误,从而导致客户流失。


我们的客户承保的先决条件是使用光学字符识别模型来应对这一挑战,该模型可以快速扫描索赔人的文件。这些文件包括首次损失通知文件、银行对账单、信用评分以及其他印刷或手写的索赔处理文件。该模型将转录这些文件并呈现数字化副本。


我们的客户正在寻求与一家拥有专业知识和经验的人工智能解决方案合作伙伴合作,为保险行业制定定制解决方案。


他们的要求包括:

  • 将 FNOL、银行对账单、信用评分等文件数字化。
  • 通过与原始客户文件交叉引用来验证手动或打印的文件,例如驾驶执照、车辆登记证、保单类型和详细信息等,而不会跳过任何数据。
  • 每周 7 天、每天 24 小时并行处理多个应用程序,无需任何人工干预。
  • 系统地存储处理后的数据,不重复。
  • 在预计的时间范围内与代理或客户分享验证状态。

为什么选择 Maruti Techlabs?

Maruti Techlabs 之前曾参与过保险行业的 AI 项目。我们与客户团队进行了联系,讨论了我们在增强承保流程方面的专业知识。我们的专家希望深入了解他们的承保和相关运营流程,这些流程可以使用 AI 解决方案来解决。


在了解了他们的挑战并评估了我们的能力之后,双方同意进行时间受限的概念验证(PoC)作为试运行。


在成功执行 PoC 后,他们继续进行自动化项目。随后,我们了解了项目的范围并制定了全面的时间表。


我们理解客户业务目标的方法、通过限时概念验证来验证所提出的解决方案以及行业同行的建议都是客户决策过程中的关键因素。这些因素让我们的客户有信心继续与 Maruti Techlabs 合作。

解决方案

我们创建了一个基于 Python 的 OCR 模型,用于查找不一致、缺失信息或错误,并将这些申请标记为需要人工审核。未标记的文件将发送给承销商进行处理。


我们的主要目标是从手写或打印的 FNOL 文档中提取重要数据,并通过与客户的注册凭证进行交叉引用来纠正它。



我们的开发团队面临的一个主要挑战是将定量和定性数据输入模型以进行有效的训练。


以下是使用光学字符识别实现文档处理的分步过程:



  1. 预处理输入图像:这是任何使用图像识别组件的任务必须执行的首要步骤。在这里,我们使用 Tesseract 来简化图像、检测相关边缘并解释字符的轮廓。

  2. 检测文本:在此步骤中,我们在图像上的字符周围标记一个框。使用 YOLOv5 的实时物体检测也完成了同样的操作。

  3. 字符识别:最后一步包括识别上一步中框出的字符。利用 PyTorch 来实现相同的功能。




我们使用客户提供的测试数据测试了我们的模型。在用大量用例试用和测试了该模型后,它就被部署到他们的在线平台上。

沟通与协作

在 Maruti Techlabs,我们希望确保在处理任何项目时沟通的透明度。


我们利用 JIRA 来为该项目进行冲刺管理、任务创建、路线图跟踪和积压整理。


除此之外,我们每周都会在 Google Meet 上安排电话会议,分享项目的开发进度和细节。双方使用 Slack 进行日常沟通。


我们为项目的开发阶段部署了以下团队:

  • 项目经理——规划整个项目的时间表,将责任委派给团队成员,并监督项目可交付成果的及时交付。
  • 技术主管 -领导开发团队实现既定的交付成果。它涉及监督团队成员、委派任务、提供反馈、计算风险和解决冲突。
  • 软件开发人员——为模型编写代码,同时创建、维护、纠正和升级软件以提高功效。
  • QA——通过细致的测试、缺陷跟踪和风险降低来确保软件质量。

技术堆栈



结果

  • 我们的OCR模型为客户的承保流程提供了以下改进:
    • 它提高了数据的准确性,同时通过文档分类降低了数据重复的风险。

    • 自动化承保任务,减少40%的花费时间,从而有更多的时间专注于高优先级的任务。

    • 利用风险评分和欺诈洞察加强安全性。

    • 它通过专门的端到端索赔处理流程增强了整体客户体验。


我们的客户受益于 Maruti Techlabs 的帮助,优化了承保流程并通过人工智能驱动的自动化创造了客户价值。


我们的发展历程

我们遵循敏捷、精益和 DevOps 最佳实践来创建卓越的原型,通过协作和快速执行将用户的想法变为现实。我们的首要任务是快速反应时间和可访问性。


我们确实希望成为您的扩展团队,因此除了定期会议之外,您可以确信我们的每个团队成员都可以通过一个电话、电子邮件或消息联系到。