paint-brush
Python ベースの光学文字認識を使用した保険引受の自動化@marutitechlabs
2,693 測定値
2,693 測定値

Python ベースの光学文字認識を使用した保険引受の自動化

Maruti Techlabs 5m2025/01/08
Read on Terminal Reader
Read this story w/o Javascript

長すぎる; 読むには

Maruti Techlabs は、エンドツーエンドの製品開発を提供します。当社の専門チームがあらゆるステップをガイドしながら、革新、検証、発売を行います。

People Mentioned

Mention Thumbnail

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Python ベースの光学文字認識を使用した保険引受の自動化
Maruti Techlabs  HackerNoon profile picture

専門知識の提供

バックエンド、データサイエンス、QA

業界

保険

私たちのクライアントは、

米国最大の保険ブローカーの 1 つで、25 年以上の経験があります。自動車、オートバイ、ボート、生命、健康、ペット、その他の保険サービスを含むサービスを 40 か所以上の拠点で提供しています。


当社のクライアントは保険ブローカーとして、米国全土の多数の保険会社に対して引受サービスも提供しています。

プロジェクトの範囲

保険会社は、顧客の個人情報や財務情報を含む保険書類の真正性を検証するために引受業務を行っています。このプロセスは通常は手動で行われますが、機械学習、自然言語処理、認知コンピューティングなどの AI ベースのテクノロジーを使用して自動化することもできます。


顧客の流入が急増しているため、自動化を導入して顧客エンゲージメントを高め、手作業の作業負荷を軽減することが最も重要になっています。


当社のクライアントのプロジェクト範囲は、引受業務の自動化を中心に展開されました。これには、請求登録時に提供される顧客情報の検証とデジタル化が含まれます。


これらの文書には以下が含まれます。

  • 請求者の名前、免許証番号、生年月日、性別、保険証券番号などを含む自動車記録 (MVR)。
  • 請求者の署名(電子署名または写真署名)。
  • 車両の詳細: 製造年、メーカー、モデル、車両識別番号 (VIN)。
  • 請求者の銀行認証情報を相互検証します。

チャレンジ

引受業務は、従来、さまざまな文書や証明を手作業で検証する面倒なプロセスです。引受人は、主に会社のリスクを保護する必要があるため、評価中に細心の注意を払う必要があります。


このような長い販売サイクルの手動検証プロセスには、多くの時間、エネルギー、および労働力が必要であり、エラーが発生する余地があり、結果として顧客を失うことになります。


当社のクライアントの引受条件は、請求者の書類を素早くスキャンできる光学文字認識モデルでこの課題に対応することでした。これには、最初の損害通知書類、銀行取引明細書、信用スコア、その他の印刷または手書きの請求処理書類が含まれます。モデルは、それらを転記し、デジタル化されたコピーを作成します。


当社のクライアントは、保険業界向けにカスタマイズされたソリューションを作成する専門知識と経験を持つAI ソリューション パートナーとの提携を求めていました。


彼らの要件には以下が含まれていました:

  • FNOL、銀行取引明細書、信用スコアなどの文書をデジタル化します。
  • 運転免許証、車両登録証明書、保険の種類と詳細などの手動または印刷された文書を、データを省略することなく元の顧客文書と相互参照して検証します。
  • 人間の介入なしに、24 時間 365 日、複数のアプリケーションを並行して処理します。
  • 処理されたデータを重複なく体系的に保存します。
  • 推定時間枠内で検証ステータスをエージェントまたは顧客と共有します。

なぜ Maruti Techlabs を選ぶのか?

Maruti Techlabs は、以前、保険業界で AI プロジェクトに取り組んでいました。当社はクライアントのチームと連絡を取り、引受プロセスの強化に関する当社の専門知識について話し合いました。当社の専門家は、AI ソリューションを使用して対処できる引受および関連する運用プロセスについて、より深い洞察を得たいと考えていました。


両者は、課題を把握し、当社の能力を評価した後、試行として時間制限付きの概念実証 (PoC) を進めることに合意しました。


PoC の実行が成功した後、彼らは自動化の取り組みを進めました。その後、私たちはプロジェクトの範囲を把握し、包括的なタイムラインを作成しました。


お客様のビジネス目標を理解し、期限付きの概念実証を通じて提案されたソリューションを検証し、業界の同業者からの推奨を得るという当社のアプローチは、お客様の意思決定プロセスにとって重要な要素でした。これらの要素により、お客様は Maruti Techlabs との協力を進める自信を得ることができました。

解決

私たちは、矛盾、情報の欠落、エラーを探す Python ベースの OCR モデルを作成し、これらの申請書にフラグを付けて手動レビューするようにしました。フラグが付けられていない文書は、処理のために引受人に送られます。


私たちの主な目標は、手書きまたは印刷された FNOL 文書から重要なデータを抽出し、顧客の登録済みの資格情報と相互参照して修正することでした。



私たちの開発チームが直面した大きな課題の 1 つは、定量的および定性的なデータをモデルに入力して、効果的にトレーニングすることでした。


光学式文字認識を使用してドキュメント処理を実装する手順は次のとおりです。



  1. 入力画像の前処理:これは、画像認識コンポーネントを使用するすべてのタスクで実行する必要がある最初のステップです。ここでは、Tesseract を使用して画像を簡素化し、関連するエッジを検出し、文字のアウトラインを解釈しました。

  2. テキストの検出:このステップでは、画像上の文字の周囲にボックスをマークしました。同じことは、YOLOv5 によるリアルタイム オブジェクト検出を使用して実行されました。

  3. 文字の認識:最後のステップでは、前のステップで囲まれた文字を認識します。これを実装するために PyTorch が活用されました。




私たちは、クライアントから提供されたテスト データを使用してモデルをテストしました。モデルは多数のユース ケースで試行およびテストされた後、オンライン プラットフォームに展開されました。

コミュニケーションとコラボレーション

Maruti Techlabs では、あらゆるプロジェクトに取り組む際にコミュニケーションの透明性を確保することを大切にしています。


このプロジェクトでは、スプリント管理、タスク作成、ロードマップ追跡、バックロググルーミングに JIRA を活用しました。


これ以外にも、開発の進捗状況やプロジェクトの詳細を共有するために、Google Meet で毎週通話をスケジュールしました。両者は Slack を使用して日常的なコミュニケーションを実行しました。


プロジェクトの開発フェーズでは、次のチームを編成しました。

  • プロジェクト マネージャー -プロジェクト全体のタイムラインを計画し、チーム メンバーに責任を委任し、プロジェクト成果物のタイムリーな納品を監視します。
  • テクニカル リード -決定された成果物を達成するために開発チームをリードします。チーム メンバーの監督、タスクの委任、フィードバックの提供、リスクの計算、および競合の解決が含まれます。
  • ソフトウェア開発者 -有効性のためにソフトウェアを作成、保守、修正、アップグレードしながら、モデルのコードを記述します。
  • QA -綿密なテスト、欠陥追跡、リスク軽減を通じてソフトウェアの品質を保証します。

テクノロジースタック



結果

  • 当社の OCR モデルは、クライアントの引受プロセスに次のような改善をもたらしました。
    • ドキュメント分類を使用してデータ重複のリスクを軽減しながら、データの精度を向上させました。

    • 引受業務を自動化することで、所要時間を40%削減し、優先度の高い業務に集中できる時間を増やすことができます。

    • リスクスコアリングと不正行為の洞察を使用してセキュリティを強化します。

    • 請求処理専用のエンドツーエンドのプロセスにより、全体的な顧客エクスペリエンスが向上しました。


当社のクライアントは、Maruti Techlabs の支援により、引受プロセスの最適化と AI 主導の自動化による顧客価値の創出という恩恵を受けました。


開発プロセス

当社は、アジャイル、リーン、DevOps のベスト プラクティスに従い、コラボレーションと迅速な実行を通じてユーザーのアイデアを実現する優れたプロトタイプを作成します。当社の最優先事項は、迅速な対応とアクセシビリティです。


私たちはお客様のチームの一員になりたいと心から願っています。そのため、定期的な会議以外にも、電話、メール、メッセージでいつでもチーム メンバーと連絡を取ることができます。