ページの本文へ

多様なビジネス帳票をデータ化する
クラウド型AI-OCRサービス

帳票認識サービス

帳票認識サービスは、AI技術により多様なビジネス帳票の読み取りを行なうとともに、
読み取り結果の正しさを評価することで、帳票取り扱い業務の省力化を支援します。

AI-OCRを適用した「帳票認識サービス」の概要イメージ:顧客業務システムで各種デバイス(スキャナ、スマートフォンなど)により帳票を画像データ化します。その後帳票画像(多種大量の帳票様式)を帳票認識サービスで処理します。帳票認識サービスでは、APIを提供し、AI-OCRエンジンを自動振り分けします。定型帳票対応エンジンでは、帳票読み取り定義と機械学習文字認識モデルにより確信度を算出します。非定型帳票対応エンジンでは、辞書とキーワード情報抽出・設定変更により、業務データと併せて確信度を算出します。確信度判定でビジネスリスクを調整します。確信度「低」(0型)の場合、人が入力・確認します。確信度「中」I(いち)型)の場合、ロボットが入力し、人が確認します。確信度「高」II(に)型)の場合、ロボットが入力し、人の確認は不要となります。確信度の高いものは人による確認が不要となり、帳票事務の負荷を軽減できます。

多くの産業分野において、紙の情報に関わる処理が、業務プロセスと不可分に結びついています。当然、紙の帳票上のデータをシステムに入力し確認することに多くの手間と労力を注ぎ込んできました。

日立の帳票認識サービスでは、AI技術をもとに高精度に文字認識を行うOCRエンジンを複数搭載するサービスプラットフォームを構成し、定型帳票や非定型帳票、また活字や手書き文字、二次元コードなどに対応しています。それにより業務の特性や各種条件に合わせ幅広い業種のエントリー業務に適応できます。また、認識の確からしさを日立独自のアルゴリズムで算出し、「確信度」というスコアと合わせ出力することで、誤認識データを容易に仕分けることも可能です。

これらの技術を活用して、業務アプリケーションとのスムーズな連携を可能にし、お客さまのさまざまな帳票取り扱い業務の自動化を実現します。

特長

幅広い帳票取り扱い業務への適用

定型帳票対応エンジンと非定型帳票対応エンジンなど、業務帳票に合った複数のAI-OCRエンジンを搭載するサービスプラットフォームでサービスを提供します。多様な帳票様式の読み取りが可能となり、幅広い帳票取り扱い業務に適用できます。また、AI-OCRエンジンの選択や、テンプレート*1の指定の自動化も実現します。複数様式が混在する帳票事務でも、お客さまは帳票種別を意識せず運用可能で、負担を大幅に軽減できます。

*1
帳票のレイアウト情報やデータ属性を定義したもの。

帳票認識サービスの特長:幅広い帳票取り扱い業務への適用:日立の技術に加え、他社の認識技術を採用し、帳票に応じた最適な認証技術を提供。(エンドユーザーが業務アプリ、モバイルアプリを通して帳票認識サービスに接続。帳票認識サービスでは、帳票RPAアプリでAPIにより認識エンジンを振り分け、テンプレートを選択。(テンプレートは契約IDごと、帳票類ごとの認識エンジンを管理)非定型帳票認識エンジンでは、前処理・認識処理・後処理をA社認識エンジンまたはB社認識エンジンで処理。定型帳票認識エンジンでは、前処理(画像処理:傾斜補正、地紋除去、ノイズ除去、二値化など)を行った後、C社認識エンジンまたはD社認識エンジンまたは二次元コード認識で認識処理・後処理を行う。その後、帳票RPAアプリで読み取り座標照合、スコアリング(確信度算出)、ルールチェック(確信度補正)、型判定を実行。帳票RPAの管理画面では、テンプレート管理、ルール管理、アカウント管理などが可能。)

確信度による業務負荷の軽減

帳票取り扱い業務の負荷を軽減するには、認識結果を確認する手間をどれだけ減らすことができるかも重要です。
機械に任せられる処理(RPAによる自動化が可能な処理)と人の確認が必要な運用の判別がポイントになります。

そこで、帳票認識サービスでは、AI-OCRの認識結果の確からしさを独自アルゴリズムにより確信度というスコアで提供します。そして、AI-OCRの認識結果と確信度に対し、適用業務におけるチェックルールを適用し、補正することで、OCRの不読・誤読による誤ったデータ登録リスクを低減させています。さらに、AI-OCRの認識結果を確信度付きで確認し、必要に応じて修正できる機能により、OCRの誤認識が発生したときに業務側で正確な対応が可能になります。

例えば、確信度「中」と「低」のものは人によるチェックを行い、確信度が「高」のものは人によるチェックを行わずに自動登録するなど、誤登録リスクを回避しながら、帳票業務の自動化率を向上します。さらにオプションで、認識結果と別系列の業務データとの突合チェックも行います。突合チェック結果も確信度の補正に活用することで、誤ったデータエントリーのビジネスリスクを更に低減することができます。

帳票認識結果画面1

確信度を利用し、修正箇所をハイライト表示

帳票認識結果画面1:確信度を利用し、修正箇所をハイライト表示:入力文字がプレ印字にかかってしまっているため、正読しているがAI判定で確信度を落として出力した事例。確信度「中」の確信度項目を「黄色」で表示し、認識結果の目視チェック箇所を局所化。

帳票認識結果画面2

ビジネスルールチェックを加え確信度を補正し、システム誤入力を防御

帳票認識結果画面2:ビジネスルールチェックを加え確信度を補正し、システム誤入力を防御:AIは確信度を高く回答したが、ビジネスルールチェック(桁数)を与え、確信度を補正し出力した事例。確信度「低」の確信度項目を「赤色」で表示し、認識結果の目視チェック箇所を局所化。

特定の期間に集中する業務に柔軟に対応

さまざまな業務で発生する帳票は、特定の期間に集中するケースが多くみられます。繁忙期には通常の時期より、数倍から数十倍という業務もあります。
帳票認識サービスでは、サービスプラットフォームをクラウド上に構成しています。これにより特定の期間に集中する業務などに対しても、スケーラブルなサービス対応が可能となり、システムコストを低減できます。

また、ミッションクリティカルなシステムを多く手がけてきた日立のノウハウをクラウドサービスにも適用し、お客さまのニーズに合わせ、可用性・セキュリティの対応を個別にサービスに組み込むことも可能です。

電子ファイル内のすべての文字情報を高精度にテキスト化

活字や手書きの帳票を非定型帳票エンジンを使用して読み取り、透明テキスト付きPDF形式で出力することができます。
これにより、事前の読み取り定義が難しい報告書や図面などの紙情報(ナレッジ)を電子化することが可能となります。
さらに、社内ナレッジを生成AIで活用するためにも、まずは紙情報の電子化が必要です。紙情報を電子化することで、貴重な情報を簡単にアクセスできる形式に変換し、効果的に活用することができます。

電子ファイル内のすべての文字情報を高精度にテキスト化:手書きのPDF帳票(給与支払報告書サンプル)を全文OCRサービスで読み取ります。出力されたPDFでは、手書きの文字でも検索ヒットします。手書きの報告書を検索可能なPDFに!過去の紙情報のデジタル化が可能になります。

導入効果

帳票認識サービスは帳票取り扱い業務の自動化をめざし、さまざまな技術でコスト低減を支援します。

  • 幅広い業務をカバーする社内外複数のAI-OCRエンジンを搭載したサービスプラットフォーム
  • 従来OCRを業務適用する際に、人手で行っていた帳票の分類や運用設定の自動化
  • 確信度を用いての完全自動化や、確認作業の局所化
  • オンプレミスOCR機器で必要だった、スケール調整・保守また、OCR機能のバージョンアップの削減

特に自動化で肝心な確信度の活用効果については、2017年より日立グループの出納業務に試験適用を行いました。出納業務における証票処理の70%を自動化し事務コスト削減を達成しています。

-導入効果を裏付けるニュースリリースご参考-

関連リンク