Share!

帳票OCRとは、スキャナで読み取った紙の帳票の活字、手書き文字、QRコード、バーコード、チェックマークを編集が可能な電子データ(文字コード)に変換するソフトウェアのことを指します。スキャナで読み取った帳票は画像として認識します。

OCR(光学的文字認識)は、「Optical Character Recognition or Reader」のの頭文字です。読み取った画像データに対し、レイアウト解析、行の切り出し、文字の切り出し、図(QRコード、バーコード、チェックマーク)の切り出し、文字認識といった処理を行い、ExcelやWordなどで再利用が可能な電子フォーマットに変換して出力します。OCRは25年以上前から登場はしていましたがかつては文字認識能力に問題があり、特に手書きの文字の認識には多くの修正を必要としていました。

その後、画像処理エンジンの進化、ハイブリッド化(エンジン複数併用)、AI技術の導入などにより、認識能力の精度は飛躍的に向上しました。

「帳票」は法律上、一定の期間の保管が義務づけられていましたが、2005年4月に施行された「e-文書法」により、多くの企業は「電子帳票化」を導入しています。

帳票は、社内で作成したものだけでなく、社外(企業、従業員)から入手するものもあり、これらの領収書や伝票の多くは「紙帳票」でやり取りされています。

OCRは、元データのない社外で発行されたものや電子化されていない過去の帳票の電子データ化を実現してくれるので、

  • 紙帳票の保管・管理コストの削減
  • 帳票の一元管理化
  • 業務効率の向上

といった効果を期待することができます。

帳票OCRの機能

帳票OCRは、帳票業務の効率向上を配慮したOCRで、以下に紹介するような機能を備えています。

○帳票の読み込み(複合機やスキャナから)

帳票の取り込みはクラウド対応のオフィス用複合機などで画像取り込みを行います。多くの帳票OCRでは、複合機の遠隔操作にも対応しており、ADF(Auto Document Feeder|コピー機・複合機に設置されている自動原稿送り装置)等を用いることで大量の帳票を一括して読み取ることが可能です。また帳票OCRは様々な複合機に対応しているため、専用のハードにコストを要することなく、帳票OCRの環境を構築することができます。

○フォーマットの作成

フォーマットとは取り込んだ帳票の様式の作成のことで、帳票OCRによっては「テンプレート」ともいいます。画像として取り込んだ帳票の各フィールドの設定、フィールドの属性の指定(活字、手書き、帳票画像)、文字種などを指定することでフォーマットを作成します。また公的書類の帳票であれば、帳票OCRがその帳票をテンプレートとして備えているので、フォーマットを作成することなく、簡単に電子データに変換することができます。

○文字認識

OCR処理を実施することで切り出した文字図を文字コードに変換出力します。この際、元の帳票の手書き文字と文字認識した文字コードに違いがあれば手修正を加える必要があります。多くの帳票OCRでは、認識しにくい文字や元帳票の記入の誤りを検出するエラー機能等を備えています。このような機能は帳票の不備や見落としなどを防いでくれるため、帳票業務のクオリティを大幅に高めてくれます。

○図認識

帳票には文字だけでなく、バーコードやQRコード、取引先企業のロゴといった商標登録などが記載されています。帳票OCRは項目や数字が記載された帳票の各フィールドだけでなく、帳票に記載されている図も切り出してくれます。帳票ではこれらも重要な情報として取り扱う必要があり、帳票OCRはバーコードやQRコードの画像保存だけでなく、図の文字コード化にも対応しています。

○データ出力

帳票OCRの認識結果は、CVSなどのデータベースのフォーマットとして保存されます。取り込んだ帳票の出力の際は、データベースから帳票のフィールド、図をフォーマットに転記し、ExcelやWordファイル、PDFといったファイル形式で出力することができます。もちろん、プリンタによる紙印刷にも対応しています。

○別システムへの転送

帳票は企業の活動内容を記録した書類です。そのため、帳票は企業内の様々な部署で使用し、また多くの企業では受発注システム、勤怠管理システム、経費精算システムなどを導入しています。帳票OCRで取り込む帳票は社外からの紙帳票、電子帳票化前の社内の紙帳票などですが、電子データ化した帳票を社内の別システムに転送することで、社内の業務システムで帳票が共有できるようになります。

帳票OCRを導入することで企業が得られるメリット

e-文書法」が施行された2005年4月以降、多くの企業は帳票の電子化を推進し続けていますが、2020年現在、全ての帳票を「電子帳票」としてやり取りするまでには、至ってはいません。

そのため企業の多くは紙帳票と電子帳票が混在した状況下での帳票業務が強いられており、「帳票OCR」は企業の帳票業務に様々なメリットをもたらしてくれます。

○手入力の手間、コストが省ける

帳票OCRの文字認識は手作業による帳票の業務システムへの入力の負担を大幅に削減してくれます。一枚あたりの紙帳票の電子化にかかる時間を劇的に削減し、高い生産性を実現してくれます。

○入力ミス等のヒューマンエラーが防げる

帳票OCRには、各フィールドの入力データをチェックする機能を備えています。OCR処理による文字認識だけでなく、実際に認識データそのものの誤りや不備を検出してくれるので、帳票業務の品質も高めてくれます。

○紙帳票の保管・保守の手間、コストが削減できる

帳票は「法人税法」および「会社法」にて保存期間が定められています。法人税法では7年、会社法では10年の保管が義務付けられているため、紙で帳票を管理している企業では、帳票を保管するためのスペースや保守のためのコストが強いられています。

帳票OCRで電子帳票に変換した紙帳票は、税務署に申請書を提出することで廃棄が認められるため、煩わしかった帳票の保守・管理の手間を大幅に省くことができます。

○業務システムと連携することで業務効率が大幅に向上する

帳票OCRによって電子化された帳票は、社内の様々な業務システムから閲覧、出力、編集、管理ができるようになるため、社内の帳票業務の効率が大幅に向上します。特にデータベース化による一元管理は、紙帳票の運用でトラブルになりがちな紛失、持ち出し、書類偽装といったリスクから大事な帳票を堅牢に守ってくれます。

帳票OCRを選ぶポイント

OCRには画像識別能力が高い、低いといった括りだけで良し悪しが決めにくく、それぞれの製品の強み、弱みを把握した上で選定する必要があります。

・文字認識能力
「文字認識能力」はOCRのコアとなる技術で精度の高い文字認識力が求められます。帳票には活字、手書き、チェックボックス、マークなど様々な書式・書体が入り混じっています。
画像文字は複雑なアルゴリズム処理を実施する「エンジン」が識別します。ただエンジンには得手不得手があり、どうしても認識できない文字や誤識別してしまう文字などがあります。
こういった弱点をケアするために複数のエンジンを搭載し、適材適所で切り替えながら文字を識別する帳票OCRは精度の高い文字識別を実現してくれます。

・確認・修正作業のしやすさ
帳票OCRの作業はスキャナで読み取ってフォーマットに変換するだけでなく、各フィールドに入力されたデータの確認や修正といった人の手による作業も伴います。
帳票OCRには、確認や修正が簡単に分かりやすく行えるような工夫も取り入れられています。

・生産性の高さ
企業で取り扱う帳票は量だけでなく様式(種類)も多いため、帳票業務には高い生産性と効率が求められます。
帳票OCRには、ADFで大量に取り込んだ様々な帳票の自動識別、スキャン位置の自動補正、誤認識学習、フォーマット作成といった生産性の向上に繋がる様々な機能を備えています。

・出力機能や別システムとの連携性
多くの企業では帳票OCRにて電子化した帳票のデータをデータサーバーに保存することで社内の別の業務システムでも帳票業務を行えるようにしています。CSV出力対応や連携機能を備えているものを導入することで、OCRで取り込んだ帳票をスムーズに社内の業務システムで使用できるようにしてくれます。

おすすめ帳票OCR

帳票OCRは様々なベンダーから提供されており、帳票に特化していないものも含めると市販されている製品数は数十種以上にも及びます。

○SPA(ウイングアーク1st)

製品サイト

https://www.wingarc.com/product/spa/

紹介文

OCRだけでなく、文書管理・記録管理、データ活用・可視化、
データ流通の機能を備えたオールインワンの帳票システムです。

特徴

  • 用途に応じて4種から選べるOCRエンジン
  • 文書ファイルの自動取り込み
  • 文書ファイルの自動仕分け
  • ノンプログラミング開発
  • 日本語、英語、中国簡体字、中国繁体字、フランス語、
    チェコ語、タイ語、韓国語の多言語対応
  • Web APIによる容易なシステム連携
  • 記録文書のライフサイクル・証跡管理
  • 文書の版管理・複数階層レビュー
  • 高精度検索機能
  • 仮想文書を利用した柔軟な運用
  • 多彩なセキュリティコントロール
  • OCRフィールドの統計情報を可視化
  • ETLツール・RPAツール(自動化)と連携

費用

10ユーザー・ストレージ50GB 50,000円/月〜(税抜)
初期設定費 300,000円(税抜)

開発元

ウイングアーク1st株式会社

○帳票OCR Ver.8(Panasonic)

製品サイト

https://www.panasonic.com/jp/business/its/ocr_form.html

紹介文

パナソニック独自の言語処理解析技術により、
FAXで送受信された注文書のかすれた低品質文字にも強い
高精度OCRエンジンを搭載した帳票OCRです。

特徴

  • 低品質文字に強い高精度OCRエンジン搭載
  • 車検証、アンケート用紙など、さまざまな帳票タイプに標準対応
  • さまざまな帳票に対応できる位置補正機能と帳票自動識別機能
  • 充実のスキャン画像の保存機能

費用

製品:398,000円(税抜)
年間保守:59,700円(税抜)

開発元

パナソニックソリューションテクノロジー株式会社

○帳票OCRソフト FormOCR v.7.5(NTTデータNJK)

製品サイト

https://mediadrive.jp/products/index_formocr.html

紹介文

「メディアドライブ」ブランドとして実績が豊富なNTTデータNJK の
病院・学校事務、人事給与管理、顧客管理、販売管理、生産管理、
マーケティング、経理・会計業務向けのOCRソフトウェアです。
手書き帳票OCRでは業界最高クラスの認識精度を誇ります。

特徴

  • OCRメーカーだからこそできる強力な文字認識技術
  • 様々な機能・オプションにより、
    あらゆる帳票の効率的なデータエントリーを実現
  • AI-OCRと従来OCRの組み合わせで認識精度と対象帳票の向上を実現
  • AI-OCRにより、フリーピッチ手書きの認識性能を向上
  • Word/Excel 等で作成した帳票が認識可能
  • 認識結果は簡単に確認・訂正が可能
  • 市販のタブレット・イメージスキャナ・複合機でOCR 処理を実現
  • 業務システムとの連携が容易

費用

製品:600,000円(税抜)
年間保守:60,000円(税抜)

開発元

株式会社NTTデータNJK

○DynaEye 10(PFU)

製品サイト

https://www.pfu.fujitsu.com/dynaeye/product/dynaeye10/

紹介文

世界シェアNo.1のドキュメントスキャナー、組込みコンピュータなどのハードウェア
および、セキュリティ・文書管理などのソフトウェアやサービス、ITインフラ構築など、
ICTに関するソリューション・サービスをトータルに手掛けているPFUが提供する帳票OCRです。

特徴

  • 累計6,500社以上の豊富な実績
  • 定型帳票、準定型帳票など業務で扱う様々な帳票に対応
  • 外部システムと連携、業務システムの入力業務を自動化
  • AIでフリーピッチ手書き文字の読取精度を大幅に向上(オプション)
  • 帳票システムの構築を容易にしてくれる豊富な関連サービス

費用

非公開

開発元

株式会社PFU

 

○TeleForm Reader(株式会社ハンモック)

製品サイト

https://www.hammock.jp/ocr/kinou/reader.html

紹介文

TeleForm ReaderはTeleFormシリーズのOCRに特化したアプリケーションで
ハンモックが特許を取得したOCRエンジン「WOCR」を標準搭載しています。
かすれや位置ずれが発生しやすいFAXの帳票に対し、高い認識率を実現します。

特徴

  • FAX OCRを前提に開発された製品なので、他のOCRソフトに比べて、
    活字や手書きで送られてくるFAX帳票と連携した運用に最適
  • 受け取ったフォームの歪みを自動修正しハンモック独自特許取得認識エンジンで
    データを解読
  • 帳票イメージファイルを評価する際に信頼性のレベルを割り当てることで
    文字識別の確実度を明確化
  • 指定したフォルダー内の帳票イメージファイルを自動的にOCR処理する
    連携機能を搭載
  • 活字、手書き、自動傾き補正、全文字種、漢字、ひらがな、カタカナ、
    アルファベット、数字、記号の認識設定が可能

費用

非公開

開発元

株式会社ハンモック

まとめ

帳票OCRが持つ機能と導入することで得られるメリット、そして帳票OCRを選ぶポイントを紹介させて頂きましたが、紙帳票と電子帳票が混在する昨今の帳票業務ではOCRが必要不可欠であることをご理解して頂けたでしょうか?

最後に今回紹介させて頂いた要約をまとめとして、以下に記載させて頂きます。

  • 「帳票OCR」とはスキャナで読み取った紙の帳票の活字、手書き文字、QRコード、バーコード、チェックマークを編集が可能な電子データに変換するソフトウェアのこと。

  • 帳票OCRは、帳票の読み込み、フォーマットの作成、文字認識、図認識(QRコード、バーコード)、データ出力(プリンタ、Excel、Word、PDF)、別システムとの連携などの機能を備えている。

  • 帳票OCRを導入することで企業は、手入力の手間、紙帳票の保管・保守などの「コスト削減」、「ヒューマンエラーの予防」、業務システムとの連携による「大幅な業務効率の向上」といったメリットが得られる。

  • 帳票OCRには強み、弱みがあり、選定の際には「文字認識能力」、「確認・修正作業のしやすさ」、「生産性の高さ」、「出力機能や別システムとの連携性」をポイントにするとよい。

TEXT:畑中一平

「ビジネス」ランキング

人気のカテゴリ