プリントアウトした書類も、手書きの書類も電子化できるOCRとはどんな技術!?どのくらいの精度で読み取れるの? | ページ 2 | データで越境者に寄り添うメディア データのじかん
会員ページへmember

About us データのじかんとは?

プリントアウトした書類も、手書きの書類も電子化できるOCRとはどんな技術!?どのくらいの精度で読み取れるの?

         

ここまで来た!OCR技術の進歩の歴史


OCRの技術の誕生は意外に古く、アルファベットや数字などの文字の識別は、パソコンが登場するよりはるか昔の1914年にはその原型が開発されていました。今からちょうど100年ほど前ですね。

その後、研究と改良が重ねられ、実用に耐えうるOCR技術が海外で商用に使われ始めたのは1955年頃です。日本では、画数の多い漢字やひらがなやカタカナを認識するのにはかなりの難しさがあるため、どうしても遅れを取ってしまいました。

日本で導入されたわかりやすい例が、郵便局で採用された郵便番号読み取りのシステムです。OCRが読み取りやすいように、アラビア数字を正しく書くための見本を見たことがある人も多いかと思います。数字を機械で読み取りやすくするために、人間の方が書き方を気をつける必要があったのです。

その後、漢字の認識精度も上がり実用可能になった1997年頃、青空文庫などがいち早くOCR技術を取り入れ、認識した文字を人が目視で校正して仕上げていました。文庫本などで整った書式で整然と文字が並んでいれば識字率の精度もよく、少しの目視チェックにより効率よく活字をデータ化することができるようになりました。

急激な成長を遂げるきっかけとなったのが、AI、いわゆる人工知能の技術革新が多大に影響しています。OCRにAIを導入することにより、文字の線形などから読み取っていたOCR技術に加えて、文字の前後を読み取った上で正しい文字を判断したり連想したりすることが可能になりました。たとえば「私はメロンが大好きです」という文章があった場合、過去には読み取った画像の「大」の文字の上に汚れがあると、「大好き」を「犬好き」と変換されることもありました。しかし、AI技術の導入により「私はメロンが犬好きです」とはならずに「私はメロンが大好きです」と正しく読み取ってくれるわけです。漢字の「口」やカタカナの「ロ」、ひらがなの「う」とカタカナの「ラ」、漢数字の「一」や長音記号の「ー」なども前後の文字から推測して適切なものを選んでくれます。この辺りの歴史は、機械翻訳で”hot dog”が「熱い犬」と翻訳されてしまうことに翻弄された、という自動翻訳の歴史と似ている部分があるかもしれません。

文字データ化の精度は、文字認識率や識字率などで比較することができます。2018年では、OCRの文字認識率は98%とも99%ともいわれるほどです。活字と手書きの違い、文字の濃淡、大きさ、レイアウトなどで、精度は異なると予想できます。しかし、人間が手入力しても入力ミスや変換間違いなどは起こり得る上、おそらくこの先も100%に達することは難しいと言われているため、精度としては十分な範疇だと言われています。その上、機械なら目の酷使や手の使いすぎなどの疲労とは無縁です。人間なら集中力の低下や疲労の軽減のために一定時間ごとに休憩を取ることが望ましいですが、機械ならそのような心配もいりません。

ペーパーレス化の一助となるOCRは不可欠な技術

オフィスのペーパーレス化、電子化が叫ばれるなかで、その核となる技術がOCRです。今後も改善され続けた場合、どれほどの精度になるとのでしょうか。2018年現在ですら98%や99%との数字が出ていることから、あとはコンマいくつの世界で、いかに100%に近づけるかが課題です

手書きの文字はどの程度まで読めるのかも気になるところです。たとえば、アルファベットの大文字や小文字は一文字ずつ丁寧に書かれていればほとんど正確に読み取ることができます。しかし、つながった筆記体になると認識が難しくなるともいわれています。手書きパッドなどでは筆跡を感知して筆記体でも正しく入力できるものもありますが、文字の切れ目のない筆記体では認識が困難なのは想像に難くありません。

では、日本語の癖のある手書き文字はどうなのでしょうか。

一般的な日本語の文書は、漢字、ひらがな、カタカナ、英数字、記号などが混在するため、手書きの文字をOCRで読み取って正しい文章で出力するのは高度な技術が必要です。しかし、AI OCRサービスを展開しているAI inside社では推論アルゴリズム、学習アルゴリズムなどを駆使して、ひらがなとカタカナおよび第一・第二水準の漢字約6,000文字の平均文字認識率が99.91%であると発表しています

ここまでの認識率があれば、他人が書いた癖字などに時間をかけて読み取って手入力するよりも、圧倒的に早く書類をデータ化することが可能です。ほんの少し人の手を加えるだけで、簡単に書類のペーパーレス化が実現するでしょう。文字認識率が高まり行き着くところまでいけば、あとは文字変換にかかる時間をどこまで短縮できるかを競うことになるでしょう。

また、OCRもそれぞれが得手不得手とする分野が異なるため、複数のOCRを組み合わせることで精度を向上させる、という手法なども実用化されています。

いずれにしても、定型様式の手書きの届け出用紙や伝票などを文書スキャンしてあっという間に電子化できるため、公的機関や民間を問わずさまざまな業種で幅広い利用が可能になります。もはや社会ではOCRは必要不可欠な技術であることは間違いないでしょう。

続いては、書類を電子化するメリットについて考えてみましょう。

 
解明!OCRが重要視されている理由とは?
書類が電子化されるとどんなメリットがあるのか?

1 2 3

データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

データのじかん会員なら、
全てのコンテンツが
見放題・ダウンロードし放題
データのじかん会員でできること
  • 会員限定資料がすべてダウンロードできる
  • セミナー開催を優先告知
  • 厳選情報をメルマガで確認
会員登録する
データのじかん会員について詳しく知りたい方
close close