Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

OCRの精度を上げる7つのコツと文字認識に影響を与える要素を解説

OCRの精度を上げる7つのコツと文字認識に影響を与える要素を解説

世界的にDXが積極的に行われ、日本でもデジタル技術の導入・活用によって業務効率化を実現する企業が増えています。業務効率化を実現するデジタル技術にはさまざまなものがありますが、そのなかでも注目を集めているものがOCRです。

OCRは光学文字認識技術を通じて、書類や手書きメモのテキストをデータ化するツールですが、いくつかの理由によって正確に読み取れないことがあります。

そこでこの記事では、OCRの認識精度を上げるコツと影響を与える要素について解説します。OCRはどのように文字を認識するのか基本的な仕組みから解説していますので、導入検討の際はぜひ参考にしてください。

OCRが文字を認識する仕組み

まずはOCRが文字を認識する仕組みについて理解しておきましょう。具体的には下記5つの手順で行われます。

画像入力

まず、テキストデータ化したい書類を撮影します。撮影の際は、スマートフォンやスキャナー付きプリンター、デジタルカメラなどを用意しておくとスムーズです。撮影したデータをパソコンに共有した後は、パソコン内でPDFやJPEGなどの画像データに変換し、OCRに読み込ませます。

前処理

次に前処理としてOCRに読み込ませた画像データのレイアウト解析を実施します。どこからどこまでがテキストでどの部分は画像、テキストに見出しや罫線があるといった、データに含まれたあらゆる構造を解析します。

文字認識

次に解析したテキスト領域から1文字ずつ認識・画像に変換していきます。その後、1つの画像がどの文字を表しているのか特定を進めます。

修正(補正)・解釈

解析した文字は、次に辞書機能との照合や前後の文字とのつながりなどをみながら修正・補正を行います。なお、この工程は時間が掛かるように思われますが、光学文字認識技術における一連の流れのひとつにあたるため、資料を読み込んだ後は速やかに実施されています。

テキスト化

最後に解析したデータをテキストデータとして処理し、出力されます。なおOCRツールによっては、読み込んだ書類のレイアウトをPDFに切り替えた上で再現できるものも存在します。

関連記事:OCRにはどんな機能がある?AI-OCRとの違いや導入手順について解説

OCRの認識精度に影響を与える主な要素

主に5つの工程で行われるOCRによる資料のテキストデータ化ですが、認識精度を下げてしまう要素はどのような項目が挙げられるのでしょうか。具体的には下記4つの要素が考えられます。

文字の質

OCRの文字に対する認識精度は、読み込ませる文字の質と大きく関係しています。例えば比較的新しい書籍と昭和時代に発刊された書籍では、紙や文字の印刷濃度などが大きく異なるため、古い書籍の方が認識精度は低くなる傾向にあります。

また、印刷がかすれていると、OCRが文字の輪郭を正しく認識できず、誤認識につながりやすくなる傾向があります。

レイアウト

資料に記載された文字の種類やレイアウトによってもOCRの認識精度は左右します。基本的に資料の文字フォントやレイアウトはOCRツールが標準的なものに最適化していることが多いですが、ツールによっては非対応により認識できない場合もあります。

記号・特殊文字

OCRは標準的な英数字の認識に対応しているものの、特殊文字および記号については認識できない場合もあります。また、数字記号や数式についても、一般的な英数字と違う形状であるために、認識精度に影響を与えることも少なくありません。

このほか「¥」「$」「€」をはじめとする環境依存文字、著作権マークの「©」、登録商標を指す「®」なども認識できない場合があります。

OCRソフト・ツール

使用するOCRソフト・ツールでも認識精度に影響を与えることもあります。そもそもOCRには認識アルゴリズムが搭載されていますが、ツールによってタイプが違うために性能も左右されます。詳細については後述しますが、AI技術を搭載したOCR、いわゆるAI-OCRであれば従来のOCRと比べて高い認識精度に期待できます。

OCRの精度を上げる7つのコツ

OCRの認識精度は、テキストデータ化したい資料やそのなかに記載されている文字の質、さらには使用するツール・サービスなどで低下する場合があります。では、OCRの認識精度を上げるためにはどのような工夫が求められるのでしょうか。ここからは認識精度を上げる7つのコツについて解説します。

解像度を上げる

最初に試してほしいコツとして挙げられる方法が、解像度の変更です。仮にテキストの一部が潰れてしまい正しく認識されないときは、スキャナの解像度が低い可能性が考えられます。解像度を上げると、細かな文字や文字そのものの輪郭が鮮明になるため、どの画像がなにを表しているのかOCRでの解析がしやすくなります

文書だけで作成されたモノクロ印刷書類であれば200dpi以上に、画像があり、カラー印刷された書類であれば400dpi以上に変更してみると、認識精度に向上がみられるかもしれません。

ノイズ除去・シャープニングを試す

読み取り画像に書類にはない線や点などのノイズが写った場合は、改めてスキャンする、あるいは編集ソフトを活用してノイズ除去を実施しましょう。

また、画像全体にシャープニングを行うことで文字1つひとつの輪郭が明確になるため、認識精度に向上がみられることがあります。

傾き・余白を調整する

正しくスキャンしたにもかかわらず、テキストデータが傾いている、あるいは余白が多いといったときは、改めてスキャンする、あるいは編集ソフトを活用して画像の傾き補正、余白の調整を行いましょう。この方法によって認識精度が向上することがあります。

カラー設定を見直す

OCRにテキストを読み込む場合、基本的に背景色は白です。しかし、赤や黒、黄色などカラー印刷された書類は認識精度が低下する場合があるため、読み込む前に背景色を白に変更しましょう。

また、書類の文字色も白背景に黒の構成が望ましいため、認識精度が気になるときはカラー設定から調整することをおすすめします。

高性能スキャナを導入する

スキャナそのものの性能が低いためにノイズや潰れ、線や点が入ることもあります。古いスキャナの場合、細かな文字や複雑なレイアウトを読み込めない場合もあるため、OCRを活用し業務効率化を実現させたいのであれば、この機会に新しい高性能スキャナの導入を検討しましょう。

文字部分のみ読み込む

文字列、画像、イラストが書類一面に点在している場合、画像を文字列、文字列をイラストとして認識してしまう場合もあります。このような状態を防ぐためには、書類全体をそのまま読み込ませるのではなく、データ化したい部分だけを読み込むよう調整してみましょう。

厚めの紙などを使い不要な場所を隠す方法でも認識精度が向上する場合があるので、ぜひ試してみてください。

特定の色を避ける

特定の色を避けてスキャンする方法でも認識精度が向上する場合があります。例えば、黒い背景で白色の文字が印刷された書類であれば、白と黒を反転させるなどです。この方法によって文字・背景のコントラストが鮮明になり、認識精度が向上します。

OCRの精度向上を妨げる環境要因

OCRの認識精度を向上させるコツを試してみたものの、改善がみられなかった場合もあるでしょう。認識精度にあたっては機器的な問題だけでなく、OCRを使う環境にも要因が潜んでいることが少なくありません。ここからはOCRの精度向上を妨げる現実的な環境要因について解説します。

導入コスト

導入コストによって精度の向上が妨げられる場合があります。書類をスキャンする際、あらかじめ画像編集や加工を済ませておけば認識精度は向上しますが、事前に編集ソフトやアプリケーション、適切な機材を準備しなければなりません。

必要なツール・機材をすべて用意するとなれば高額な費用が伴うため、費用の捻出が難しい企業にとっては精度向上の妨げにつながる環境要因といえるでしょう。

多様なビジネス書類

多様なビジネス書類をOCRでデータ化したいといった目的が認識精度を低下させている可能性も少なくありません。

書類と一口にいっても、定型、非定型、手書きなど、さまざまな書類が存在します。A4やA5など、サイズが異なる書類もあれば、小さな付箋に書かれたメモなどもあるでしょう。これらをスキャナで取り込みOCR処理した場合、意図とは異なるフォーマットでデータ化されたり、テキストが認識されなかったりすることがあります。

ビジネス書類には、背景が白のものもあれば赤い背景を用いた広告などもあることから、すべてを高品質なデータにしたいと考えるほどスキャン環境の改善では対応できなくなることが予想されます。

デジタル人材の不足

認識精度の向上を図るため、最新の編集ソフトやアプリケーションを導入したとしても、実用化できるまでの環境が整っていなければ活用は困難です。例えば最新のテクノロジーについて理解しているデジタル人材が不足している場合、機器を適切に使用すること自体が難しくなります

ビジネスシーンにはAI-OCRがおすすめ!

ビジネスシーンでの書類のテキストデータ化には、最新のOCRであってもいくつかのコツを取り入れながら対応していく必要があります。解像度の変更や編集ソフトによる調整などをしなくても高精度なデータ化を目指したいときはAI-OCRがおすすめです。

AI-OCRとはAI技術を搭載したOCRツールのことで、AIがテキストや画像を認識するため、OCRと比べても高度な認識精度でデータ化をスムーズに行えます。

また、カタカナの「エ」と工業の「工」の場合、OCRでは誤って認識することがありますが、AI-OCRであれば数回学習を重ねることで認識しやすくなります。AI-OCRについては以下の記事で解説していますので、ぜひ併せてご覧ください。

関連記事:AI-OCRとは?OCRとの違いやメリット・デメリット、製品の比較ポイントを解説

業務効率化はRPA×AI-OCRで実現可能

AI-OCRの特徴は、OCRと比較して認識精度が高く、学習を通じて文字を認識しやすくなるだけではありません。自動化ツールのRPAとの組み合わせによって、読み取ったテキストデータをExcelやWordなどのドキュメントに自動入力することも可能です。

顧客アンケートの答案用紙やFAX送信された資料なども、AI-OCRとRPAを組み合わせることで入力の自動化を実現できます。

RPAとは 

自動化ツールを指すRPAとは、ソフトウェア開発されたロボットを使ってパソコン上の定型業務を自動化する技術のことです。マウス・キーボード操作で行われる基本操作を記録させることでロボットが代わりに実行し、人件コストの削減、業務負担の軽減などに期待できます。RPAについては以下の記事で詳しく解説していますので、興味のある方はこちらもご覧ください。

関連記事:自動化ツール(RPA)とは?おすすめの16種類や選び方、導入の注意点を解説!

AI-OCRを導入するならPeaceful Morning

OCRとは違い、AI技術によって高度な認識精度を実現できるAI-OCRの導入検討を進める場合は、Peaceful Morningにお気軽にご相談ください。Peaceful Morningでは単なるツール紹介にとどまらず、AI-OCRの選定から理論上100%の精度を目指すテキスト化支援までトータルでサポートしています。

自社に最適なAI-OCR導入を成功させたい方は、ぜひ一度公式サイトからお問い合わせください。まずは無料のトライアルや効果検証から導入検討を開始頂くことが可能です。

デジタル人材の確保もお任せ!

Peaceful Morningでは、素早いデジタル人材の確保を実現させるサービス「DX Boost」を提供しています。OCRやAI-OCR、生成AIやRPAなどはいずれもDX推進に有効なデジタル技術ですが、デジタル人材が欠けていては実用化が難しいです。早急にデジタル人材を確保し、自社DXの推進を加速させたい企業担当者様は、この機会にDX Boostを活用しながらOCR、AI-OCRの導入・実用化を目指しましょう。

https://dx-pro.net/boost/

まとめ

OCRの認識精度は、読み込む書類や文字の質、レイアウトなどに影響されやすい特徴があります。書類を正確に読み取りながら業務にスピード感を持たせたいときは、AI技術を搭載したAI-OCRの導入を検討し、将来的にはRPAでテキストデータの自動入力を目指すことで、今以上の業務効率化を実現できるでしょう。

OCRやAI-OCRの導入に際しては、この機会にお気軽にPeaceful Morningへご相談ください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です