近年、業務効率化の手段としてRPAやIoT技術を使うように、「人工知能(AI)」を活用する事例が増加しています。その中でも今回は、OCRにAIの深層学習機能を組み合わせた「AI-OCR」とAI-OCR市場シェアNO.1の「DX suite」について紹介していきます。
AI-OCRを利用することで、アナログに紙媒体にまとめられているデータをデジタルデータに変換することができ、その後の業務改善に必要な土台を整えることができます。「業務改善、自動化を始めたいけれど何から始めていいかわからない…」という方は本記事と現状を照らし合わせて最初にすべきことを確認してみてください。
目次
AI-OCRとは
「AI-OCR」とは、端的に表現すると「AIを用いて画像から文字を高精度で抽出する技術」を意味します。この技術は、画像データから文字を抽出しテキストデータへと変換する光学文字認識技術である「OCR(Optical Character Recognition/Reader)」と人間の知的機能を人工的に再現する「AI技術」の組み合わせであり、テクノロジーを用いた業務改革を意味する「デジタライゼーション」が求められる現代社会において、業務効率化の手段として注目を集めています。
しかし一体なぜ、OCRとAIを組み合わせる必要があるのでしょうか。これら2つを組み合わせる目的はOCRの弱点をカバーし、より人間の単純作業を減らすことです。
OCRの弱点
従来のOCRは、上述の通り「画像データに含まれる文字情報を抽出しテキストデータに変換する」という技術でしたが、「画像データのどの部分に文字が含まれるか」、「文字情報の意味上の区切りはどこか」などといった「判断」については、人間があらかじめフォーマットとして定義しておく必要があり、あらかじめ定義されたフォーマットに当てはまらない文書や、形が崩れた手書き文字などの画像データについては、正確に文字を抽出できないなど、柔軟性に欠けるという弱点がありました。
また識字率も高いとは言い難く、技術としては革新的であるもののこれらの弱点が浸透を妨げていました。
AI-OCRの強み
これらの弱点を補うべく登場したのがAI-OCRです。
AI-OCRは、従来のOCRにおいて人間が行なっていた「判断」という処理を人工知能・AIによる「機械学習」「深層学習」に置き換えることによりOCRの弱点を克服しました。AI-OCRにおいては、AIが自らフォーマットを識別することで、従来のOCRでは扱えなかった手書きや非定型の文書をはじめ、画像データのテキストデータ化を実現しています。
またAIは深層学習機能を有しているので、誤った文字認識を行なった場合でも、その間違いを「学習」することにより、文字認識の精度を自ら向上させることができます。AI-OCRは従来のOCRと比較して、より幅広い文字認識をより高精度で実現する点が強みと言えます。
AI-OCR導入のメリット
OCRの弱点をカバーし、精度の高いAI-OCR。続いてはAI-OCRの「画像データに含まれる文字情報を自動でテキストデータ化する」という機能が、実際の業務においてどのように役立つかを解説します。
作業の効率化
AI-OCRを導入するメリットとして、業務効率化ツール全般に当てはまることですが効率化が図れる点が挙げられます。
AI-OCRは紙資料の入力作業などの単純業務を人間の代わりに行います。こうした単純作業を中心とする業務を人間が行う場合、時間の経過とともに集中力は低下し、作業効率が減少してミスが生じやすくなります。
AI-OCRはAIの学習による最適化でデータの読み取りミスは少なくなり、入力ミスも生じにくい上に、体力に限りのある人間とは異なり、24時間365日休まずに作業をし続けることができます。そのためAI-OCRの導入により作業効率・精度の向上が期待されます。
ペーパーレス化
現代社会において、情報管理の効率化や省エネ志向の高まりから業務のペーパーレス化が推進されています。A4サイズの紙資料1枚に日本語1,200文字分の情報を記録できるとすると、これを電子化した場合の容量は約2,400B(バイト)であり、1GB(ギガバイト)のUSBメモリにはA4用紙400,000枚分以上の情報を記録することができます。
このように、情報の保存媒体を紙から電子化することで紙のコストや情報の管理コストなどを大幅に削減することができます。DX(デジタルトランスフォーメーション)が注目される今日の社会において、業務のデジタル化は大前提であり、紙やその他の画像内の文字データを速く、正確に電子化・文字データ化できるAI-OCRは、企業のデジタル化を大きく進めるきっかけとなりうる技術です。
注目のAI-OCR製品、DX suiteとは?
AI-OCRの概要、導入メリットを掴んでいただけたでしょうか。続いて、AI-OCR製品の紹介をしていきます。本記事で紹介するのは、AI inside株式会社が提供しているDX suiteです。
DX suiteとはデロイト トーマツ ミック経済研究所株式会社が2021年に発刊した 「ニューノーマル時代にAI OCRで拡大するOCRソリューション市場動向 2021年度版」の中でOCRベンダーのソフトウェアライセンス売上のうちクラウド売上のシェアNo.1を獲得したAI-OCRです。
契約件数2000件以上の実績を持ち、業種、業態、企業規模を問わず幅広い企業に採用されています。本記事に辿り着いた方にとっても導入を考えているツールの1つなのではないでしょうか。
次はDX suiteの特徴・詳細を見ていきます。
DX suiteの特徴3つ
Intelligent OCR
DX suiteの1つ目の特徴は精度の高さです。先ほど、OCRの紹介にて読み取る書類を予め人間がフォーマット化する必要があると述べましたが、DX suiteでは手書きはもちろん、FAXや写真で撮影した帳票、訂正印やチェックボックス、修正の際の二重線などが含まれていても高精度で認識意することができます。
この鍵を握るのが高精度文字認識エンジンである「Neural X」です。手書き文字を高精度でデジタルデータに変換することに加えて、深層学習・自動学習機能により精度は継続的に向上し続けます。こういった高精度・高機能なツールを特別な知識なくクリックのみで使いこなせる気軽さも魅力的です。
書類画像のアップロードと読み取り結果のダウンロードはAPI連携が可能なので、RPAやアプリケーションとシームレスに連携して効率化を図ることができます。
Full Page OCR
Full Page OCRとは事前に読み取り枠を設定することなく、帳票をまるごと読み取る機能です。帳票のフォーマットが異なっていてもまとめて読み取りにかけることができ、AIが全ての文字を自動で認識するので、読み取り後に出力したい項目を選択するだけで簡単にテキストデータ化出来ます。
この機能は図面や仕様書をはじめ賃貸借契約書や健康診断書、履歴書などさまざまな帳票のテキストデータ化に対応している他、OCRでは難しかった縦書きの帳票も読み取ることができます。出力に関しても、CSVやPDFなど出力形式をを変更できるので、それぞれの用途に応じて使い分けることが可能です。
単体でもこれほど無く効率的な機能に見受けられますが、こちらもAPIによる他システムとの連携に対応しているので、RPAと組み合わせて業務全体で効率化に取り組めます。
Elastic Sorter
Elastic Sorterは一括でアップロードしたドキュメントをAIが自動で仕分けしてくれる機能です。仕分けた書類を種類ごとに分割ダウンロードしたり、デジタルデータ化することも可能です。設定も不要ですぐに使い始めることができるだけでなく、前で述べたIntelligent OCRやRPAとのシームレスな連携も可能なので、気軽に効率化を図ることが出来ます。
DX suiteの価格
DX suiteでは3つの料金プランが用意されています。
リクエストとは読み取り指定をした箇所のことです。漢字、平仮名、カタカナ、アルファベット、数字などが「文字あり」、チェック項目や空白が「文字なし」としてカウントされます。無料枠を超過した場合、従量課金が発生します。
1ヶ月間のトライアルも用意されています。事業の規模によってトライアルの有無やプランを選択するのが良いでしょう。
RPAとの上手な連携の仕方
高精度AI-OCR、「DX suite」の機能や価格についてご理解いただけましたでしょうか。
特徴の説明の際にも述べましたが更なる効率化を図るためにはRPAを始めとする他のアプリケーション、システムと連携することが有効です。今回はRPAを例に挙げて、どのように組み合わせるのかイメージを掴んでいただきたいと思います。
RPAは、データをある場所に転記・別のシステムに入力するなどの単純作業を自動化してくれます。しかし、データがデジタル化されていない、つまり紙に書かれている状態では自動化が実行できません。実際に業務効率化や自動化が求められている現場を覗いてみると、紙媒体の資料や書類が溢れており、単にRPAを導入するだけでは効果を得られない可能性が高いです。
そこで自動化の前段階となる紙媒体からデジタルデータへ変換する作業に、AI-OCRを利用します。AI-OCRによって高精度で文字データをデジタルデータに変換、デジタルデータに基づき元々手動で行っていた単純作業をRPAが自動化、といったように一連の作業の自動化が可能になります。
更に、AI-OCRへのインポート作業やCSV出力作業をRPAが担うこともできます。このように2ツールの連携は相乗効果をもたらすので、事務作業を一括して自動化したい方は、AI-OCRと合わせてRPAの導入も検討してみていいかもしれません。
業務効率化を促進するAI-OCR
今回はAI-OCRの基本的な情報・AI-OCR製品でも人気の高いDX Suiteについて紹介いたしました。AI-OCRはAIによる「深層学習」の特徴を活かしてOCRでは実現出来なかった高度な読み取りを行う技術ということはご理解いただけましたか。
最近DXという用語を耳にすることが増えましたが、DX(デジタルトランスフォーメーション)は段階で言うと3段階目に該当します。1段階目にはアナログデータのデジタルデータ化を指すデジタイゼーション、2段階目には個別の業務プロセスの自動化を指すデジタライゼーションが存在します。
職場環境を見渡し、紙媒体の資料が溢れていると感じられた方は、まずはデジタイゼーションに取り組んでみてはいかがでしょうか。デジタルデータとしてデータが整理されれば、次はRPAと連携させてデジタライゼーション、といったように各段階を適切に踏んで組織横断的なデジタル化に向かっていきましょう。
コメントを残す