AI OCR

業務処理の自動化も重要ですが、紙媒体の帳票のデータ化もどうにかしてほしいというのが事務処理担当者の心の声でしょう。

以前からOCRはありましたが認識率が今一つで、活字はともかく手書きの文章となると半分も識別してくれませんでした。
私はFAX-OCRの開発でソフトハウスと協力していたこともあり、かなりの数のOCRパッケージのテストを行いましたが、ソフトハウスの公表している識字率には全く及ばず、誇大広告か詐欺かと思ったものです。

しかし、その認識も一変しました。
約20年で確実にOCRは進歩しました。
過去の製品に比べると驚くほどの認識率です。
枠から文字がはみ出していても、AI機能で補正して識別しているようで、ミミズののたくったような文字から丸文字や崩れた文字、達筆すぎる文字まで結構識別してくれます。
(かと思うと数字の読み落としとかあったりして、以外に思うのですが・・・)

今回試したのはAI inside 株式会社の「DX Suite」というクラウドのOCRサービスです。

大手の企業も多数利用している、現在OCRシェアNo1のサービスです。

この 「DX Suite」というクラウドのOCRサービスですが、単にOCRで文字を読み取るだけでなく、読み取った後の文字に対して自動で文字列の抜き出しや置換をしたり、読み取った複数の文字列をくっつけて別の文字列として出力したり、自動で成形する機能を持っています。
つまり、あとでテキストエディタ等で取り出した文書を開いて、手作業で修正を掛けるという手間が必要なくなるのです。
これ、ものすごく便利な機能です。

また、請求書や納品書といった各会社毎に独自のレイアウトをもったうっとおしい帳票も、DX Suiteはマルチ帳票という機能でAIが自動で読み取る項目を抽出してくれます。
しかもレイアウト作成が不要。項目を指定するだけです。
まさにAIの名にふさわしい。
・・・残念なのは、意外と識別できないケースがあるということ。
でも識別率が低い帳票のみ、専用の読み取り設定を用意すればいいだけです。大きな問題じゃありませんね。

読み取りデータのベリファイ画面。実際の文字列と認識した文字列が表示されています。

高機能なのはいいのですが、初期費用や月額利用料が結構お高く、小規模企業ではなかなか導入に踏み切れない高額商品だったのですが、最近小規模企業でも利用してほしいということで、初期費用が無料で月額も30,000円(6,000リクエストまで無料、以降1リクエスト当たり3円。※1項目の読み取りが1リクエスト)というLiteプランが導入されました。(※帳票設定サービスなどがなく、一部のサービスが制限されています)
請求書だと最低限で10項目程度になるので、月額費用の無料枠で月間600枚程度処理できるという換算になります。
StandardプランのとLiteプランの損益分岐点は、月間約30,000~40,000リクエストあたりでしょうか。(Standard、Proプランはチェックボックスの読み取りリクエストコストが低くなるので、チェックボックスを多く取り込む帳票やアンケートなどが多い場合は Standard、Pro プランのほうがいいかも)

そんな感じであれこれ考えながらいろいろと読み取りを試してみましたが、ひとつ大きな点に気が付いてしまった。

これ、縦書きの認識できないらしい・・・
ちょっと残念

業務で縦書き文書なんてほとんどないと思いますが・・・
今後に期待したい。

OCRで読み取ったデータはCSVファイルとしてダウンロードが可能。
全て自動で処理するのではなく、人の目でデータの照合をすることも可能でその場で修正も出来るので、状況によって使い分けることも可能です。
また、読み取り対象帳票のアップロードやCSVデータのダウンロードなどはAPIで実行できるので、他のアプリやプログラム、RPAなどからコントロール可能ですので、一連の業務を全て自動化することも可能です。

帳票データを人の手で読み込んで手入力となると結構な工数を取られますが、このDX Suiteだとあっという間に完了できますね。
これで工数削減⇒人件費削減ができるという訳です。

これまでの業務で蓄積された手書き帳票の山を、この機会に一気にデジタルデータ化してしまいましょう。

読み取りフォームの作成やデータ加工設定などでお困りの場合は是非ご相談ください。

Leave Comment