請求書を99.9%正確にデータ化する仕組み

請求書のデータ化

請求書のデータ化は、一般的に「1.レイアウトの認識」と「2.文字の認識」の2つの工程で行われます。

レイアウトの認識

1.レイアウトの認識

文字の認識

2.文字の認識

「1.レイアウトの認識」ではレイアウトを解析し、必要な情報が書かれているエリアを認識します。
ここ数年のAIの進化により精度が向上している部分ですが、おおむね90%前後の精度というのが現実的な数字です。

「2.文字の認識」では、1で特定したエリアに書かれてる文字を認識します。
こちらはOCR(Optical Character Recognition、光学的文字認識)という技術で以前から取り組まれている部分で、精度も「1.レイアウトの認識」より高くなります。

これら2つの工程の精度をかけわせた結果が全体の精度となりますが、仮にレイアウトの認識率を90%、文字の認識率(項目単位の正解率)を99%とした場合、全体の精度は下記のようになります。

一般的な請求書OCRの精度

精度が81.3%だと100枚のうち19枚はどこかが間違えていることになり、業務で利用するのは難しい状態です。

invoxは、業務で利用可能な99.9%の精度を実現するため「AIが推定したレイアウトの補正」と「OCR精度の低い箇所や整合性チェックでエラーとなった部分の確認・修正」を行い、効率的に処理を行いつつ高精度なデータ化を実現しています。

取引先からどんな形式の請求書が届いても、
めんどうな請求処理のアナログ業務をぜ〜んぶ自動化!
invoxを無料で試す