請求書をAI OCRとオペレータ確認を組み合わせて正確にデータ化するinvoxの仕組み
目次
invox受取請求書の請求書データ化の仕組み
invox受取請求書による請求書のデータ化は「レイアウトの認識」と「文字の認識」の2工程で行います。
オペレータ確認ありの場合、それぞれの工程でオペレータが確認し、必要に応じて補正することで99.9%以上の精度を保証しています。
レイアウトの認識
invox受取請求書に請求書をアップロードすると、請求書のどの部分にどのような情報が記載されているか、AIがレイアウトを推定します。
テクノロジーの進化によってAIの精度は向上していますが、日本の請求書は多種多様なレイアウトが存在し、90%前後の推定精度というのが現実的な数字です。
そのため、特性が異なる複数のAIでレイアウトを解析することに加え、AIが推定したレイアウトをオペレータが確認、必要に応じて補正を行っています。
文字の認識
次にレイアウトの認識で推定したエリアに書かれてる文字を認識します。
OCR(Optical Character Recognition、光学的文字認識)という技術で行い、AIと同じように複数のOCRを用いることで精度を高めています。
OCR精度が低い箇所や、整合性チェックでエラーになった部分についてオペレータが確認・修正を行い、効率的に高精度なデータ化を実現しています。
学習の仕組み
invox受取請求書のAIは、毎日の請求書データ化によってオペレータが補正したレイアウトデータを教師データとして再学習しています。
請求書のどの部分にどのような情報が記載されているか、画像とレイアウト情報を教師データとして用意し、AIに教師データを与えて学習、請求書のレイアウトを推定できるモデルが生まれるという循環で、日々AIが進化していきます。
invox受取請求書の特徴
invox受取請求書の特徴をデータ化項目・精度、確認のしやすさ、業務との適合度、新制度への対応、データ化に要する時間という5つの観点で説明します。
invoxやバクラク、TOKIUMなど受取請求書の業務自動化サービスの比較で各社の特徴を比較しているため、あわせてご覧ください。
データ化項目・精度
invox受取請求書は、支払と計上に必要十分な項目を正確にデータ化します。
標準の請求書のデータ化項目は「発行者名・請求日・支払期限・支払先口座・請求金額・税区分ごとの金額の内訳」です。
また、AI OCRによって「請求書番号」「件名」「請求明細」などをオペレータ確認なしでデータ化します。
確認のしやすさ
請求書が正しくデータ化されているか確認する作業は、請求書をデータ化する入力業務に次いで時間がかかる工程です。
紙の請求書とパソコンの画面を行ったり来たり確認するのは効率が悪く、見落としも生じやすいため、invoxは請求書原本の画像とデータ化の結果を同じ画面に並べて見比べられるようにしています。
また、確認が必要なポイントを強調表示するなど、確認を補助する機能も豊富です。
業務との適合度
仕訳を計上するには、部門やプロジェクト、勘定科目など請求書に記載されていない情報が必要です。
invox受取請求書は、請求処理業務全体の業務フローとデータ化フローを考慮して設計しているため、業務にフィットし、確実な効率化を実現できます。
新制度への対応
令和元年に導入された軽減税率制度や、令和5年に導入されたインボイス制度(適格請求書等保存方式)など、制度変更によって新たなレイアウトの請求書が登場すると、AIだけでは対応が困難です。
invox受取請求書は新たなレイアウトの請求書が登場してもオペレータが確認を行うため、すぐにAIが再学習し、新制度の導入に柔軟に対応できます。
データ化に要する時間
invox受取請求書は99.9%以上の精度を保証するオペレータ確認ありの場合は数時間〜3営業日でデータ化、精度保証のないAI OCRによる即時返却の場合は10秒前後でデータ化します。
精度を重視するか、スピードを重視するか、普段は精度を重視するが締め日が近づいたときだけスピードを優先するなど、状況に応じてお選びいただけます。