どんな帳票が向いてる?General OCRの特徴

2025.01.09

 

こんな人に読んでほしい!

・面倒な設定をせずにAI-OCRを使いたい
・帳票内の文字情報をすべて文字起こししたい
・表形式のままデータ化したい

本記事では、 General OCRの特徴や料金、導入事例をご紹介します。

 

 


< 目次 >

・General OCRとは
・どんな帳票が向いているか
・General OCRが苦手なこと
・ご提供方法
・料金プラン

 



General OCRとは

General OCR(非定型OCR)は、文章様式を問わず、帳票全体から全文認識 / 表抽出が特徴のOCRモデルです。

読み取り項目の指定など事前登録は不要で、読み込んだ帳票内にあるすべての文字をデータ化したいときに最適なAI-OCRです。

 

どんな帳票が向いているの?

・画像や文章からテキストを抽出したい場合

・テキストだけでなく、帳票内の表の形式をそのまま抽出したい場合

 

例えば

・各種会計書類(現金出納表、通帳、収支計画表等)

・注文書や見積書、納品書

・様々な非定型の帳票(書籍、台帳、不動産の物件概要書etc..)

手書きでも活字でもなんでもデジタル化可能です。

画像や手書き文章からもテキストを抽出でき、万が一ミスがあった場合も感覚的に加筆修正することができます。

またテキスト抽出と表抽出も同時にできます。
読み取りたい帳票が定まっていない場合におすすめできるOCRです。



General OCRが苦手なこと

General OCRは、さまざまな様式の文書に対応していますが、苦手なこともあります。
どのようなものが苦手なのか、読み取りづらいのか具体例を見ていきましょう。

①「縦読み・横読みが混在している書類」

縦読みと横読みが混在する書類がうまく読み取れません。
どちらかの読み取り方に固定して出力するため、例えば郵便番号などが横で住所が縦に記載されているハガキなどは上手く読み取れない可能性があります。

②「1行の途中で改行が入る書類」

1行ずつ全て電子化するため、1行の途中で改行が入る場合は上手く読み取れません。
例えば上の画像のような書類を、果物グループと都道府県グループで分けて読み取ることが難しいです。片方を読み取る際にもう片方をマスキングするなど、対処が必要です。

 



ご提供方法

ご提供方法は、APIとReaderの2つご用意があります。

自社のご利用環境にフィットする方法でご利用いただくことが可能です。


料金プラン

開発不要のプランと、APIのみ提供する開発が必要なプランです。