パスポートOCR
パスポートOCRは、画像内のパスポートの位置と角度を自動で認識し、記載事項をOCR処理でテキスト化するソフトウェア開発者向けのツールです。DLL(ダイナミックリンクライブラリ)で提供します。
このエンジンで読み取るのはパスポートの下部の「機械読み取り部分」に書かれている文字です。この文字は国際民間航空機関(ICAO)で国際標準化されており、44桁2行で構成されています。
特徴
入力コストの削減 | 専用機器を使用しない |
---|---|
パスポート画像を認識エンジンに渡すだけで記載事項を取得することができます。取得した内容は項目ごとに分解して取得することができます。 読み取る項目は、型/発行国/旅券番号/姓名/国籍/生年月日/性別/有効期間満了日です。 |
パスポート専用のイメージスキャナ/バーコードリーダーを使用することなく、記載事項をOCR処理で読み取ることが出来ます。スマートフォンやタブレットのカメラ、デジタルカメラ、また一般的なイメージスキャナでスキャンした用紙、FAXされたパスポートの画像から記載事項を取得することができます。 |
画像の切り出し | チェック機能 |
OCR処理で認識した各項目の文字の範囲で切り出した画像を出力することができます。方向認識により回転したパスポートの全体画像も出力できます。 | OCR処理で取得した情報に誤りがないかをチェックする機能を搭載しています。パスポート用のチェックディジット(誤り検知用の数字)により誤りがある情報を自動で見つけます。 |
読み取り項目
以下は、OCR処理で自動で読み取る項目です。
項目名 | 取得例 | 概要 |
---|---|---|
型 | P | 文書の種類。パスポートの場合 Pです。 |
発行国 | JPN | 日本の場合 JPNです。 |
姓 | YAMADA | 所有者の苗字です。 |
名 | TARO | 所有者の名前です。 |
ミドルネーム | 所有者のミドルネームです。無い場合は空文字です。 | |
旅券番号 | XS1234567 | 9桁の番号です。 チェックディジットで論理検査ができる項目です。 |
国籍 | JPN | 日本の場合 JPNです。 |
生年月日 | 800220 |
YYDDMMで書かれています。YYは西暦の下2桁の情報を格納されており、1900年と2000年の区別はできません。 チェックディジットで論理検査ができる項目です。 |
性別 | M | 男性の場合M 女性の場合Fです。 |
有効期間満了日 | 3000622 | YYDDMMで書かれています。YYは西暦の下2桁の情報を格納されています。 チェックディジットで論理検査ができる項目です。 |
パスポート画像の例
パスポートOCRエンジンで認識できる画像の例を紹介します。
以下は、パスポートをカメラで撮影した画像のイメージです。なるべく真上から撮影し、パスポート下部の「機械読み取り部分」が鮮明に写っていれば認識が可能です。パスポートの方向は自動で補正します。
次の例は、パスポートが貼り付けられている用紙をイメージスキャナ/FAXなどで画像にしたものです。パスポート部分を自動で検出し、認識することが可能です。
最後の例は、パスポートの「機械読み取り部分」だけを撮影した画像のイメージです。このエンジンは、「機械読み取り部分」を使って位置と方向の検出と文字認識を行うので、ほぼ真上から撮影し、文字が鮮明であれば認識することができます。
動作環境
OS | Microsoft Windows 7 Microsoft Windows 8 Microsoft Windows 10 |
---|---|
メモリ | 512MB以上 |
ハードディスク | 100MB以上 |