CLOVA OCR使用ガイド

CLOVA OCRサービスを用いて画像/文書からテキストをスピーディーかつ簡単に抽出できます。以下のガイドに従ってOCRビルダーをご使用ください。

CLOVA OCRを使用する

コンソールにアクセスし、次の段階に従って簡単にサービスを利用できます。

  • Step 1. サービス利用申請と規約同意
  • Step 2. ドメイン作成
  • Step 3. テンプレート作成
  • Step 4. テストと分析
  • Step 5. コンポーネント
  • Step 6. 設定
  • Step 7. 配布管理

Step 1. サービス利用申請と規約同意

CLOVA OCRサービスを利用するには、利用申請と規約同意が必要です。

本サービスの利用規約には、CLOVA OCRで発生するデータの保管及び利用に対する内容と、個人情報の委託・受託、会社の義務及び顧客の義務に関する内容が含まれています。サービス企画の前に規約の内容を必ず確認してください。

CLOVA OCR利用規約に移動

商品の利用申請をクリックして規約に同意し、次の段階に移動します。

ocr2_1.png

Step 2. ドメイン作成

本格的にCLOVA OCRサービスを制作するためにドメインを作成します。

ドメインはCLOVA OCRサービスの基準となる単位です。 例えば、「告知書」OCRを作成する場合、認識対象になるすべての告知書テンプレートを含む単位がドメインになります。これによって、テンプレート作成からチャンネル連携そして統計情報まで、一つのドメインを基準に動作して管理されます。

ドメイン作成をクリックしてドメインを作成します。

② ドメイン名とドメインコードを入力します。

  • ドメイン名/ドメインコード:1文字以上から最大50文字まで入力でき、固有値で、重複してはいけません。

  • OCRビルダー内の「入力フィールド」に入力できる文字:ハングル、アルファベット(半角大文字/半角小文字)、日本語(全角カタカナ/ひらがな)、漢字、一部特殊文字(? & 。_ - × 々)。

    ただし、ドメインコードの場合、アルファベットの大文字/小文字(半角大文字/半角小文字)と一部の特殊文字( .? & 。_ - × 々)のみ入力できます。

  • 対応言語:韓国語と日本語のどちらかを選択します。英語は基本対応するため、英語が混在した文書の場合、選択したサポート言語と英文字の両方とも認識できます。

  • サービスタイプ: テキスト抽出のみ可能なGeneralタイプと、テンプレートビルダーを提供するTemplateタイプをサポートします。Generalタイプは、Regionごとに一つのGeneralドメイン(Text OCR実行)のみ作成できます。Templateタイプを選択すると、サービスモデルとサービスプラン項目が表示されます。

OCR3_1.jpg

  • サービスモデル:基本的な性能を提供するBasicモデルと、さらに向上した認識率を提供するPremiumモデル(筆記体の認識を含む)があります。テンプレートのレイアウトは共通対応し、マルチボックス、フィールド入力値のValue type設定はPremiumモデル専用の機能です。
認識モデル 基本 プレミアム 説明
モデル認識率 活字体認識 活字体と筆記体認識 主なビジネスへの活用に最適化した高性能OCR認識モデルを提供
適合文書 証明書、固定フォーム様式 手書き申請書、手書き加入様式、金融文書など
認識テンプレートのレイアウト 提供 提供 認識領域を設定
マルチボックス 提供しない 提供 シングルボックスのテンプレートを組み合わせて番号認識領域などを制御
チェックボックス 提供しない 提供 チェックボックスの形の認識を提供
フィールドタイプ 提供しない 提供 認識値を数字でのみ認識できるようにタイプを設定
  • サービスプラン:CLOVA OCRサービスはドメイン別サービスプランに応じて料金を課金します。サービスモデルBasicのFree以外のサービスプランは、OCR APIの呼び出しがなくても基本維持費が発生します。OCR APIの呼び出し数はサービスプラン別に提供件数が異なり、指定区間を超えると追加費用が発生します。「サービスプラン別の料金案内」をクリックすると詳しい料金プランを確認できます。

    1205_ocr_1.png

  • ドメイン作成時の注意事項

    • CLOVA OCRサービスはドメイン別サービスプランに応じて料金を課金します。
    • サービスモデルBasicのFree以外のサービスプランは、OCR APIの呼び出しがなくても基本維持費が発生します。
    • OCR APIの呼び出し数はサービスプラン別に提供件数が異なり、指定区間を超えると追加費用が発生します。サービスプラン別の料金案内

③ ドメイン作成が完了すると、ドメインリストを確認できます。ドメイン作成段階でサービスプランGeneralを選択すると、テキスト抽出のみ可能なText OCRボタンが動作メニューに表示され、サービスタイプTemplateを選択すると、テンプレートビルダーの実行ボタンが表示されます。

1205_ocr_2.png

④ 選択したドメインの動作メニューでテンプレートビルダーボタンをクリックするとドメイン情報を確認でき、新しい画面でOCRビルダーが実行されます。

ocr6_1.png

⑤ 動作メニューでText OCRボタンをクリックすると、テンプレート設定なしに全テキストのみ抽出できるGeneral OCR連携設定pop-up画面が表示され、Custom API Gateway設定を行うと自動連携が可能になります。

ocr7_1

  • Custom API Gateway設定による自動連携

    • Text OCRボタンをクリックすると、外部アドレスと連携設定できる画面が表示されます。

    • OCR Invoke URLは、外部連携Endpointに入力するOCR APIアドレスを意味します。

    • API Gatewayの利用が申請されている場合、自動連携(Interlock)ボタンをクリックして簡単に自動連携できます。

ドメインコピー機能が追加されました。

ドメインコピーボタンをクリックし、既存の設定テンプレートをそのまま維持した新しいドメインを作成できます。サービスタイプ「Template」を選択した「テンプレートビルダー」専用機能であり、Generalタイプはドメインコピーに対応していません。ドメインコピー後、サービスモデルを変更できます。PremiumからBasicに変更する場合、マルチボックス、フィールド入力値のValue type設定などPremium専用機能はコピーされず、サービスモデルBasic機能のみサポートされます。

ドメイン検索機能が追加されました。

ドメインリスト画面でドメイン名/ドメインコードの検索機能を提供します。Filterを用いてサービス言語/サービスモデル/サービスプラン別にドメインを一斉表示でき、Text OCRのGeneralドメインの場合は、Filter > サービスモデル > Premiumを選択するとサービスプランでGeneralを適用できます。

Step 3. テンプレート作成

OCRビルダーは画像文書からテキストを抽出するためのテンプレートを作成してテストできるウェブコンソールであり、CLOVA OCRサービスに必要な様々な機能を提供しています。

左メニューのテンプレートリストをクリックします。

テンプレート作成をクリックすると、テンプレートの基本情報を入力できるテンプレート作成ページが開きます。

  • テンプレート名にテンプレートの名前を登録して確認をクリックします。
  • テンプレートの基本情報を入力すると、下の代表サンプル設定代表サンプル名判読フィールド指定領域が有効化します。

ocr9_1

代表サンプル設定のために、画像サンプルをアップロードします。

  • 画像ファイルの容量は20MB以下、JPGとPNG形式のファイルに対応します。

  • 代表サンプル画像をアップロードした後、判読フィールドを指定できます。

  • 今後APIを介して入力される画像は、歪みやノイズが少ない300dpi以上の高解像度画像が推奨されます。

OCR9_1

文書のタイトル領域を指定します。

  • 代表サンプル画像をアップロードし、領域指定四角形をドラッグして文書のタイトル領域を指定します。
  • 既に指定された領域をクリックすると領域指定四角形が有効化し、Xをクリックすると領域指定がキャンセルされます。
  • 既に指定された領域をクリックすると領域指定四角形が有効化し、点線をマウスでドラッグすると領域が再設定されます。Vをクリックすると再設定した領域が保存されます。

OCR17_1

代表サンプル名を入力します。

  • 入力した代表サンプル名は、文書のテンプレート分類に用いられます。

OCR18_1

  • 代表サンプル名を入力する前の確認ボタンは、無効状態になっています。代表サンプル名を入力すると確認ボタンが有効化し、確認ボタンをクリックすると保存と類義語登録画面が表示されます。
  • 代表サンプル名はそのフィールドで自由に修正できます。
  • 類義語管理で代表サンプル名と同様に認識される単語を登録し、分類性能を向上させることができます。複数の類義語を入力する場合、コンマ(,)で区切って入力します(例:地方税告知書, 地方税, 地方税告知書)。
  • 類義語管理の代表サンプル名は変更できず、類義語登録と修正のみできます。

ocr19_1

⑤ 判読フィールドを指定します。

フィールド指定タブの + フィールド追加 ボタンをクリックして判読フィールドを指定できます。マルチボックス/チェックボックスの指定はサービスモデルPremium専用の機能であり、サービスモデルBasicでは無効状態です。マルチボックス/チェックボックスの詳細機能は、以下のサービスモデルPremiumのフィールド指定ガイドで詳しく説明します。

  • フィールド指定

    ocr25_1

    • 個別のフィールドごとに判読範囲を設定できます。+ フィールド追加ボタンをクリックすると、新規フィールド指定四角形が表示されます。四角形のサイズを調節して判読領域を指定します。

    • 既に指定された領域をクリックすると領域指定四角形が有効化し、Xをクリックすると領域指定がキャンセルされます。

    • 既に指定された領域をクリックすると領域指定四角形が有効化し、点線をマウスでドラッグすると領域が再設定されます。Vをクリックすると再設定した領域が保存されます。

    • フィールドボックスの右の 削除 アイコンをクリックすると、指定したフィールドを削除できます(フィールド01を削除)。

      ocr25_2

    • フィールド領域を指定してからフィールド名を入力します。

    • フィールド名はそのフィールドで自由に修正できます。

    • フィールド名の右の設定アイコンをクリックするとValue type用語登録フィールド設定画面が開きます。

    • Value type:AIIを選択するとテキストと数字の混在、Numericを選択すると数字のみ認識するように指定できます。Value type機能を用いてフィールドに入力される値の形式を予め指定し、特定値のみ抽出します。

ocr23_2

  • 用語登録:ドメイン特化単語と類義語が含まれた用語辞典を登録できます。辞典を登録するとその辞典に含まれた代表語のみ認識され、類義語が識別される場合は代表語に置換して表記されます。代表/類義語以外の他の単語が認識されると、失敗処理されます。
  • サービスモデルPremiumのフィールド指定

    • マルチボックス:銀行口座番号や携帯電話番号のように入力フィールドが分かれている場合、マルチボックス指定を通じて個別ボックス内の文字を認識・抽出できます。マルチボックスをクリックすると5個の均等分割ボックスが表示され、+アイコンをクリックすると最大20個まで新規ボックスを追加できます。 マルチボックスの間に1ピクセルの間隔があり、+ボタンをクリックするたびに個別ボックス間のスペースが1ピクセルずつ増加します。Margin値の調整を通じて、個別ボックス間の位置を微調整できます。
    • マルチボックス:マルチボックスを指定する際には、既存の入力フィールドのアウトラインが認識されないように、抽出したいボックス内の文字のみを指定してください。

    • チェックボックス:四角(□)や丸(○)形のチェック表示ボックス内にV、X、O、· などの非定型文字が認識されるとTrue、認識されなければFalse値を返却します。アンケート用紙、商品加入書類など様々な形式の文書でOCRを用いたチェックマーク認識ができます。

    • チェックボックスを指定する際には、入力フィールドのアウトラインが見えるようにフィールドを設定(チェックボックスのアウトラインとフィールド指定ボックスの間に一定空間を確保)し、指定した領域内で他の文字や図形なしにチェックボックスのみ認識されるように指定してください。チェックボックス領域外のチェックマーク、チェックマークが消えたりぼやけている場合、チェックマークを修正して同じボックス内に重複記入した場合、チェックマークのガイドラインがあるチェックボックスの場合は、正常に認識できない可能性があります。

    ocr23_3

  • 代表サンプル画像の変更

    ocr27_1

    • 登録した代表サンプルを変更及び内容を修正するには、代表サンプル画像の変更ボタンをクリックします。

    • 代表サンプルの修正ポップアップ画面で確認ボタンをクリックすると、代表サンプル画像の変更ページに移動します。

    • テンプレートを作成する際に登録したテンプレート名、使用モデルなどテンプレートの基本情報が自動的に入力されます。

    • 代表サンプル画像、代表サンプル名、判読フィールド指定など、代表サンプルの設定情報は空欄で表示されます。

      ocr28_1

保存ボタンをクリックしてテンプレート作成を完了してから左メニューのテンプレートリストをクリックすると、作成したテンプレートを確認できます。

ocr29_1

  • 代表サンプル修正をクリックすると、画像と内容を修正できるページに移動します。

  • テンプレートリストでテンプレートIDの左のチェックボックスを選択して有効化した削除ボタンをクリックすると、作成したテンプレートが削除されます。

    ocr31_1

  • 自社検証サーバを保有している場合はそれと連携し、検証機能を用いてテンプレート別に検証を行えます。

    ocr32_1

⑦ 左メニューのサンプルリストをクリックします。

1205_ocr_3

  • サンプルを見る:サンプルリストで個別サンプル番号をクリックすると、アップロードした代表サンプル画像を確認できます。

    ocr36_1

Step 4. テストと分析

テキスト抽出したい画像ファイルをアップロードした後、判読テストやダウンロード機能を提供します。 統合指標ページでサービスプランの日別API呼び出し数、テンプレート別外部検証結果を確認できます。

左メニューのテストをクリックしてから「ベータ/テンプレート判読」のテスト条件を選択します。

  • ベータテスト:サービス配布と同じ環境でテンプレートの自動分類、判読領域テストを行えます。ベータ配布後、ベータテストとサービス配布ができます。
  • テンプレート判読テスト:判読領域が設定されたテンプレート/モデルに対するテスト結果を提供します。

ocr37_1

ファイル検索ボタンをクリックすると、画像ファイルをアップロードできるポップアップが表示されます。テストする画像に合ったテンプレート選択 → 画像アップロード → テストボタンをクリックすると、判読結果を確認できます。

ocr38_1

  • ベータとテンプレート判読テストの回数を合算して、月300回の無料テストを提供します。

    ocr39_1

  • テスト結果はcsvとjson形式でダウンロードでき、テスト結果の右に判読結果を表の形で提供します。

    ocr43_2

左メニューの統合指標をクリックします。

  • 最大90日までの期間を選択できます。

  • 選択したテンプレート別の指標を確認でき、すべてのテンプレートを選択すると全体ドメインに対する指標が表示されます。

  • 統合指標ダウンロード:選択した指標に関するエクセルファイルをダウンロードできます。

  • APIの呼び出し数:使用中のサービスプランが設定された期間中に呼び出されたAPI件数です。

  • 検証の結果:テンプレート別の外部検証結果とそのドメインの検証回数を確認できます。検証結果グラフにマウスオーバーすると、VALID / UNCHECKED / ERROR / INVALIDの回数が表示されます。

  • テンプレート認識失敗数:テンプレートがマッチングされず認識結果がない場合、「テンプレート認識失敗」としてカウントし、設定した期間中の件数を表示します。

    1205_ocr_4

Step 5. コンポーネント

用語辞典

  • 特定フィールドにその辞典の単語のみ認識するよう指定し、登録した類義語が認識された場合は代表語に置換した結果値を表示します。
    • エクセルファイルで用語辞典のbulkをアップロード及びダウンロードできます。
    • 辞典名を検索するとその用語辞典の検索結果が表示され、更新ボタンをクリックすると用語辞典の最初のページが表示されます。

ocr47_1

  • 用語辞典作成ボタンをクリックすると、「辞典作成と修正」ポップアップ画面が開きます。

  • 辞典名:重複しない固有の辞典名を入力します。

  • 代表語:辞典を構成する代表語を入力します。 類義語:入力した代表語の同義語または類義語を入力します。複数の類義語を入力する場合、コンマ(,)で区切ります。(例:地方税告知書, 地方税, 地方税告知書)

    ocr48_1

Step 6. 設定

OCRビルダーはドメイン情報、外部連携、権限管理など手軽な設定機能を提供します。

ocr51_1

外部連携

ocr50_1

最終OCR検出/認識結果値を連携されたアドレスに伝達するには、外部プラットフォームとの連携設定を行う必要があります。 外部に安全にサービスを提供する必要があるため、API Gateway商品と連携して提供されます。

  • Custom API Gateway設定による自動連携
    • 設定ボタンをクリックすると、外部アドレスと連携設定できる画面が表示されます。
    • OCR Invoke URLは、外部連携Endpointに入力するOCR APIアドレスを意味します。
    • API Gatewayの利用が申請されている場合、自動連携ボタンをクリックして簡単に自動連携できます。

検証連携

ocr53_1

  • データ伝送
    • OCRの結果を伝送するアドレスを直接設定して管理できます。
    • 作成ボタンをクリックして、${結果伝送名}形式で名前を入力します。
    • URLフィールドにhttps:// で始まるURLを入力します。

権限管理

ocr55_1

  • 新しい管理者を追加して権限を付与します。

    • 権限設定URL作成:ボタンをクリックするとinvite URLが作成され、URLを介して権限を付与できます。

    • URLコピーボタンをクリックすると、Invite URLコピーalertが表示されます。

    • 削除ボタンをクリックすると、Invite URL削除alertが表示されます。

Step 7. 配布管理

ベータ配布はモデルに反映される最終保存機能で、テンプレートに適用したサンプル、判読領域及び用語辞典などを学習できます。ベータ配布後、ベータテストとサービス配布ができます。

左メニューの配布管理をクリックすると、テンプレートリストを確認できます。

1205_ocr_5

  • テンプレート選択:ドロップダウンボックスでテンプレートを選択すると、そのテンプレートの配布履歴が表示されます。

  • 現在の配布状態:そのテンプレートの最新配布状態を表示します。

  • テンプレートリストで配布するテンプレートを選択すると、ベータ配布ボタンが有効化します。

    ocr60_1

  • ベータ配布ボタンをクリックすると、ベータ配布テンプレートリストを確認できます。

  • 確認ボタンをクリックしてベータ配布を行います。配布完了後、ベータテストができます。テストメニューで判読結果テスト後に修正した情報は、新しいベータ配布を通じて適用されます。

  • ベータテストが完了した最新ベータ配布テンプレートをサービス配布します。

ocr62_1

  • OCRビルダー最上段のサービス配布ボタンをクリックします。
  • サービス配布画面でサービス配布テンプレートリストとドメイン名/利用中のサービスプランを確認できます。
  • 確認ボタンをクリックしてサービス配布を行います。

1205_ocr_6

  • テンプレート別の配布履歴は、配布管理の右のドロップダウンボックスで個別テンプレートを選択すると提供されます。

ocr58_1

  • 個別テンプレートを選択すると配布時間など配布履歴の詳細情報が表示され、現在の配布状態でBeta/Service/ベータ配布失敗履歴などを確認できます。

サービス利用時の注意事項

  • Template OCRの1回呼び出し基準は、ビルダーで設定したテンプレートの認識領域の数(Max 50個)です。これを超えた場合は追加で課金されます。(例:TemplateのBox領域の数が130個である場合、3回API呼び出しとして課金)

  • CLOVA OCRサービスは、高い認識性能と共に素早いサービス処理スピードを提供できるように努めています。バッチ形式で短時間に大量の認識を提供したり、決められた時間に処理できる機能を準備中です。現在、サービスアカウント当たりの推奨呼び出し性能は最大1tpsです。(さらに高い呼び出し性能をご希望の場合は、サポートセンターまでお問い合わせください。)

    • OCR認識をリクエストする際に、45度以上回転した文書の場合は認識率が低下する可能性があります。

関連情報に移動

CLOVA OCRの使用方法とAPI連携に関しては、以下の使用ガイドを参考にしてください。

に対する検索結果は~件です。 ""

    に対する検索結果がありません。 ""

    処理中...