CLOVA OCR 사용 가이드

CLOVA OCR 서비스를 사용하여 이미지/문서에서 텍스트를 빠르고 쉽게 추출할 수 있습니다. 아래 가이드에 따라 OCR 빌더를 사용해 보세요.

CLOVA OCR 사용하기

콘솔에 접속 후 아래의 단계를 거쳐 쉽게 서비스를 이용할 수 있습니다.

  • Step 1. 서비스 이용 신청 및 약관 동의
  • Step 2. 도메인 생성
  • Step 3. 템플릿 생성
  • Step 4. 테스트 및 분석
  • Step 5. 콤포넌트
  • Step 6. 설정
  • Step 7. 배포 관리

Step 1. 서비스 이용 신청 및 약관 동의

CLOVA OCR 서비스를 이용하기 위해서는 이용 신청 및 약관 동의가 필요합니다.

본 서비스 이용 약관은 CLOVA OCR에서 발생하는 데이터의 보관 및 사용에 대한 내용과 개인 정보 위수탁, 회사의 의무 및 고객의 의무에 대한 내용을 담고 있습니다. 서비스 기획 전에 약관 내용을 반드시 확인해 주세요.

CLOVA OCR 이용약관 바로가기

상품 이용신청을 클릭하여 약관에 동의한 후 다음 단계로 이동합니다.

ocr2_1.png

Step 2. 도메인 생성

본격적으로 CLOVA OCR 서비스를 제작하기 위해 도메인을 생성합니다.

도메인은 CLOVA OCR 서비스의 기준이 되는 단위입니다. 예를 들어 ‘고지서’ OCR을 만든다면, 인식 대상이 되는 모든 고지서 템플릿을 포함하는 단위가 도메인입니다. 따라서 템플릿 생성 및 채널 연동, 그리고 통계 정보까지 하나의 도메인을 기준으로 동작하고 관리됩니다.

도메인 생성을 클릭하여 도메인을 생성합니다.

② 도메인 이름과 도메인 코드를 입력합니다.

  • 도메인 이름/도메인 코드 : 1글자 이상~최대 50글자까지 입력 가능하고 고유한 값으로 중복되지 않아야 합니다.

  • OCR 빌더 내 '입력 필드' 입력 가능 문자 : 한글, 영문(반각대문자 / 반각 소문자), 일본어(전각 가타카나 / 히라가나), 한문, 일부 특수문자(? & 。_ - × 々).

    단, 도메인 코드 경우 영문 대/소문자(반각대문자 / 반각 소문자)와 일부 특수문자( . ? & 。_ - × 々)만 입력 가능합니다.

  • 지원 언어 : 한국어, 일본어 중 하나의 언어를 선택합니다. 영어는 기본 지원되므로 영어가 혼용된 문서의 경우, 선택한 지원 언어와 영어 문자를 모두 인식할 수 있습니다.

  • 서비스 타입 : 텍스트 추출만 가능한 General 타입과 템플릿 빌더를 제공하는 Template 타입을 지원합니다. General 타입은 Region당 하나의 General 도메인(Text OCR 실행) 생성만 가능합니다. Template 타입 선택 시 서비스 모델과 서비스 플랜 항목이 노출됩니다.

OCR3_1.jpg

  • 서비스 모델 : 기본적인 성능을 제공하는 Basic 모델과 더욱 향상된 인식률을 제공하는 Premium 모델 (필기체 인식 포함)로 구분됩니다. 템플릿 레이아웃은 공통 지원되고 멀티 박스, 필드 입력 값 Value type 설정은 Premium 모델 전용 기능입니다.
인식 모델 기본 프리미엄 설명
모델 인식률 활자체 인식 활자체 및 필기체 인식 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 제공
적합 문서 증명서, 고정 폼 양식 수기 신청서 가입 양식, 금융 문서 등
인식 템플릿 레이아웃 제공 제공 인식 영역을 설정
멀티박스 제공 안함 제공 싱글 박스 템플릿을 조합하여 번호 인식영역 등을 제어
체크박스 제공 안함 제공 체크 박스 형태의 인식 제공
필드 유형 제공 안함 제공 인식 값을 숫자로만 인식되도록 유형을 설정
  • 서비스 플랜 : CLOVA OCR 서비스는 도메인 별 서비스 플랜에 따라 요금을 부과합니다. 서비스 모델 Basic의 Free를 제외한 모든 서비스 플랜은 OCR API 호출을 하지 않아도 기본 유지 비용이 발생됩니다. OCR API 호출 수는 서비스 플랜별 제공 건수가 다르며 포함 구간 초과 시 추가 비용이 발생합니다. '서비스 플랜별 요금 안내'를 클릭하면 자세한 요금제를 확인할 수 있습니다.

    1205_ocr_1.png

  • 도메인 생성시 주의사항

    • CLOVA OCR 서비스는 도메인 별 서비스 플랜에 따라 요금을 부과합니다.
    • 서비스 모델 Basic의 Free를 제외한 모든 서비스 플랜은 OCR API 호출을 하지 않아도 기본 유지 비용이 발생됩니다.
    • OCR API 호출 수는 서비스 플랜별 제공 건수가 다르며 포함 구간 초과 시 추가 비용이 발생합니다. 서비스 플랜별 요금 안내

③ 도메인 생성이 완료되면 도메인 목록을 확인할 수 있습니다. 도메인 생성 단계에서 서비스 플랜 General 선택 시 텍스트 추출만 가능한 Text OCR 버튼이 동작 메뉴에 노출되고 서비스 타입 Template 선택 시 템플릿 빌더 실행 버튼이 노출됩니다.

1205_ocr_2.png

④ 선택한 도메인의 동작 메뉴에서 템플릿 빌더 버튼을 클릭하면 도메인 정보를 확인할 수 있고 새로운 창에서 OCR 빌더가 실행됩니다.

ocr6_1.png

⑤ 동작 메뉴에서 Text OCR 버튼을 클릭하면, 템플릿 설정 없이 전체 텍스트만 추출 가능한 General OCR 연동 설정 pop-up 창이 노출되고 Custom API Gateway 설정을 통해 자동 연동이 가능합니다.

ocr7_1

  • Custom API Gateway 설정을 통한 자동 연동

    • Text OCR 버튼 클릭 시 외부 주소와 연동 설정이 가능한 창이 노출됩니다.

    • OCR Invoke URL은 외부 연동 Endpoint에 입력할 OCR API 주소를 의미합니다.

    • API Gateway 이용 신청이 되어 있는 경우, 자동 연동 (Interlock) 버튼을 클릭해 손쉽게 자동 연동할 수 있습니다.

도메인 복사 기능이 추가되었습니다.

도메인 복사 버튼을 클릭하여 기존 설정 템플릿을 그대로 유지한 새로운 도메인 생성이 가능합니다. 서비스 타입 'Template' 선택을 통한 '템플릿 빌더' 전용 기능으로 General 타입은 도메인 복사를 지원하지 않습니다. 도메인 복사 후 서비스 모델 변경이 가능합니다. Premium에서 Basic 변경 시 멀티 박스, 필드 입력값 Value type 설정 등 Premium 전용 기능은 복사되지 않고 서비스 모델 Basic 기능만 지원합니다.

도메인 검색 기능이 추가되었습니다.

도메인 목록 화면에서 도메인 이름 / 도메인 코드 검색 기능을 제공합니다. Filter를 통해 지원 언어 / 서비스 모델 / 서비스 플랜 별 도메인 모아보기가 가능하고 Text OCR인 General 도메인의 경우, Filter > 서비스 모델 > Premium 선택 시 서비스 플랜에서 General을 적용할 수 있습니다.

Step 3. 템플릿 생성

OCR 빌더는 이미지 문서에서 텍스트를 추출하기 위한 템플릿을 작성하고 테스트할 수 있는 웹 콘솔로서 CLOVA OCR 서비스에 필요한 다양한 기능을 제공하고 있습니다.

왼쪽 메뉴의 템플릿 목록을 클릭합니다.

템플릿 생성을 클릭하면 템플릿 기본 정보를 입력할 수 있는 템플릿 생성 페이지가 열립니다.

  • 템플릿 명에 템플릿 이름을 등록한 후 확인을 클릭합니다.
  • 템플릿 기본 정보를 입력하면 하단 대표 샘플 설정대표 샘플명, 판독 필드 지정 영역이 활성화됩니다.

ocr9_1

대표 샘플 설정을 위해 이미지 샘플을 업로드합니다.

  • 이미지 파일 용량은 20MB 이하, JPG 및 PNG 형식의 파일을 지원합니다.

  • 대표 샘플 이미지 업로드 후 판독 필드 지정이 가능합니다.

  • 추후 API를 통해 입력되는 이미지는 왜곡 및 손상이 적은 300dpi 이상의 고품질 이미지가 권장됩니다.

OCR9_1

문서의 제목 영역을 지정합니다.

  • 대표 샘플 이미지 업로드 후 영역 지정 사각형을 드래그하여 문서 제목 영역을 지정합니다.
  • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, X를 클릭하면 영역 지정이 취소됩니다.
  • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, 점선을 마우스로 드래그하면 영역이 재설정됩니다. V를 클릭하면 재설정한 영역이 저장됩니다.

OCR17_1

대표 샘플명을 입력합니다.

  • 입력된 대표 샘플명은 문서의 템플릿 분류에 사용됩니다.

OCR18_1

  • 대표 샘플명 입력 전 확인 버튼은 비활성화 상태입니다. 대표 샘플명을 입력하면 확인 버튼이 활성화되고 확인 버튼 클릭 시 저장 및 유사어 등록 알림창을 확인할 수 있습니다.
  • 대표 샘플명은 해당 필드에서 자유롭게 내용 수정 가능합니다.
  • 유사어 관리에서 대표 샘플명과 비슷하게 인식되는 단어를 등록해 분류 성능을 향상시킬 수 있습니다. 복수의 유사어를 입력하는 경우 쉼표(,)로 구분하여 입력합니다(예: 지방세고지서, 지방세, 지방세 고지서).
  • 유사어 관리의 대표 샘플명은 변경할 수 없고 유사어 등록 및 수정만 가능합니다.

ocr19_1

⑤ 판독 필드를 지정합니다.

필드 지정 탭의 + 필드 추가 버튼을 클릭해 판독 필드를 지정할 수 있습니다. 멀티 박스 / 체크 박스 지정은 서비스 모델 Premium 전용 기능으로 서비스 모델 Basic에서 비활성화 상태입니다. 멀티 박스 / 체크 박스 상세 기능은 아래 서비스 모델 Premium 필드 지정 가이드에서 자세히 다루겠습니다.

  • 필드 지정

    ocr25_1

    • 개별 필드별 판독 범위 설정이 가능합니다. + 필드 추가 버튼을 클릭하면 신규 필드 지정 사각형이 표시됩니다. 사각형의 크기를 조절해 판독 영역을 지정합니다.

    • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, X를 클릭하면 영역 지정이 취소됩니다.

    • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, 점선을 마우스로 드래그하면 영역이 재설정됩니다. V를 클릭하면 재설정한 영역이 저장됩니다.

    • 필드 박스 오른쪽 삭제 아이콘을 클릭하면 지정한 필드를 삭제할 수 있습니다(필드 01 삭제).

      ocr25_2

    • 필드 영역 지정 후 필드 이름을 입력합니다.

    • 필드 이름은 해당 필드에서 자유롭게 수정할 수 있습니다.

    • 필드 이름 오른쪽 설정 아이콘을 클릭하면 Value type, 용어 등록 필드 설정 창이 열립니다.

    • Value type: AII 선택 시 텍스트와 숫자 혼합, Numeric 선택 시 숫자만 인식하도록 지정 가능합니다. Value type 기능을 통해 필드에 입력될 값의 형태를 미리 지정하여 특정 값만 추출합니다.

ocr23_2

  • 용어 등록: 도메인 특화 단어 및 유사어가 담긴 용어사전을 등록할 수 있습니다. 사전을 등록하는 경우 해당 사전에 포함된 대표어만 인식되며 유사어가 식별될 경우 대표어로 치환되어 표기됩니다. 대표/유사어 외 다른 단어가 인식될 경우 실패 처리됩니다.
  • 서비스 모델 Premium 필드 지정

    • 멀티 박스 : 은행 계좌번호나 휴대전화 번호처럼 입력 칸이 나눠어져 있을 경우, 멀티 박스 지정을 통해 개별 박스 안의 글자 인식 및 추출이 가능합니다. 멀티 박스 클릭 시 5칸의 균등 분할 박스가 노출되고 +아이콘 클릭을 통해 최대 20칸까지 신규 박스를 추가할 수 있습니다. 멀티 박스 사이 1픽셀의 간격이 있고 + 버튼을 클릭할 때마다 개별 박스 사이에 공간이 1픽셀씩 증가합니다. Margin 값 조정을 통해 개별 박스 간 미세한 위치 조정이 가능합니다.
    • 멀티 박스 : 멀티 박스 지정 시 기존 입력 칸의 테두리가 인식되지 않도록, 추출을 원하는 박스 안의 글자만 지정해야 합니다.

    • 체크 박스 : 사각형ㅁ 이나 원형O의 체크 표시 상자 내에 V, X, O, · 등 비정형캐릭터가 인식되면 True / 없으면 False 값을 리턴합니다. 설문지, 상품 가입 서류 등 다양한 형태의 문서에서 OCR을 통한 체크 마크 인식이 가능합니다.

    • 체크 박스 지정 시 입력 칸 테두리가 보이도록 필드를 설정(체크 박스 테두리와 필드 지정 박스 사이 일정 공간 확보)하여 설정하고, 지정된 영역 안에 다른 글자나 도형 없이 체크 박스만 인식되도록 지정해야 합니다. 체크 박스 영역 밖의 체크 마크, 체크 마크가 지워졌거나 흐릿한 경우, 체크 마크를 수정하여 동일 박스 내 중복 기입 시, 체크 마크 가이드 라인이 있는 체크 박스의 경우 정상 인식되지 않을 수 있습니다.

    ocr23_3

  • 대표 샘플 이미지 변경

    ocr27_1

    • 등록한 대표 샘플 변경 및 내용을 수정하려면 대표 샘플 이미지 변경 버튼을 클릭합니다.

    • 대표 샘플 수정 팝업 창에서 확인 버튼을 클릭하면 대표 샘플 이미지 변경 페이지로 이동합니다.

    • 템플릿 생성 시 등록한 템플릿 명, 사용 모델 등 템플릿의 기본 정보가 자동으로 입력됩니다.

    • 대표 샘플 이미지, 대표 샘플명, 판독 필드 지정 등 대표 샘플 설정 정보는 빈값으로 출력됩니다.

      ocr28_1

저장 버튼을 클릭하여 템플릿 생성을 완료한 뒤, 왼쪽 메뉴의 템플릿 목록을 클릭하면 생성된 템플릿을 확인할 수 있습니다.

ocr29_1

  • 대표 샘플 수정 클릭 시 이미지 및 내용 수정이 가능한 페이지로 이동합니다.

  • 템플릿 목록에서 템플릿 ID 왼쪽 체크박스를 선택한 후 활성화된 삭제 버튼을 클릭하면 생성한 템플릿이 삭제됩니다.

    ocr31_1

  • 검증 기능을 통해 자체 검증 서버를 보유하고 있는 경우 연동하여 템플릿별 검증을 진행할 수 있습니다.

    ocr32_1

⑦ 왼쪽 메뉴의 샘플 목록을 클릭합니다.

1205_ocr_3

  • 샘플 보기 : 샘플 목록에서 개별 샘플 번호를 클릭하면 업로드한 대표 샘플 이미지를 확인할 수 있습니다.

    ocr36_1

Step 4. 테스트 및 분석

텍스트 추출을 원하는 이미지 파일을 업로드한 후 판독 테스트 및 다운로드 기능을 제공합니다. 통합 지표 페이지에서 서비스 플랜의 일별 API 호출 수, 템플릿별 외부 검증 결과를 확인할 수 있습니다.

왼쪽 메뉴의 테스트를 클릭한 후 ‘베타/템플릿 판독’ 테스트 조건을 선택합니다.

  • 베타 테스트: 서비스 배포와 동일한 환경에서 템플릿 자동분류, 판독 영역 테스트가 가능합니다. 베타 배포 후 베타 테스트 및 서비스 배포를 할 수 있습니다.
  • 템플릿 판독 테스트: 판독 영역이 설정된 템플릿/모델에 대한 테스트 결과를 제공합니다.

ocr37_1

파일 찾기 버튼을 클릭하면 이미지 파일을 업로드할 수 있는 팝업 창이 노출됩니다. 테스트할 이미지에 맞는 템플릿 선택 → 이미지 업로드 → 테스트 버튼을 클릭하면, 판독 결과를 확인할 수 있습니다.

ocr38_1

  • 베타와 템플릿 판독 테스트 횟수를 합산하여 월 300회 무료 테스트를 제공합니다.

    ocr39_1

  • 테스트 결과는 csv와 json 형식으로 다운로드 가능하며 테스트 결과 오른쪽에서 판독 결과를 표 형태로 제공합니다.

    ocr43_2

왼쪽 메뉴의 통합지표를 클릭합니다.

  • 최대 90일까지 기간 선택이 가능합니다.

  • 선택한 템플릿별 지표를 확인할 수 있으며 모든 템플릿 선택 시 전체 도메인에 대한 지표가 출력됩니다.

  • 통합 지표 다운로드 : 선택된 지표에 대한 엑셀 다운로드가 가능합니다.

  • API 호출 수 : 사용 중인 서비스 플랜의 설정된 기간 동안 호출된 API 건수입니다.

  • 검증 결과 : 템플릿 별 외부 검증 결과 및 해당 도메인의 검증 횟수를 확인할 수 있습니다. 검증 결과 그래프 마우스 오버 시 VALID / UNCHECKED / ERROR / INVALID 횟수가 표시됩니다.

  • 템플릿 인식 실패 수 : 템플릿이 매칭되지 않아 인식 결과가 없을 경우, '템플릿 인식 실패'로 카운트하고 설정된 기간 동안의 건수를 표시합니다.

    1205_ocr_4

Step 5. 콤포넌트

용어사전

  • 특정 필드에 해당 사전의 단어만 인식하도록 지정하거나 등록된 유사어들이 인식될 경우 대표어로 치환한 결과값을 노출합니다.
    • 엑셀 파일로 용어사전의 bulk 업로드 및 다운로드가 가능합니다.
    • 사전 이름을 검색할 경우 해당 용어사전의 검색결과가 보이고 새로고침 버튼 클릭 시 용어사전 첫 페이지가 노출됩니다.

ocr47_1

  • 용어사전 생성 버튼을 클릭하면 ‘사전 생성 및 수정’ 팝업 창이 열립니다.

  • 사전 이름: 중복되지 않는 고유한 사전 이름을 입력합니다.

  • 대표어: 사전을 구성하는 대표어를 입력합니다. 유사어: 입력한 대표어의 동의어 또는 유사어를 입력합니다. 복수의 유사어를 입력하는 경우 쉼표(,)로 구분합니다.(예: 지방세고지서, 지방세, 지방세 고지서)

    ocr48_1

Step 6. 설정

OCR 빌더는 도메인 정보, 외부 연동, 권한 관리 등 손쉬운 설정 기능을 제공합니다.

ocr51_1

외부 연동

ocr50_1

최종 OCR 검출/인식 결과값을 연동된 주소로 전달하기 위해 외부 플랫폼과 연동 설정을 해야 합니다. 외부로 안전하게 서비스를 제공할 수 있어야 하기 때문에 네이버 클라우드 플랫폼의 API Gateway 상품과 연동하여 제공됩니다.

  • Custom API Gateway 설정을 통한 자동 연동
    • 설정 버튼 클릭 시 외부 주소와 연동 설정이 가능한 창이 노출됩니다.
    • OCR Invoke URL은 외부 연동 Endpoint에 입력할 OCR API 주소를 의미합니다.
    • API Gateway 이용 신청이 되어 있는 경우, 자동 연동 버튼을 클릭해 손쉽게 자동 연동할 수 있습니다.

검증 연동

ocr53_1

  • 데이터 전송
    • OCR 결과를 전송할 주소를 직접 설정하고 관리할 수 있습니다.
    • 생성 버튼 클릭 후 ${결과 전송 이름} 형식으로 이름을 입력합니다.
    • URL 필드에 https:// 로 시작하는 URL을 입력합니다.

권한 권리

ocr55_1

  • 새로운 관리자를 추가하고 권한을 부여합니다.

    • 권한 설정 URL 생성 : 버튼 클릭 시 invite URL 생성되며 URL을 통해 권한 부여가 가능합니다.

    • URL 복사 버튼 클릭 시 Invite URL 복사 alert이 노출됩니다.

    • 삭제 버튼 클릭 시 Invite URL 삭제 alert이 노출됩니다.

Step 7. 배포 관리

베타 배포는 모델에 반영되는 최종 저장 기능으로 템플릿에 적용한 샘플, 판독 영역 및 용어사전 등을 학습할 수 있습니다. 베타 배포 후 베타 테스트 및 서비스 배포가 가능합니다.

왼쪽 메뉴의 배포 관리를 클릭하면 템플릿 목록을 확인할 수 있습니다.

1205_ocr_5

  • 템플릿 선택: 드롭다운 박스에서 템플릿을 선택하면 해당 템플릿의 배포 내역이 출력됩니다.

  • 현재 배포 상태: 해당 템플릿의 최신 배포 상태를 표시합니다.

  • 템플릿 목록에서 배포할 템플릿을 선택하면 베타 배포 버튼이 활성화됩니다.

    ocr60_1

  • 베타 배포 버튼을 클릭하면 베타 배포 템플릿 목록을 확인할 수 있습니다.

  • 확인 버튼을 클릭하여 베타 배포를 진행합니다. 배포 완료 후 베타 테스트가 가능합니다. 테스트 메뉴에서 판독 결과 테스트 후 수정한 정보는 새로운 베타 배포를 통해 적용됩니다.

  • 베타 테스트가 완료된 최신 베타 배포 템플릿을 서비스 배포합니다.

ocr62_1

  • OCR 빌더 최상단 서비스 배포 버튼을 클릭합니다.
  • 서비스 배포 창에서 서비스 배포 템플릿 목록과 도메인 이름/사용 중인 서비스 플랜 확인이 가능합니다.
  • 확인 버튼을 클릭하여 서비스 배포를 진행합니다.

1205_ocr_6

  • 템플릿별 배포 내역은 배포 관리 오른쪽 드롭다운 박스에서 개별 템플릿 선택 시 제공됩니다.

ocr58_1

  • 개별 템플릿 선택 시 배포 시간 등 배포 내역 상세 정보가 표시되며 현재 배포 상태에서 Beta/Service/베타 배포 실패 내역 등을 확인할 수 있습니다.

서비스 이용시 주의사항

  • Template OCR의 1회 호출 기준은 빌더에서 설정한 템플릿의 인식 영역의 수(Max 50개)입니다. 이를 초과하는 경우 추가 과금됩니다. (예시, Template의 Box영역의 수가 130개인 경우, 3회 API호출로 과금)

  • CLOVA OCR 서비스는 높은 인식 성능과 함께 빠른 서비스 처리속도를 제공해 드릴 수 있도록 노력하고 있습니다. 배치 형식으로 단기간에 대량의 인식을 제공하거나, 정해진 시간에 처리를 할 수 있는 기능을 준비하고 있으며, 현재, 서비스 계정당 권장되는 호출 성능은 최대 1tps 입니다. (더 높은 호출 성능을 원하시는 경우 고객지원으로 문의해 주시기 바랍니다.)

    • OCR 인식 요청 시 45도 이상 회전된 문서의 경우, 인식률이 저하될 수 있습니다.

연관 정보 바로가기

CLOVA OCR 사용방법 및 API 연동 관련하여 아래 사용 가이드를 참고하실 수 있습니다.

""에 대한 건이 검색되었습니다.

    ""에 대한 검색 결과가 없습니다.

    처리중...