Clova OCR 사용 가이드

Clova OCR 서비스를 사용하면 빠르고 쉽게 이미지/문서에서 텍스트를 추출할 수 있습니다. 아래 가이드를 따라 Clova OCR 빌더를 사용해 보세요.

Clova OCR 사용하기

콘솔에 접속 후 아래의 단계를 거쳐 쉽게 서비스를 이용할 수 있습니다.

  • Step 1. 서비스 이용 신청 및 약관 동의
  • Step 2. 도메인 생성
  • Step 3. 템플릿 생성
  • Step 4. 테스트 및 분석
  • Step 5. 콤포넌트
  • Step 6. 설정
  • Step 7. 배포 관리

Step 1. 서비스 이용 신청 및 약관 동의

Clova OCR 서비스를 이용하기 위해서는 이용 신청 및 약관 동의가 필요합니다.

본 서비스 이용 약관은 Clova OCR에서 발생하는 데이터의 보관 및 사용에 대한 내용과 개인 정보 위수탁, 회사의 의무 및 고객의 의무에 대한 내용을 담고 있습니다. 서비스 기획 전에 약관 내용을 반드시 확인해 주세요.

Clova OCR 이용약관 바로가기

상품 이용 신청을 클릭하여 약관에 동의한 후 다음 단계로 이동합니다.

ocr2_1.jpg

Step 2. 도메인 생성

본격적으로 Clova OCR 서비스를 제작하기 위해 도메인을 생성합니다.

도메인은 Clova OCR 서비스의 기준이 되는 단위입니다. 예를 들어 ‘고지서’ Clova OCR을 만든다면, 모든 고지서 템플릿을 포함하는 단위가 도메인입니다. 따라서 템플릿 생성 및 채널 연동, 그리고 통계 정보까지 하나의 도메인을 기준으로 동작하고 관리됩니다.

ocr3_1.jpg

도메인 생성을 클릭하여 도메인을 생성합니다.

② 도메인 이름과 도메인 코드를 입력합니다.

  • 도메인 이름: 1글자 이상이어야 하며 최대 50글자까지 입력 가능합니다.
  • 도메인 코드: 고유한 값으로 중복되지 않아야 합니다.
  • 지원 언어: 한국어, 일본어, 영어 중 하나의 언어를 선택합니다.

③ 도메인 생성이 완료되면 도메인 목록을 확인할 수 있습니다.

ocr5_1.jpg

④ 선택한 도메인의 템플릿 빌더를 클릭하면 도메인 정보를 확인할 수 있고 새로운 창에서 Clova OCR 빌더가 실행됩니다.

ocr6_1.jpg

⑤ 템플릿 설정 없이 전체 텍스트만 추출 가능한 General Clova OCR은 Text Clova OCR API 버튼을 클릭한 뒤, Custom API Gateway 설정을 통해 자동 연동할 수 있습니다.

ocr7_1

  • Custom API Gateway 설정을 통한 자동 연동
    • Text Clova OCR API 버튼 클릭 시 외부 주소와 연동 설정이 가능한 창이 노출됩니다.
    • OCR Invoke URL은 외부 연동 Endpoint에 입력할 Clova OCR API 주소를 의미합니다.
    • API Gateway 이용 신청이 되어 있는 경우, 자동 연동 (Interlock) 버튼을 클릭해 손쉽게 자동 연동할 수 있습니다.

Step 3. 템플릿 생성

Clova OCR 빌더는 이미지나 문서의 텍스트를 추출하고 테스트하는 웹 콘솔로서 Clova OCR 서비스에 필요한 다양한 기능을 제공하고 있습니다.

왼쪽 메뉴의 템플릿 목록을 클릭합니다.

ocr9_1

템플릿 생성을 클릭하면 템플릿 기본 정보를 입력할 수 있는 템플릿 생성 페이지가 열립니다.

  • 템플릿 명에 템플릿 이름을 등록한 후 확인을 클릭합니다.
  • 템플릿 기본 정보를 입력하면 하단 대표 샘플 설정대표 샘플명, 판독 영역 및 필드 지정 영역이 활성화됩니다.

ocr10_1

대표 샘플 설정을 위해 이미지 샘플을 업로드합니다.

  • 이미지 파일 용량은 4MB 이하, JPG 및 PNG 형식의 파일을 지원합니다.
  • 대표 샘플 이미지 업로드 후 판독 영역 및 필드 지정이 가능합니다.
  • 이미지 샘플은 최대 10개까지 등록 가능하며 샘플 관리 메뉴에서 샘플 리스트를 확인할 수 있습니다. 이미지 샘플을 통한 인식률 향상은 추후 지원 예정입니다.

ocr16_1

문서의 제목 영역을 지정합니다.

  • 대표 샘플 이미지 업로드 후 영역 지정 사각형을 드래그하여 문서 제목 영역을 지정합니다.
  • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, X를 클릭하면 영역 지정이 취소됩니다.
  • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, 점선을 마우스로 드래그하면 영역이 재설정됩니다. V를 클릭하면 재설정한 영역이 저장됩니다.

ocr17_1

대표 샘플명을 입력합니다.

  • 입력된 대표 샘플명은 문서의 템플릿 분류에 사용됩니다.

ocr18_1

  • 대표 샘플명 입력 전 확인 버튼은 비활성화 상태입니다. 대표 샘플명을 입력하면 확인 버튼이 활성화되고 확인 버튼 클릭 시 저장 및 유사어 등록 알림창을 확인할 수 있습니다.
  • 대표 샘플명은 해당 필드에서 자유롭게 내용 수정 가능합니다.
  • 유사어 관리에서 대표 샘플명과 비슷하게 인식되는 단어를 등록해 분류 성능을 향상시킬 수 있습니다. 복수의 유사어를 입력하는 경우 쉼표(,)로 구분하여 입력합니다(예: 지방세고지서, 지방세, 지방세 고지서).
  • 유사어 관리의 대표 샘플명은 변경할 수 없고 유사어 등록 및 수정만 가능합니다.

ocr19_1

⑤ 판독 범위를 지정합니다.

필드 지정 탭, 영역 지정 탭의 + 필드 추가 버튼, + 영역 추가 버튼을 클릭해 판독 범위를 지정할 수 있습니다.

  • 필드 지정

    ocr25_1

    • 개별 필드별 판독 범위 설정이 가능합니다. + 필드 추가 버튼을 클릭하면 신규 필드 지정 사각형이 표시됩니다. 사각형의 크기를 조절해 판독 영역을 지정합니다.

    • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, X를 클릭하면 영역 지정이 취소됩니다.

    • 이미 지정된 영역을 클릭하면 영역 지정 사각형이 활성화되고, 점선을 마우스로 드래그하면 영역이 재설정됩니다. V를 클릭하면 재설정한 영역이 저장됩니다.

    • 필드 박스 오른쪽 삭제 아이콘을 클릭하면 지정한 필드를 삭제할 수 있습니다(필드 01 삭제).

      ocr25_2

    • 필드 영역 지정 후 필드 이름을 입력합니다.

    • 필드 이름은 해당 필드에서 자유롭게 수정할 수 있습니다.

  • 판독 영역 및 필드 지정 내 탭 이동 시 입력 정보 임시 저장

    • 필드 지정 탭, 영역 지정 탭 간 이동 시, 저장 버튼을 클릭하지 않고 이동해도 지금까지 입력한 내용이 임시 저장됩니다. 임시 저장 기능은 해당 페이지에서 탭 이동 시에 적용됩니다.

    • 최하단 저장 버튼을 누르면 판독 영역 및 필드 지정 탭에 (개별 필드/영역/하위 필드) 입력된 모든 값이 최종 저장됩니다.

    • 저장 버튼을 누르지 않고 다른 페이지로 이동할 경우, “저장 정보 삭제 확인” 경고 창이 나타납니다.

      ocr42_1

  • 영역 지정

    OCR20_1

    • 영역은 여러 개의 하위 필드를 묶을 수 있는 상위 카테고리입니다. + 영역 추가 버튼을 클릭하면 신규 영역 지정 사각형이 표시됩니다. 시각형의 크기를 조절해 판독 영역을 지정합니다.

    • 영역 지정 후 영역 이름을 입력합니다.

    • 삭제 버튼을 클릭하면 지정한 영역을 삭제할 수 있습니다(영역 01 삭제).

    • + 하위 필드 추가 버튼을 클릭하면 하위 필드 지정 사각형이 표시됩니다. 사각형의 크기를 조절해 판독 영역을 지정합니다.

      ocr22_1

    • 하위 필드 영역 지정 후 하위 필드 이름을 입력합니다.

    • 영역 이름, 하위 필드 내용은 해당 필드에서 자유롭게 수정할 수 있습니다.

    • 하위 필드 오른쪽 설정 아이콘을 클릭하면 Value type, 용어 등록 필드 설정 창이 열립니다.

    • Value type: 텍스트, 숫자, 혼합 등 필드에 입력될 값의 형태를 미리 지정하여 인식 성능을 높일 수 있습니다. 디폴트는 All로 지정됩니다.

ocr23_2

  • 용어 등록: 도메인 특화 단어 및 유사어가 담긴 용어사전을 등록할 수 있습니다. 사전을 등록하는 경우 해당 사전에 포함된 대표어만 인식되며 유의어가 식별될 경우 대표어로 치환되어 표기됩니다. 대표/유사어 외 다른 단어가 인식될 경우 실패 처리됩니다.

    ocr24_1

  • 하위 필드 오른쪽 ‘삭제 아이콘’을 클릭하면 지정한 하위 필드를 삭제할 수 있습니다 (하위 필드 01 삭제). 저장 버튼을 클릭하면 템플릿 생성 및 대표 샘플 설정이 완료됩니다.

  • 대표 샘플 이미지 변경

    ocr27_1

    • 등록한 대표 샘플 변경 및 내용을 수정하려면 대표 샘플 이미지 변경 버튼을 클릭합니다.

    • 대표 샘플 수정 팝업 창에서 확인 버튼을 클릭하면 대표 샘플 이미지 변경 페이지로 이동합니다.

    • 템플릿 생성 시 등록한 템플릿 명, 사용 모델 등 템플릿의 기본 정보가 자동으로 입력됩니다.

    • 대표 샘플 이미지, 대표 샘플명, 판독 영역 및 필드 지정 등 대표 샘플 설정 정보는 빈값으로 출력됩니다.

      ocr28_1

저장 버튼을 클릭하여 템플릿 생성을 완료한 뒤, 왼쪽 메뉴의 템플릿 목록을 클릭하면 생성된 템플릿을 확인할 수 있습니다.

ocr29_1

  • 대표 샘플 수정 클릭 시 이미지 및 내용 수정이 가능한 페이지로 이동합니다.

    ocr30_1

  • 적용 샘플 보기 버튼 클릭 시 ‘샘플 관리’ 페이지로 이동해 샘플 이미지를 확인하거나 업로드/다운로드할 수 있습니다.

    ocr30_2

  • 템플릿을 삭제하려면 템플릿 ID 왼쪽 체크박스를 선택한 후 활성화된 삭제 버튼을 클릭합니다.

    ocr31_1

  • 검증 기능을 통해 자체 검증 서버를 보유하고 있는 경우 연동하여 템플릿별 검증을 진행할 수 있습니다.

    ocr32_1

⑦ 왼쪽 메뉴의 샘플 관리를 클릭합니다.

ocr33_1

  • 샘플 관리

    • 샘플 업로드

      • 샘플 업로드 버튼을 클릭해 템플릿을 선택하고 해당 샘플을 업로드합니다.
      • 4MB 이하의 JPG/PNG 이미지 파일 업로드가 가능합니다.

        ocr34_1

  • 샘플 삭제

    • 체크박스 왼쪽 샘플 번호가 선택되지 않았을 경우, 삭제 버튼은 비활성화되어 클릭이 불가능합니다.

    • 샘플 삭제를 위해 체크박스를 클릭해 삭제할 샘플을 선택하고 활성화된 삭제 버튼을 클릭합니다.

    • 대표 샘플 삭제가 불가능하므로 체크박스 역시 비활성화 상태입니다.

      ocr35_1

  • 샘플 보기

    • 샘플 번호 목록에서 개별 샘플 번호를 클릭하면 업로드한 샘플을 확인할 수 있습니다.

      ocr36_1

Step 4. 테스트 및 분석

텍스트 추출을 원하는 이미지 파일을 업로드한 후 판독 테스트 및 다운로드 기능을 제공합니다. 통합 지표 페이지에서 API 호출 수, 템플릿별 외부 검증 결과, 일 최대 서비스 배포 템플릿 수 등 다양한 데이터를 확인할 수 있습니다.

왼쪽 메뉴의 테스트를 클릭한 후 ‘베타/템플릿 판독’ 테스트 조건을 선택합니다.

  • 베타 테스트: 서비스 배포와 동일한 환경에서 템플릿 자동분류, 판독 영역 테스트가 가능합니다. 베타 배포 후 베타 테스트 및 서비스 배포를 할 수 있습니다.
  • 템플릿 판독 테스트: 판독 영역이 설정된 템플릿/모델에 대한 테스트 및 결과 확인, 다운로드가 가능합니다.

ocr37_1

파일 찾기 버튼을 클릭하면 이미지 파일을 업로드할 수 있는 팝업 창이 노출됩니다. 테스트할 이미지에 맞는 템플릿 선택 → 이미지 업로드 → 테스트 버튼을 클릭하면, 판독 결과를 확인할 수 있습니다.

ocr38_1

  • 베타와 템플릿 판독 테스트 횟수를 합산하여 월 300회 무료 테스트를 제공합니다.

    ocr39_1

  • 테스트 결과는 csv와 json 형식으로 다운로드 가능하며 테스트 결과 오른쪽에서 영역별, 하위 필드별, 개별 필드별 판독 결과를 표 형태로 제공합니다.

    • 개별 필드만 지정했을 경우, 판독 결과 화면입니다.

      ocr43_2

    • 영역 내 하위 필드가 있을 경우, 판독 결과 화면입니다.

      ocr40_1

왼쪽 메뉴의 통합지표를 클릭합니다.

  • 최대 90일까지 기간 선택이 가능합니다.
  • 선택한 템플릿별 지표를 확인할 수 있으며 모든 템플릿 선택 시 전체 도메인에 대한 지표가 출력됩니다.
  • 일별 API 호출 수: 설정된 기간 동안 일 별로 호출된 API 건수입니다.
  • 검증 결과: 템플릿별 외부 검증 결과를 확인할 수 있습니다.
  • 서비스 배포 템플릿 수: 날짜별 서비스 배포된 unique한 템플릿의 최대 수를 표시합니다.

ocr46_1

Step 5. 콤포넌트

용어사전

ocr47_1

  • 특정 필드에 해당 사전의 단어만 인식하도록 지정하거나 등록된 유사어들이 인식될 경우 대표어로 치환한 결과값을 노출합니다.

    • 엑셀 파일로 용어사전의 bulk 업로드 및 다운로드가 가능합니다.
    • 사전 이름을 검색할 경우 해당 용어사전의 검색결과가 보여지고 새로고침 버튼 클릭 시 용어사전 첫 페이지가 노출됩니다.
  • 용어사전 생성 버튼을 클릭하면 ‘사전 생성 및 수정’ 팝업 창이 열립니다.

    ocr48_1

  • 사전 이름: 중복되지 않는 고유한 사전 이름을 입력합니다.

  • 대표어: 사전을 구성하는 대표어를 입력합니다. 유사어: 입력한 대표어의 동의어 또는 유사어를 입력합니다. 복수의 유사어를 입력하는 경우 쉼표(,)로 구분합니다.(예: 지방세고지서, 지방세, 지방세 고지서)

Step 6. 설정

Clova OCR 빌더는 도메인 정보, 외부 연동, 권한 관리 등 손쉬운 설정 기능을 제공합니다.

ocr51_1

외부 연동

ocr50_1

최종 Clova OCR 검출/인식 결과값을 연동된 주소로 전달하기 위해 외부 플랫폼과 연동 설정을 해야 합니다. 외부로 안전하게 서비스를 제공할 수 있어야 하기 때문에 네이버 클라우드 플랫폼의 API Gateway 상품과 연동하여 제공됩니다.

ocr49_1

  • Custom API Gateway 설정을 통한 자동 연동
    • 설정 버튼 클릭 시 외부 주소와 연동 설정이 가능한 창이 노출됩니다.
    • Clova OCR Invoke URL은 외부 연동 Endpoint에 입력할 Clova OCR API 주소를 의미합니다.
    • API Gateway 이용 신청이 되어 있는 경우, 자동 연동 버튼을 클릭해 손쉽게 자동 연동할 수 있습니다.

검증 연동

ocr53_1

  • 데이터 전송

    ocr54_1

    • Clova OCR 결과를 전송할 주소를 직접 설정하고 관리할 수 있습니다.
    • 생성 버튼 클릭 후 ${결과 전송 이름} 형식으로 이름을 입력합니다.
    • URL 필드에 https:// 로 시작하는 URL을 입력합니다.

권한 권리

ocr55_1

  • 새로운 관리자를 추가하고 권한을 부여합니다.

    • 권한 설정 URL 생성 : 버튼 클릭 시 invite URL 생성되며 URL을 통해 권한 부여가 가능합니다.

    • URL 복사 버튼 클릭 시 Invite URL 복사 alert이 노출됩니다.

      ocr70_1

    • 삭제 버튼 클릭 시 Invite URL 삭제 alert이 노출됩니다.

Step 7. 배포 관리

베타 배포는 모델에 반영되는 최종 저장 기능으로 템플릿에 적용한 샘플, 판독 영역 및 용어사전 등을 학습할 수 있습니다. 베타 배포 후 베타 테스트 및 서비스 배포가 가능합니다.

왼쪽 메뉴의 배포 관리를 클릭하면 템플릿 목록을 확인할 수 있습니다.

ocr57_1

  • 일 최대 서비스 배포 템플릿 수: 당일 서비스 배포된 unique한 템플릿의 최대 수를 표시합니다.

  • 템플릿 선택: 드롭다운 박스에서 템플릿을 선택하면 해당 템플릿의 배포 내역이 출력됩니다.

    ocr60_1

  • 현재 배포 상태: 해당 템플릿의 최신 배포 상태를 표시합니다.

템플릿 목록에서 배포할 템플릿을 선택하면 베타 배포 버튼이 활성화됩니다.

ocr61_1

베타 배포 버튼을 클릭하면 베타 배포 템플릿 목록을 확인할 수 있습니다.

ocr62_1

확인 버튼을 클릭하여 베타 배포를 진행합니다. 배포 완료 후 베타 테스트가 가능합니다. 테스트 메뉴에서 판독 결과 테스트 후 수정한 정보는 새로운 베타 배포를 통해 적용됩니다.

ocr63_1

베타 테스트가 완료된 최신 베타 배포 템플릿을 서비스 배포합니다.

Clova OCR 빌더 최상단 서비스 배포 버튼을 클릭합니다.

ocr64_1

서비스 배포 창에서 서비스 배포 템플릿 목록과 일 최대 서비스 배포 템플릿 수 확인이 가능합니다.

확인 버튼을 클릭하여 서비스 배포를 진행합니다.

ocr65_1

템플릿 별 배포 내역은 배포 관리 오른쪽 드롭다운 박스에서 특정 템플릿 선택을 통해 확인할 수 있습니다.

ocr58_1

연관 정보 바로가기

Clova OCR 사용방법 및 API 연동 관련하여 아래 사용 가이드를 참고하실 수 있습니다.

""에 대한 건이 검색되었습니다.

    ""에 대한 검색 결과가 없습니다.

    처리중...