사용하기 전에

Q. Cloud Hadoop에서 제공되는 Hive는 어떻게 사용하나요?

  • Hive는 Hadoop 기반의 데이터 웨어하우징 프레임워크로, Cloud Hadoop 상품 내의 모든 클러스터 Type에서 기본적으로 사용 가능합니다.
  • 공인 IP와 ACG 설정을 통하여 Hive 접근이 가능하므로, 사전에 클러스터 접속:서버 직접 접속, 터널링을 참고하여 설정합니다.

Q. Hive의 메타스토어는 어떻게 구성되었나요?

  • 내장형 Derby를 사용하지 않으므로 동시 세션을 지원할 수 있는 구조입니다.
  • 마스터 노드에 별도의 MySQL DB를 통하여 메타 데이터를 관리합니다.

Q. Hive 실행 엔진은 변경 가능한가요?

  • MapReduce와 TEZ를 제공하며, 기본 실행 엔진은 TEZ로 설정되어 있습니다.

Ambari를 통한 HIVE 접속

Ambari를 사용하여 다음과 같은 방법으로 접속이 가능합니다.

Step 1. Cloud Hadoop 콘솔 페이지

chadoop-4-2-101

① Hive 접근을 위한 클러스터 항목을 선택합니다.

Application별 보기를 클릭합니다.

Ambari Web 콘솔을 선택하면 웹브라우저에 Ambari 접속 창이 열립니다.

  • 웹브라우저의 주소 입력란에 직접 {클러스터 공인 IP 주소}:{포트 번호}를 입력하여 Ambari에 접속할 수도 있습니다.

Step 2. Ambari 로그인 페이지

chadoop-4-2-102

① 사용자 계정을 입력합니다.

② 패스워드를 입력합니다.

Step 3. Ambari 메인 페이지

chadoop-4-2-103

① 카테고리 내에서 Hive를 선택합니다.

② 현재 가동 중인 서버들의 Monitoring, Alerts, Components 등을 확인할 수 있습니다.

③ JDBC 연결을 위한 URL을 클립보드로 복사할 수 있습니다.

④ Hive에 접근합니다.

⑤ Hive에서 수행한 Query에 대한 Debug를 수행합니다.

Step 4. Hive에서 쿼리 수행

chadoop-4-2-104

① 쿼리를 수행하는 기본 탭입니다.

② 사용하고자 하는 쿼리를 작성합니다.

③ 작성된 쿼리를 실행합니다.

Step 5.1 수행 결과 확인

chadoop-4-2-105

① 테이블에 관한 정보를 확인하는 탭입니다.

② 테이블의 COLUMNS 속성을 조회합니다.

Step 5.2 수행 결과 확인

chadoop-4-2-106

① 테이블에 관한 정보를 확인하는 탭입니다.

② DDL 생성 구문을 확인할 수 있습니다.

Hive 설정 확인 및 변경

chadoop-4-2-107

① Ambari 메인 페이지에서 Hive를 선택합니다.

Configs를 선택하면 현재 Hive에 설정된 값을 확인하고 수정할 수 있습니다.

  • Optimization의 기본값은 TEZ 엔진이며, Cost Based Optimizer 모드로 동작합니다.

터미널을 통한 HIVE 접속

Windows에서 Putty를 사용하여 접속하는 과정은 아래와 같습니다.

Putty 접속 설정

chadoop-4-2-108

① Putty.exe를 실행한 후, Category > Connection > SSH > Auth 경로에서 Private Key file for authentication 항목에 접속 대상 서버의 클러스터 인증키를 불러옵니다.

Host Namesshuser@{접속 대상 클러스터 공인 IP 주소}를 입력하고 Port에 22를 입력합니다.

터미널 접근

chadoop-4-2-109

① 서버 접속이 확인되면 hive를 실행합니다.

  • hive> 커맨드 창에서 원하는 명령을 실행합니다.

연관 정보 바로가기

Hadoop 클러스터 생성, 관리 및 사용 관련하여 아래 사용 가이드를 참고하실 수 있습니다.

""에 대한 건이 검색되었습니다.

    ""에 대한 검색 결과가 없습니다.

    처리중...