Cloud Hadoop 개요

이번 페이지에서는 Cloud Hadoop 상품에 대한 개요와 클러스터안에서 데이터 처리가 어떤 흐름으로 되는지를 설명합니다.

목차

Cloud Hadoop 클러스터의 구성

하둡 클러스터는 데이터를 분산저장하고 분석을 목적으로 구성된 클러스터, 노드의 집합이라고 할 수 있습니다. 클러스터안에 노드는 목적에 따라서 보통 Cloud Hadoop에서 노드는 아래와 같이 세가지 타입이 존재합니다.

엣지노드

외부 접속을 위한 Gateway용 노드입니다.

마스터노드

작업자 노드를 모니터링하는 관리자노드입니다. 고가용성 지원으로 2대의 마스터 노드가 생성되며 개수 변경은 불가능합니다.

작업자노드

마스터 노드의 명령을 받고 실제 데이터 분석 등의 작업을 수행하는 노드입니다. 최초 생성은 최소 1개, 최대 8개까지 가능하며, 그 이후에는 동적으로 노드 추가/삭제가 가능합니다.

Cloud Hadoop을 사용해야 하는 이유

Cloud Hadoop은 오픈 소스 컴포넌트가 구축된 클러스터를 사용자가 자유롭게 사용할 수 있다는 것이 특징입니다. 터미널을 통한 서버 직접 접속을 허용하고 Ambari를 통해서 제공되는 편리한 클러스터 관리 기능을 통해 사용자가 직접 관리하는 설치형 클러스터 서비스입니다.

Cloud Hadoop 아키텍쳐

Cloud Hadoop 상품은 Hadoop 클러스터를 쉽고 간편하게 구축하고 관리할 수 있는 서비스로, Hadoop, HBase, Spark, Presto 등의 구성 요소를 만들어 대용량 데이터 처리를 위한 시스템을 구축하고 운영할 수 있습니다. 클러스터에는 대량의 데이터를 처리할 수 있는 오픈 소스 프레임워크인 Apache Hadoop, HBase, Hive, Spark를 설치할 수 있습니다.

""에 대한 건이 검색되었습니다.

    ""에 대한 검색 결과가 없습니다.

    처리중...