IT 삽질기

HBase란 - HBase의 특징과 장단점 본문

BigData/HBase

HBase란 - HBase의 특징과 장단점

화이팅빌런 2019. 3. 18. 23:11

Apache HBase란?


Hadoop 플랫폼을 위한 구글의 BigTable을 본보기로 자바를 기반으로 만들어진 데이터 비관계형 분산 데이터 베이스이다.

NoSQL로 분류되며 스키마 지정 및 변경 없이 데이터를 저장할 수 있으며 하둡의 분산 파일 시스템인 HDFS에서 동작하기 때문에 가용성 및 1)확장성을 그대로 이용할 수 있다.

구글의 BigTable 논문에 설명된 2)Bloom필터 기능을 제공하며 자바를 기반으로 만들어져 자바 API, REST, Avro, Thrift를 통해 접근 가능


HBase의 특징

- 선형 확장성을 가짐

- 읽기와 쓰기의 일관성 제공

- Hadoop 시스템과 연계하기 편리 source와 destination으로 사용 가능

- 클러스터를 통한 데이터 복제로 장애 극복(fail over)가능


HBase의 장점

1. 대용량의 데이터를 안정적으로 다루는데 효과적

   중앙의 전체 분산 시스템을 통제하는 마스터를 두고 전체 데이터의 일관성을 관리하여 복제 데이터 사이의 일관성을 보장

2. 대량의 데이터 분석 처리 지원에 적합

   HDFS, mapreduce등과 함께 사용하기에 최적화

3. region 서버를 추가하면 확장 및 성능을 유지할 수 있음


HBase의 단점

1. 특정 region 서버에 특정 table의 region이 집중되기 쉬워 성능저하로 이어질 수 있음.

2. 적절한 세팅을 위한 조건자료가 있으나 클러스터 규모나 기본 스팩차이가 있어 적용이 힘들 수 있음


1) 확장성 : 요구에 맞게 시스템을 확장하는 기능으로 하드웨어를 추가하거나 기존 하드웨어를 업그레이드 하여 시스템을 확장할 수 있는 것

2) Bloom필터 : 1970년도에 Burton H.Bloom이 고안한 것으로 공간 효율적인 probabilistic data structure로 구성요소가 집합의 구성원인지 점검하는데 사용. HBase에서는 HFile안에 row와 column이 존재하는지 검사하기 위한 용도로 사용


HBase란 - HBase 용어 정리 https://dydwnsekd.tistory.com/5?category=775994


참고자료

https://cyberx.tistory.com/164

https://www.joinc.co.kr/w/man/12/hadoop/hbase/about

https://bitnine.tistory.com/entry/HBase%EC%97%90-%EB%8C%80%ED%95%98%EC%97%AC-1-%E2%80%93-%EA%B0%9C%EC%9A%94

https://weejw.tistory.com/58

http://hbase.apache.org/book.html#conceptual.view

'BigData > HBase' 카테고리의 다른 글

HBase 데이터 쓰기/읽기 과정  (0) 2021.05.15
HBase tools를 이용한 HBase balancing  (0) 2021.03.10
HBase 튜닝하기  (0) 2021.03.07
HBase 테이블별 용량 확인  (0) 2019.04.27
HBase란 - HBase 용어 정리  (0) 2019.03.20
Comments