IT 삽질기

HBase란 - HBase 용어 정리 본문

BigData/HBase

HBase란 - HBase 용어 정리

화이팅빌런 2019. 3. 20. 17:38

HBase 용어 정리



Table

다중 로우로 구성된 집합으로 RDB에서의 table와 비슷한 개념이지만 테이블을 만들 때 Column을 지정해주는 것이 아니라 Column Family만 지정


Row

RowKey와 Column으로 구성되며, RowKey를 기준으로 알파벳 오름차순으로 정렬되어 저장되기 때문에 로우키 설계가 매우 중요

후에 다시 언급하겠지만 HBase 데이터는 리전 서버에 저장이 되는데 이 때 같은 리전서버에 있는 것과 다른 리전서버에 있는 데이터를 불러오는 경우 속도차이가 날 수 있어 로우키를 어떻게 설계하는지가 중요


Row Key

Row를 구분하기 위한 구분자로 RDB에서의 primary key와 비슷한 개념을 가짐


Column Famaily

물리적으로 모든 Column Family단위로 파일 시스템에 저장이 되는데 이 때문에 사실상 Table에 Column Family가 많아지면 서로 다른 Table에 저장하는 것과 같은 성능이 나타날 수 있음


Column Qualifier

HBase에서의 Column Qualifier은 Table 생성시 지정하지 않으며 Table 생성시 지정한 [Column Family]:[Column Qualifier]형식과 같이 :으로 구분하여 사용된다. Column Family와의 구분자가 : 이기 때문에 Column Qualifier에는 :이 들어가면 안된다.


Column

Column Famaily와 Column Qualifler이 합쳐진 것으로 :으로 구분


Cell

Row Key, Column, Version이 명시된 튜플


Timestamp

주어진 값의 버전 식별자로 값과 나란히 기록되며 데이터가 기록될 때의 RegionSever의 시간을 가짐. Version옵션을 이용하여 각기 다른 Timestamp의 값을 한 row에 저장하는 것이 가능



HBase란 - HBase 특징, 장단점 https://dydwnsekd.tistory.com/4?category=775994


참고자료

https://cyberx.tistory.com/164

https://www.joinc.co.kr/w/man/12/hadoop/hbase/about

https://bitnine.tistory.com/entry/HBase%EC%97%90-%EB%8C%80%ED%95%98%EC%97%AC-1-%E2%80%93-%EA%B0%9C%EC%9A%94

https://weejw.tistory.com/58

http://hbase.apache.org/book.html#conceptual.view



'BigData > HBase' 카테고리의 다른 글

HBase 데이터 쓰기/읽기 과정  (0) 2021.05.15
HBase tools를 이용한 HBase balancing  (0) 2021.03.10
HBase 튜닝하기  (0) 2021.03.07
HBase 테이블별 용량 확인  (0) 2019.04.27
HBase란 - HBase의 특징과 장단점  (0) 2019.03.18
Comments