일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- slack app
- HBase
- Kafka
- Windows
- NoSQL
- docker
- hadoop
- ambari
- HDFS
- MapReduce
- HDP
- Scala
- execution_date
- Service
- slack
- Namenode
- SlackWebhookOperator
- Lambda architecture
- python
- 빅데이터
- 람다 아키텍처
- jupyter
- airflow
- java
- yarn
- Example DAG
- re
- LDAP
- HIVE
- 정규표현식
- Today
- Total
IT 삽질기
HBase란 - HBase 용어 정리 본문
HBase 용어 정리
Table
다중 로우로 구성된 집합으로 RDB에서의 table와 비슷한 개념이지만 테이블을 만들 때 Column을 지정해주는 것이 아니라 Column Family만 지정
Row
RowKey와 Column으로 구성되며, RowKey를 기준으로 알파벳 오름차순으로 정렬되어 저장되기 때문에 로우키 설계가 매우 중요
후에 다시 언급하겠지만 HBase 데이터는 리전 서버에 저장이 되는데 이 때 같은 리전서버에 있는 것과 다른 리전서버에 있는 데이터를 불러오는 경우 속도차이가 날 수 있어 로우키를 어떻게 설계하는지가 중요
Row Key
Row를 구분하기 위한 구분자로 RDB에서의 primary key와 비슷한 개념을 가짐
Column Famaily
물리적으로 모든 Column Family단위로 파일 시스템에 저장이 되는데 이 때문에 사실상 Table에 Column Family가 많아지면 서로 다른 Table에 저장하는 것과 같은 성능이 나타날 수 있음
Column Qualifier
HBase에서의 Column Qualifier은 Table 생성시 지정하지 않으며 Table 생성시 지정한 [Column Family]:[Column Qualifier]형식과 같이 :으로 구분하여 사용된다. Column Family와의 구분자가 : 이기 때문에 Column Qualifier에는 :이 들어가면 안된다.
Column
Column Famaily와 Column Qualifler이 합쳐진 것으로 :으로 구분
Cell
Row Key, Column, Version이 명시된 튜플
Timestamp
주어진 값의 버전 식별자로 값과 나란히 기록되며 데이터가 기록될 때의 RegionSever의 시간을 가짐. Version옵션을 이용하여 각기 다른 Timestamp의 값을 한 row에 저장하는 것이 가능
HBase란 - HBase 특징, 장단점 https://dydwnsekd.tistory.com/4?category=775994
참고자료
https://cyberx.tistory.com/164
https://www.joinc.co.kr/w/man/12/hadoop/hbase/about
http://hbase.apache.org/book.html#conceptual.view
'BigData > HBase' 카테고리의 다른 글
HBase 데이터 쓰기/읽기 과정 (0) | 2021.05.15 |
---|---|
HBase tools를 이용한 HBase balancing (0) | 2021.03.10 |
HBase 튜닝하기 (0) | 2021.03.07 |
HBase 테이블별 용량 확인 (0) | 2019.04.27 |
HBase란 - HBase의 특징과 장단점 (0) | 2019.03.18 |