일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- HBase
- 람다 아키텍처
- slack app
- docker
- HIVE
- LDAP
- HDP
- re
- airflow
- 정규표현식
- python
- MapReduce
- 빅데이터
- ambari
- Windows
- Lambda architecture
- SlackWebhookOperator
- jupyter
- execution_date
- Scala
- hadoop
- Example DAG
- NoSQL
- java
- yarn
- HDFS
- slack
- Service
- Kafka
- Namenode
Archives
- Today
- Total
목록Kudu (1)
IT 삽질기

Kudu란? kudu는 Apache Hadoop Ecosystem 저장소 중 하나로 Columnar Storage이다. Columnar 형식으로 HBase와 같이 NoSQL이 아니므로 schema를 가지고 있으며, column별로 파일을 저장한다. Kudu에서 실제로 데이터를 저장하는 형식은 아래와 같은대, 일반적으로 알고 있는 RDB와 거의 동일한 형태를 가진다. Kudu 공식 문서에서는 Kudu의 장점을 아래와 같이 소개하고 있다 - OLAP 워크로드의 빠른 처리 - MapReduce, Spark 및 기타 Hadoop Ecosystem과의 통합 - Impala를 이용한 다양한 질의 - 순차 및 random access에서의 강력한 성능 - HA기능 제공 Kudu Architecture Kudu는 위와..
BigData
2021. 5. 8. 02:36