일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Example DAG
- ambari
- 빅데이터
- slack app
- SlackWebhookOperator
- Scala
- re
- Kafka
- hadoop
- Service
- MapReduce
- Namenode
- LDAP
- HDP
- HDFS
- HBase
- docker
- Lambda architecture
- python
- NoSQL
- yarn
- HIVE
- 람다 아키텍처
- java
- airflow
- execution_date
- 정규표현식
- slack
- jupyter
- Windows
Archives
- Today
- Total
목록Sqoop (1)
IT 삽질기
sqoop이란 ?
sqoop이란? sqoop은 일반적으로 사용하는 RDBMS(MySQL, Oracle)와 HDFS(Hive, HBase)간 데이터를 전송하기 위해 사용하는 툴로 HDFS 저장소를 기준으로 import(RDBMS -> HDFS), export(HDFS -> RDBMS) 기능을 제공하며, MapReduce방식으로 동작한다. 특별한 설정이 없는 경우 text file형식으로 HDFS에 적재되지만, 설정을 통해 sequence file, avro, parquet에 대한 형식을 지원한다. 여기서는 sqoop의 import와 export에 대해서 알아보도록 하자 Sqoop import 먼저 sqoop import 과정에 대해 알아보자. sqoop import는 아래와 같이 동작한다. 순서에 따라 살펴보도록 하자. (..
BigData
2021. 5. 18. 23:52