일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- SlackWebhookOperator
- 정규표현식
- Windows
- ambari
- yarn
- HIVE
- python
- Kafka
- slack
- hadoop
- LDAP
- NoSQL
- MapReduce
- Example DAG
- Lambda architecture
- java
- Scala
- 람다 아키텍처
- docker
- slack app
- 빅데이터
- HBase
- HDFS
- airflow
- Namenode
- jupyter
- Service
- execution_date
- re
- HDP
Archives
- Today
- Total
목록Hadoop3 (1)
IT 삽질기
Hadoop3 변경점
Hadoop3에서 변경된 내용 중 몇몇 중요한 사항들에 대해 알아보도록 하자 Java8 기존의 Hadoop2는 Java 7버전을 지원했는데 Hadoop3를 사용하기 위해서는 Java8를 설치해야 한다 erasure coding 가장 큰 변경점 중 하나인 erasure coding은 기존의 Hadoop2에서 문제가 되었던 스토리지 관련 문제를 해결한다 Hadoop2 에서는 기본적으로 데이터를 저장하기 위해 3배의 용량이 필요했다 예를 들어, 1TB의 데이터를 저장하기 위해서는 3TB의 용량이 필요했던 것이다 이는 HDFS에서 데이터 유실이 일어나지 않게 해주는 역할을 함과 동시에 데이터를 많이 저장할 수 없는 단점으로 작용했다 물론 설정을 통해 Replication 수를 줄여 용량을 확보하는 방법이 있지만..
BigData/Hadoop
2021. 4. 12. 23:40