일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Lambda architecture
- slack app
- hadoop
- NoSQL
- java
- Namenode
- jupyter
- HIVE
- HDP
- Windows
- yarn
- HBase
- 정규표현식
- 람다 아키텍처
- Service
- airflow
- MapReduce
- docker
- SlackWebhookOperator
- python
- Example DAG
- HDFS
- Scala
- slack
- ambari
- LDAP
- re
- Kafka
- execution_date
- 빅데이터
Archives
- Today
- Total
목록Hadoop 2.0 (1)
IT 삽질기
Hadoop 1.0과 Hadoop 2.0 (1 YARN)
이번 글에서는 Hadoop 1.0과 Hadoop 2.0의 차이점에 대해서 간단하게 알아보도록 하자. Hadoop 버전에 따른 아키텍처를 비교해서 살펴보면 아래와 같다. Hadoop 2.0에서는 클러스터의 자원을 관리하기 위한 시스템으로 YARN이 도입되었다. YARN은 Resource Manager와 Node Manager 2 가지 유형의 실행 데몬을 통해 핵심 서비스를 제공하게 되는데, 이는 Hadoop 1.0에 있는 JobTracker와 TaskTracker를대신해 등장한 개념이라고 생각하면 된다. Hadoop 1.0에서의 JobTracker는 3가지 기능을 했는데 1. 클러스터 전체의 리소스 관리 2. 잡을 수행하며 성공적으로 일을 마칠 수 있도록 관리 3. 완료된 Job에 대한 이력을 저장(잡트래..
BigData/Hadoop
2019. 6. 10. 00:02