일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- java
- HBase
- LDAP
- docker
- airflow
- 람다 아키텍처
- Kafka
- jupyter
- Scala
- Namenode
- yarn
- HDP
- execution_date
- HDFS
- Service
- slack
- MapReduce
- slack app
- HIVE
- hadoop
- re
- Windows
- python
- 정규표현식
- 빅데이터
- Lambda architecture
- SlackWebhookOperator
- Example DAG
- NoSQL
- ambari
Archives
- Today
- Total
목록Combiner (1)
IT 삽질기
Combiner 함수
이번 글에서는 Hadoop MapReduce 과정에서 이야기하는 Combiner 함수에 대해 알아보도록 하자. Combiner 함수 Hadoop을 사용하면 데이터를 분산처리하고 많은 양의 자원을 사용할 수 있지만 무한한 자원을 사용하는 것은 아니다. Map, Reduce 작업 진행시 자원을 최소화하여 사용할 필요가 있는데 Combiner는 Map-Reduce간 데이터 전송을 최소화할 수 있게 해준다. Combiner 함수는 Reduce 함수의 출력이 Reduce 함수의 입력이 되는 것을 허용하는 것을 뜻한다. 예를 들어 최대값, 최솟값, count와 같은 결과를 얻기 위해 Map task에서 취합한 결과를 reduce에서만 진행하는 것이 아니라 각각의 Map task에서 최댓값, 최솟값, count와 같..
BigData/Hadoop
2021. 8. 18. 23:50