일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- HIVE
- execution_date
- Service
- hadoop
- Lambda architecture
- slack
- slack app
- 람다 아키텍처
- Kafka
- 정규표현식
- jupyter
- airflow
- re
- HDP
- MapReduce
- SlackWebhookOperator
- Example DAG
- NoSQL
- ambari
- HBase
- Windows
- Scala
- Namenode
- docker
- 빅데이터
- yarn
- LDAP
- HDFS
- python
- java
Archives
- Today
- Total
IT 삽질기
Resource Manager Active Standby 전환 이슈 본문
하둡 클러스터 운영중 Active Resource Manager가 내려간 후 Standby RM이 Active상태로 전환되지 않는 이슈 발생
이후 Active로 동작하고 있던 RM도 올라왔지만 역시 StandBy 상태로 Active상태로 전환되지 않음
리서치 결과
Zookeeper 관련 이슈로 판단
yarn-leader-election 이슈로 RM이 정상적으로 전환되지 않는 것
zkcli에 접근하여 직접 데이터를 삭제
#hdp zookeeper 경로
ex) /usr/hdp/current/zookeeper/bin/zkCli.sh
# zkCli에서
rmr /rmstore
rmr /yarn-leader-election
위의 명령어를 실행
zkCli 접근 화면
해당 명령어를 사용하면 NodeManager가 모두 내려가는 현상이 발생, 실행중이던 모든 잡들이 중지되며 rmstore, yarn-leader-election을 지우는 과정이 오래걸리므로 기다리는 과정이 필요하다
이후에도 RM이 정상적으로 전환되지 않는 경우에는 Zookeeper을 모두 재시작
필요에 따라 RM도 재시작하여 Active가 정상적으로 올라오는 것을 확인
'BigData > Hadoop' 카테고리의 다른 글
HDP(Ambari) Node Groups (0) | 2021.03.22 |
---|---|
HDP 인증 이슈(HDP repo 403 error) (0) | 2021.03.13 |
Ambari HDFS component 재시작 관련 이슈 해결(hadoop_lzo) (0) | 2021.03.08 |
Hadoop 1.0과 Hadoop 2.0 (1 YARN) (0) | 2019.06.10 |
HDFS 데이터 읽기/쓰기 (0) | 2019.06.09 |
Comments