반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 문맥교환
- 카프카
- AWS Crawler
- 프로그래머스
- 데이터엔지니어링
- 런타임데이터영역
- 데이터베이스복사
- lazy evaluation
- 하둡1.0
- kafka 설치
- 하둡에코시스템
- freenom
- ORACLE MSSQL차이
- 서버간 복사
- 프로그래머스 큰 수 만들기
- Spark 최적화
- EMR 구조
- 하둡2.0
- 실행엔진
- 데이터파이프라인
- 빌드도구
- 데이터 수집
- Databricks
- 스파크
- 하둡
- 지연연산
- 프로그래머스힙
- ORACLE문법
- Spark
- Catalyst Optimizer
Archives
- Today
- Total
띵유로그
[데이터파이프라인] EMR에서 Spark 모니터링(Ganglia) 본문
반응형
이번시간에는 Spark 모니터링 어플리케이션인 ganglia를 확인해보겠습니다.
처음 ganglia 웹서버 주소를 복사해서 접근시도하면 실패메세지가 뜹니다.
/etc/httpd/conf.d/ganglia.conf의
Order dendy 로 되어있는 부분을 allow로 바꾸고 웹서버를 재가동해야합니다.
또는 아래 shell파일을 S3에 저장해놓고 EMR 클러스트에 단계를 추가합니다.
if [ -f "/etc/httpd/conf.d/ganglia.conf" ]; then
echo "Setting up ganglia on master node"
sudo sed -i 's/Order deny,allow/#Order deny,allow/g' /etc/httpd/conf.d/ganglia.conf
sudo service httpd reload
fi
<EMR 클러스터에 단계 추가하는 법>
- jar 위치 : 실행시킬 jar 파일. 각 리전별로 shell을 실행시킬 수 있는 jar 파일을 aws에서 제공합니다.
(s3://ap-northeast-2.elasticmapreduce/libs/script-runner/script-runner.jar)
- 인수 : shell 위치
반응형
'DataEngineering' 카테고리의 다른 글
[데이터파이프라인] Glue (0) | 2022.02.22 |
---|---|
[데이터파이프라인] AWS Glue Crawler 시작하기 (0) | 2022.02.17 |
[데이터 분석 파이프라인] EMR 구조와 실행 (0) | 2022.02.12 |
[데이터파이프라인-2] Api gateway, Kinesis 테스트 (0) | 2022.02.06 |
[데이터 파이프라인-2] Kinesis 구성하기 (0) | 2022.01.29 |
Comments