반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 하둡1.0
- 하둡에코시스템
- 지연연산
- 하둡2.0
- 빌드도구
- EMR 구조
- 프로그래머스
- 문맥교환
- 프로그래머스힙
- Catalyst Optimizer
- Spark
- 실행엔진
- 카프카
- lazy evaluation
- 데이터파이프라인
- Spark 최적화
- 데이터엔지니어링
- 하둡
- 스파크
- ORACLE문법
- Databricks
- ORACLE MSSQL차이
- kafka 설치
- 데이터베이스복사
- 런타임데이터영역
- 데이터 수집
- 프로그래머스 큰 수 만들기
- AWS Crawler
- 서버간 복사
- freenom
Archives
- Today
- Total
띵유로그
Databricks 환경 구성 본문
반응형
Databricks란?
Spark실행환경을 제공하는 클라우드 서비스이다.
통합 분석 플랫폼으로, 사용자가 한곳에서 모든 분석을 다 할 수 있도록 해준다.
아래 내용들을 모두 지원
- reports
- dashboards
- ETL 작업 실행 (Extract, Transform, Load)
- 머신러닝, 스트림 작업
- 아파치 Spark보다 더 optimized.
- Databricks 서버와 실시간으로 interaction
Spark는 여러 분산된 서버들간의 연결을 해야하기 때문에 설치가 어렵다. Databricks는 이러한 어려움을 없애고 analytics에만 집중할 수 있도록 해준다. invite 기능이 있어서 여러명이 함께 작성 할 수도 있다.
1. 오른쪽 상단 TRY Databricks 버튼을 눌러 Community 버전으로 시도하자
2. 왼쪽 바의 Clusters를 클릭해서 클러스터를 만든다.
3. 왼쪽 상단의 Create Cluster버튼을 눌러 클러스터를 만든다.
4. Notebook을 import 한다.
5. 아래와 같이 노트북이 실행되는것을 확인할 수 있다. 여러가지 언어를 지원한다.
반응형
Comments