반응형
Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- freenom
- 실행엔진
- 런타임데이터영역
- 카프카
- kafka 설치
- 서버간 복사
- 프로그래머스
- EMR 구조
- Spark 최적화
- lazy evaluation
- 프로그래머스힙
- Catalyst Optimizer
- 데이터 수집
- 지연연산
- ORACLE MSSQL차이
- 하둡2.0
- 빌드도구
- Databricks
- 문맥교환
- 하둡
- 데이터파이프라인
- 스파크
- 프로그래머스 큰 수 만들기
- 하둡에코시스템
- 하둡1.0
- AWS Crawler
- 데이터엔지니어링
- 데이터베이스복사
- Spark
- ORACLE문법
Archives
- Today
- Total
띵유로그
Databricks 환경 구성 본문
반응형
Databricks란?
Spark실행환경을 제공하는 클라우드 서비스이다.
통합 분석 플랫폼으로, 사용자가 한곳에서 모든 분석을 다 할 수 있도록 해준다.
아래 내용들을 모두 지원
- reports
- dashboards
- ETL 작업 실행 (Extract, Transform, Load)
- 머신러닝, 스트림 작업
- 아파치 Spark보다 더 optimized.
- Databricks 서버와 실시간으로 interaction
Spark는 여러 분산된 서버들간의 연결을 해야하기 때문에 설치가 어렵다. Databricks는 이러한 어려움을 없애고 analytics에만 집중할 수 있도록 해준다. invite 기능이 있어서 여러명이 함께 작성 할 수도 있다.
1. 오른쪽 상단 TRY Databricks 버튼을 눌러 Community 버전으로 시도하자

2. 왼쪽 바의 Clusters를 클릭해서 클러스터를 만든다.

3. 왼쪽 상단의 Create Cluster버튼을 눌러 클러스터를 만든다.

4. Notebook을 import 한다.


5. 아래와 같이 노트북이 실행되는것을 확인할 수 있다. 여러가지 언어를 지원한다.

반응형
Comments