띵유로그

Databricks 환경 구성 본문

카테고리 없음

Databricks 환경 구성

띵유 2020. 12. 6. 21:33
반응형

Databricks란?

Spark실행환경을 제공하는 클라우드 서비스이다.
통합 분석 플랫폼으로, 사용자가 한곳에서 모든 분석을 다 할 수 있도록 해준다.
아래 내용들을 모두 지원

- reports
- dashboards
- ETL 작업 실행 (Extract, Transform, Load)
- 머신러닝, 스트림 작업
- 아파치 Spark보다 더 optimized.
- Databricks 서버와 실시간으로 interaction

Spark는 여러 분산된 서버들간의 연결을 해야하기 때문에 설치가 어렵다. Databricks는 이러한 어려움을 없애고 analytics에만 집중할 수 있도록 해준다. invite 기능이 있어서 여러명이 함께 작성 할 수도 있다.


1. 오른쪽 상단 TRY Databricks 버튼을 눌러 Community 버전으로 시도하자

2. 왼쪽 바의 Clusters를 클릭해서 클러스터를 만든다.

3. 왼쪽 상단의 Create Cluster버튼을 눌러 클러스터를 만든다. 

4. Notebook을 import 한다.

5. 아래와 같이 노트북이 실행되는것을 확인할 수 있다. 여러가지 언어를 지원한다.

반응형
Comments