띵유로그

[데이터 파이프라인-2] Kinesis 구성하기 본문

DataEngineering

[데이터 파이프라인-2] Kinesis 구성하기

띵유 2022. 1. 29. 20:42
반응형

1. Kinesis 데이터스트림 구성

2. 컨슈머 설정 (Firehorse)

Delivery streams 항목 -> Create delivery stream

 

2-1. Firehorse (consumer 역할)상세 설정사항

설정하는 방법은 쉽다.그냥 source와 destination을 지정해주면 된다.
Source : 키네시스 데이터 스트림
Destination : S3

가져올 스트림의 이름을 적어준다. (스트림 이름 : class-stream)

가져올 때 람다 transformation 도 할 수 있으나 여기서는 하지 않았다. (disable)

Data 형식도 바꿀 수 있다. bigdata format인 Parquet와 ORC로 바꿀 수 있다.
(Avro 와 함께 분산 처리, 저장하는 포맷으로 binary 압축된 포맷 )

https://www.datanami.com/2018/05/16/big-data-file-formats-demystified/

또 Glue라는 어플리케이션으로 보내 ETL 작업을 추가로 할 수 있다. (다음에 glue에 대해서도 따로 공부해야겠다.. 잘 알아두면 쓸 일이 많을 듯)

반응형
Comments