Developer MJ

[AWS] Big Data - 데이터 수집 및 전송 본문

AWS

[AWS] Big Data - 데이터 수집 및 전송

MIN JOON 2019. 2. 13. 21:29

수집 및 전송
  • 데이터 수집
    • 트랜잭션( 데이터베이스 읽기/쓰기) - 앱, 웹 서버 => DB
    • 파일 - Flume, Log4j from Device => S3
    • 스트림 - FluentD, Sqoop, Storm => Kinesis
  • 데이터 전송
    • Apache DistCp
      - HDFS에서 스토리지로 대용량 데이터를 MapReduce를 사용하여 분산방식으로 복사
    • Apache Sqoop
      - HDFS와 관계형 데이터베이스 사이에서 데이터를 전송가능
    • Snowball
      - 하루 최대 50테라 전송가능
      - KMS를 통해 암호화
    • Snowball Edge
      - 100테라 로컬 스토리지
      - S3 호환 엔드포인트, Lambda함수 지원
      - Snowball 보다 4배 빠름
      - KMS를 통해 암호화
    • Snowmobile
      - 모든 리전에서 사용가능한 엑사바이트 규모의 데이터 전송 서비스
      - KMS를 통해 암호화