Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 레드햇
- recursive
- Spring
- 아마존
- data
- hadoop
- Data Structure
- 설치
- storage
- redhat
- java
- 자바
- 알고리즘
- rhcsa
- 도커
- 재귀
- big data
- 자료구조
- sort
- 하둡
- 스토리지
- algorithm
- Amazon
- 리눅스
- docker
- 빅데이터
- 스프링
- AWS
- Redshift
- linux
Archives
- Today
- Total
Developer MJ
[AWS] 데이터 웨어하우스 (Data Warehouse) 본문
데이터 최종 사용자가 정보에 입각한 의사 결정을 내릴 수 있도록 분석 가능한 구조화된 데이터의 중앙 리포지토리
범위용 질의를 통한 OLAP성 업무에 특화되어, 특정 값을 찾는 OLTP성 업무에 적절하지 않다.
Star/Snowflake Schema의 형태를 띄며 Fact 테이블에 각 Dimension 테이블의 키 값을 적재함으로서 중복 데이터가 발생할 수 있다.
구조화하면 안되는 데이터를 DW로 밀어넣지 않고, Raw형태로 남겨두고 copy하여 사용해야 한다.
아키텍처
- 하단 티어는 데이터가 로드되고 저장되는 데이터베이스 서버
- 중간 티어는 데이터를 액세스하고 분석하는 데 사용되는 분석 엔진
- 상단 티어는 보고, 분석 및 데이터 마이닝 도구를 통해 결과를 제시하는 프런트 엔드 클라이언트
Data Mining - 데이터 사후 처리 관점의 데이터 분석
Data Science - Data Mining을 포함하면서 데이터를 활용한 사전 예측에 중점하는데이터 분석 분야
Data Mart - DW의 부분 집합으로 하부 조직에 한정된 단일주제를 모델링
'AWS' 카테고리의 다른 글
[AWS] Amazon Redshift (0) | 2019.05.22 |
---|---|
[AWS] Big Data - Spark (0) | 2019.02.15 |
[AWS] Big Data - 하둡 프로그래밍 프레임워크 (0) | 2019.02.15 |
[AWS] Big Data - Hadoop & EMR (0) | 2019.02.15 |
[AWS] Big Data - 스토리지 (0) | 2019.02.15 |