Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

3계층 데이터 웨어하우스 아키텍처란 무엇입니까?

<시간/>

데이터 웨어하우스에는 일반적으로 다음을 포함하는 3단계(계층) 아키텍처가 있습니다.

  • 하위 계층 상대적으로 항상 관계형 데이터베이스 시스템인 웨어하우스 데이터베이스 서버입니다. 백엔드 도구 및 유틸리티는 운영 데이터베이스 또는 기타 외부 소스(외부 컨설턴트가 지원하는 사용자 프로필 데이터 포함)에서 최하위 계층으로 기록을 제공하는 데 사용됩니다.

이러한 도구와 유틸리티는 데이터 추출, 정리 및 변환(예:여러 소스의 동일한 데이터를 통합 형식으로 병합)과 로드 및 새로 고침 기능을 구현하여 데이터 웨어하우스를 업데이트합니다. 데이터는 게이트웨이라고 하는 응용 프로그램 인터페이스를 사용하여 추출됩니다.

게이트웨이는 기본 DBMS에서 지원되며 클라이언트 프로그램이 서버에서 실행할 SQL 코드를 생성할 수 있도록 합니다. 게이트웨이의 예로는 Microsoft의 ODBC(Open Database Connection) 및 OLEDB(Open-Linking and Embedding for Databases) 및 JDBC(Java Database Connection)가 있습니다. 이 계층에는 데이터 웨어하우스 및 해당 콘텐츠에 대한 데이터를 저장하는 메타데이터 저장소도 포함됩니다.

  • 중간 계층 ROLAP(Relational OLAP) 모델, 즉 다차원 데이터에 대한 연산을 표준 관계형 연산으로 매핑하는 확장 관계형 DBMS 또는 다차원 OLAP(MOLAP) 모델, 즉 특수- 다차원 데이터 및 연산을 직접 수행하는 목적 서버입니다.

  • 상위 계층 프론트 엔드 클라이언트 계층입니다. 여기에는 쿼리 및 보고 도구, 분석 도구 및/또는 데이터 마이닝 도구(예:추세 분석, 예측 등)가 포함됩니다.

아키텍처 관점에서 엔터프라이즈 웨어하우스, 데이터 마트 및 가상 웨어하우스와 같은 세 가지 데이터 웨어하우스 모델이 있습니다.

기업 창고 − 엔터프라이즈 웨어하우스는 전체 조직에 걸쳐 주제에 대한 모든 데이터를 수집합니다. 일반적으로 하나 이상의 운영 체제 또는 외부 데이터 제공업체의 전사적 데이터 통합을 지원하며 범위가 교차합니다.

일반적으로 상세한 데이터와 요약된 데이터를 포함하며 크기는 수 기가바이트에서 수천 기가바이트, 테라바이트 등 다양합니다. 엔터프라이즈 데이터 웨어하우스는 기존 메인프레임, 컴퓨터 슈퍼 서버 또는 병렬 아키텍처 플랫폼에서 수행할 수 있습니다. 광범위한 비즈니스 모델링이 필요했으며 설계 및 구성에 수년이 걸릴 수 있습니다.

데이터마트 − 데이터 마트에는 특정 사용자 팀에 가치가 있는 전사적 데이터의 하위 집합이 포함됩니다. 범위는 확실히 선택된 주제로 제한됩니다. 예를 들어, 마케팅 데이터 마트는 주제를 사용자, 품목 및 판매로 제한할 수 있습니다. 데이터 마트에 포함된 데이터는 요약되는 경향이 있습니다.

가상 창고 − 가상 웨어하우스는 운영 데이터베이스에 대한 뷰 모음입니다. 효율적인 쿼리 처리를 위해 가능한 요약 보기 중 일부만 구체화할 수 있습니다. 가상 웨어하우스는 단순히 구축하기 위한 것이지만 운영 데이터베이스 서버에 초과 용량이 필요했습니다.