데이터 웨어하우스는 조직의 운영 데이터베이스와 독립적으로 유지 관리되는 데이터베이스를 정의합니다. 데이터 웨어하우스 시스템은 여러 애플리케이션 시스템의 통합을 가능하게 합니다. 분석을 위해 통합된 이력 기록의 견고한 플랫폼을 지원하여 데이터 처리를 지원합니다.
데이터 웨어하우스는 원격 기본 관계를 통해 표현되는 구체화된 뷰 세트로 볼 수 있습니다. 쿼리가 형식적이면 초기 데이터 소스에 액세스하지 않고 구체화된 뷰를 사용하여 로컬에서 계산됩니다.
데이터 웨어하우스는 시간이 지남에 따라 지속적으로 파생되는 활성 엔터티입니다. 시간이 지남에 따라 새로운 쿼리에 응답해야 합니다. 구체화된 뷰만을 사용하여 다양한 쿼리에 응답할 수 있습니다. 일반적으로 데이터 웨어하우스에 새 보기를 삽입해야 합니다.
SAP/R3를 비롯한 표준화된 전사적 자원 관리 도구를 통해 최소가 아닌 일부 조직에 기본 OLTP(온라인 트랜잭션 처리) 인프라가 구축된 후 관심 대상이 이제 최소 세 가지 방향으로 확대되고 있습니다. −
-
조직 내부 및 외부의 광범위한 멀티미디어 데이터 소스
-
다양한 관심과 능력 프로필 및 상황적 매개변수를 가진 더 넓은 범위의 클라이언트.
-
트랜잭션 처리에 의해 생성된 방대한 경험 데이터를 조직 정보 및 조치에 적용 가능한 지식으로 변환합니다.
광범위한 데이터 흐름 물류 아키텍처가 공급망 관리 및 B2B 전자 상거래를 포함한 레이블로 제안되고 있습니다. 이러한 아키텍처에서 데이터베이스는 데이터의 단기 및 중기 중간 저장소로 취급될 수 있는 반면 데이터 웨어하우스는 장기 기억, 지식 생성 및 관리에 사용됩니다.
데이터 웨어하우스 시스템에는 데이터베이스(소스 데이터베이스, 데이터 웨어하우스의 구체화된 보기), 한 데이터베이스에서 다른 데이터베이스로 레코드를 전달하는 데이터 전송 에이전트, 시스템 및 시스템 확장에 대한 메타데이터를 저장하는 저장소가 포함됩니다.
이 아키텍처에서 이기종 데이터 소스는 먼저 래퍼로 알려진 추출 메커니즘을 통해 균일한 방법으로 적용 가능한 생성된 다음 중재자가 데이터 통합 및 충돌 해결 서비스를 담당합니다. 래퍼와 중재자 간의 분리는 CORBA를 포함한 미들웨어 시스템에서 서비스 래퍼와 요청 브로커 간의 분리를 반영하는 고려된 설계 결정입니다.
결과적으로 표준화되고 통합된 레코드는 데이터 웨어하우스에 구체화된 뷰로 저장됩니다. 이러한 기본 보기는 일반적으로 약간 집계됩니다. 여러 분석가 사용자를 위해 이를 사용자 정의할 수 있으며, 특정 관심 영역에 대해 더 집계된 정보가 있는 데이터 마트는 쿼리 기능에서 스프레드시트 도구, 본격적인 데이터 마이닝 시스템에 이르는 데이터 분석 도구에 의해 침투되는 2단계 캐시로 구성됩니다.