Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

별도의 데이터 웨어하우스가 필요한 이유는 무엇입니까?

<시간/>

데이터 웨어하우징은 비즈니스에 의미 있는 비즈니스 통찰력을 제공하기 위해 다양한 소스에서 데이터를 수집하고 관리하는 데 주로 사용되는 기술입니다. 데이터 웨어하우스는 관리 결정을 지원하도록 특별히 설계되었습니다.

간단히 말해서 데이터 웨어하우스는 조직의 운영 데이터베이스와 별도로 유지 관리되는 데이터베이스를 의미합니다. 데이터 웨어하우스 시스템은 여러 애플리케이션 시스템의 통합을 가능하게 합니다. 분석을 위해 통합된 과거 정보의 견고한 플랫폼을 지원하여 데이터 처리를 제공합니다.

데이터 웨어하우스 쿼리는 요약된 수준에서 방대한 정보 그룹의 계산을 포함하기 때문에 복잡합니다. 다차원적 관점에 따라 고유한 데이터 구성, 액세스 및 구현 기술의 사용이 필요할 수 있습니다.

이러한 분리의 주요 이유는 두 시스템의 높은 구현을 향상시키는 데 도움이 되기 때문입니다. 기본 키를 사용한 인덱싱 및 해싱, 특정 레코드 검색, "미리 준비된" 쿼리 최적화를 포함하여 알려진 기능 및 워크로드에서 운영 데이터베이스를 만들고 조정합니다.

반면에 데이터 웨어하우스 쿼리는 복잡한 경우가 많습니다. 여기에는 요약된 수준에서 방대한 정보 그룹의 계산이 포함되며 다차원 보기에 따라 특정 데이터 구성, 액세스 및 구현 방법의 사용이 필요할 수 있습니다. 운영 데이터베이스에서 OLAP 쿼리를 처리하면 운영 작업의 성능이 크게 저하됩니다.

또한 운영 데이터베이스는 여러 트랜잭션의 동시 처리를 제공합니다. 트랜잭션의 일관성과 견고성을 제공하려면 잠금 및 로깅을 포함한 동시성 제어 및 복구 메커니즘이 필요합니다. OLAP 쿼리에는 요약 및 집계를 위해 데이터 레코드에 대한 읽기 전용 액세스 권한이 필요한 경우가 많았습니다.

이러한 OLAP 작업에 동시성 제어 및 복구 메커니즘을 적용하면 동시 트랜잭션 실행을 위태롭게 할 수 있으므로 OLTP 시스템의 처리량을 크게 줄일 수 있습니다.

마지막으로, 데이터 웨어하우스에서 운영 데이터베이스를 분리하는 것은 이 두 시스템에서 정보의 다중 구조, 내용 및 사용에 있습니다. 의사 결정 지원에는 과거 정보가 필요하지만 운영 데이터베이스는 일반적으로 과거 정보를 유지하지 않습니다.

의사 결정 지원에는 이기종 소스의 정보 집계 및 요약을 포함한 통합이 필요하여 고품질의 깨끗하고 통합된 정보를 얻을 수 있습니다. 대조적으로, 운영 데이터베이스에는 분석 전에 통합해야 하는 트랜잭션을 포함하여 상세한 원시 데이터만 포함됩니다.

두 시스템은 서로 다른 기능을 제공하고 서로 다른 종류의 데이터를 필요로 하기 때문에 현재 별도의 데이터베이스를 유지 관리해야 합니다. 그러나 OLAP 쿼리를 지원하기 위해 이러한 시스템을 최적화하기 시작한 운영 관계형 데이터베이스 관리 시스템의 다양한 공급업체가 있습니다. 이러한 추세가 지속됨에 따라 OLTP와 OLAP 시스템 간의 분리도가 줄어들 것으로 예상됩니다.