Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 웨어하우스 튜닝이란 무엇입니까?

<시간/>

데이터 웨어하우징은 비즈니스에 의미 있는 비즈니스 통찰력을 제공하기 위해 여러 소스에서 데이터를 수집하고 처리할 수 있는 접근 방식입니다. 데이터 웨어하우스는 관리 결정을 지원하도록 특별히 설계되었습니다.

간단히 말해서 데이터 웨어하우스는 조직의 운영 데이터베이스와 독립적으로 유지 관리되는 데이터베이스를 정의합니다. 데이터 웨어하우스 시스템은 여러 애플리케이션 시스템의 통합을 가능하게 합니다. 분석을 위한 통합된 과거 정보의 견고한 플랫폼을 제공하여 데이터 처리를 제공합니다.

데이터 웨어하우스는 다차원 공간에서 데이터를 일반화하고 중앙 집중화합니다. 데이터 웨어하우스 구축에는 데이터 정리, 데이터 통합 ​​및 데이터 변환이 포함되며 데이터 마이닝을 위한 중요한 전처리 단계로 볼 수 있습니다.

이는 효과적인 데이터 일반화 및 데이터 마이닝을 용이하게 하는 다양한 입도의 다차원 데이터의 대화식 분석을 위한 OLAP(온라인 분석 처리) 도구를 제공합니다. 연관, 분류, 예측 및 클러스터링을 포함한 여러 데이터 마이닝 기능이 OLAP 작업과 통합되어 다양한 추상화 수준에서 지식의 대화형 마이닝을 구축할 수 있습니다.

OLAP는 데이터 웨어하우징도 포함하는 광범위한 용어입니다. 이 모델에서 데이터는 데이터 마이닝/문서의 효과적인 생성을 허용하는 형식으로 저장됩니다. OLAP 디자인은 운영 효율성이 약간 저하된 대규모 레코드 집합에 대한 문서화를 수용해야 합니다.

OLTP 구조에서 데이터 구조를 취하고 OLAP 구조에서 동일한 데이터에 영향을 미치는 것을 정의할 수 있는 완전한 용어는 "차원 모델링"입니다. 이는 데이터 웨어하우징의 기본 빌딩 블록입니다.

성능을 향상시키기 위해 데이터 웨어하우스의 조정을 수행할 수 있습니다. 데이터 웨어하우스는 시스템의 진입점이며 성능을 향상시킬 수 있는 첫 번째 기회를 제공합니다. 데이터가 로드되기 전이나 후에 데이터 웨어하우스 시스템에서 검사가 수행되면 시스템의 용량과 성능에 직접적인 영향을 미칩니다.

예를 들어 데이터가 전화 통화 기록인 경우 각 통화에 유효한 고객 식별자가 있는지 확인할 수 있습니다. 데이터가 판매 정보인 경우 판매 중인 상품에 유효한 상품 식별자가 있는지 확인할 수 있습니다.

많은 양의 데이터를 로드하거나 과도한 I/O 작업을 수행하는 것은 각 레코드에 적용할 검사와 변환이 많을 때 CPU를 많이 사용하게 될 수 있습니다. 직접 하중 기술을 사용하여 로딩 속도를 향상시킬 수 있습니다. 병렬 처리를 사용하여 개선할 수도 있습니다.

데이터 웨어하우스를 조정하는 가장 좋은 방법을 제공하는 다음 단계가 있습니다. −

  • 비즈니스 규칙을 조정합니다.
  • 데이터 디자인을 조정합니다.
  • 애플리케이션 디자인을 조정합니다.
  • 데이터베이스의 논리적 구조를 조정합니다.
  • 데이터베이스 작업을 조정합니다.
  • 접근 경로를 조정합니다.
  • I/O 및 물리적 구조를 조정합니다.
  • 리소스 경합을 조정합니다.
  • 기본 패턴을 조정합니다.