데이터 마이닝은 패턴 인식 기술과 통계 및 수학적 기법을 사용하여 저장소에 저장된 많은 양의 데이터를 이동하여 의미 있는 새로운 상관 관계, 패턴 및 추세를 발견하는 프로세스입니다. 예상치 못한 관계를 찾고 데이터 소유자가 이해할 수 있고 유용한 새로운 방식으로 데이터를 요약하는 것은 관찰 데이터 세트를 분석하는 것입니다.
데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 찾기 위해 많은 양의 정보를 선택, 탐색 및 모델링하는 절차입니다. 데이터 마이닝은 의미 있는 디자인과 방법을 찾기 위해 방대한 양의 데이터를 자동 또는 반자동 수단으로 탐색 및 분석하는 단계입니다.
데이터 마이닝은 이전에 알려지지 않았고 잠재적으로 유용한 데이터를 방대한 양의 정보에서 추출하는 중요한 방법입니다. 데이터 마이닝 프로세스에는 여러 구성 요소가 포함되며 이러한 구성 요소는 데이터 마이닝 시스템 구조를 구성합니다. 데이터 마이닝의 주요 구성 요소는 다음과 같습니다 -
-
정보 저장소 − 데이터베이스, 데이터 웨어하우스, 스프레드시트 또는 여러 유형의 데이터 리포지토리 중 하나 또는 집합입니다. 데이터 정리 및 데이터 통합 기술을 데이터에 구현할 수 있습니다.
-
데이터베이스 또는 데이터 웨어하우스 서버 − 데이터베이스 또는 데이터 웨어하우스 서버는 사용자의 데이터 마이닝 요청에 따라 관련 데이터를 가져오는 응답을 합니다.
-
지식 기반 − 이것은 검색을 안내하거나 결과 디자인의 흥미도를 계산할 수 있는 도메인 지식입니다.
-
데이터 마이닝 엔진 − 이는 데이터 마이닝 시스템에 중요하며 특성화, 연관 및 상관 관계 분석, 분류, 예측, 클러스터 분석, 이상값 분석 및 진화 분석을 포함한 작업을 위한 기능 모듈 세트를 포함합니다.
-
패턴 평가 모듈 − 이 구성 요소는 일반적으로 흥미도 측정을 사용하고 데이터 마이닝 구조와 통신하여 흥미로운 디자인에 대한 검색을 집중시킵니다.
이 부문은 일반적으로 매혹적인 디자인에 대한 검색을 목표로 데이터 마이닝 모듈과 협력하는 지분 측정을 사용합니다. 스테이크 임계값을 활용하여 발견된 디자인을 필터링할 수 있습니다.
즉, 패턴 평가 모듈은 사용된 데이터 마이닝 기술의 실행을 기반으로 마이닝 모듈과 조정될 수 있습니다. 효과적인 데이터 마이닝을 위해 패턴 스테이크 평가를 마이닝 프로세스에 최대한 적용하여 검색을 매혹적인 디자인으로 제한하는 것이 좋습니다.
-
사용자 인터페이스 − 이 모듈은 사용자와 데이터 마이닝 시스템을 연결하여 사용자가 데이터 마이닝 쿼리 또는 작업을 정의하고, 검색에 집중할 수 있도록 데이터를 제공하고, 중간 데이터 마이닝 결과를 기반으로 탐색적 데이터 마이닝을 구현하여 시스템과 상호 작용할 수 있도록 합니다.
또한 이 구성 요소를 통해 사용자는 데이터베이스 및 데이터 웨어하우스 설계 또는 데이터 구조를 탐색하고, 마이닝된 패턴을 평가하고, 다양한 형식으로 패턴을 시각화할 수 있습니다.