다음과 같은 마이닝 방법론의 다양한 측면이 있습니다 -
다양하고 새로운 종류의 지식 마이닝 − 데이터 마이닝은 데이터 특성화 및 식별에서 관계 및 상관 관계 분석, 분류, 회귀, 클러스터링, 이상값 방법, 시퀀스 방법, 추세 및 계산 분석에 이르기까지 광범위한 데이터 분석 및 지식 발견 서비스를 다룹니다.
이러한 서비스는 동일한 데이터베이스를 여러 방식으로 사용할 수 있으며 여러 데이터 마이닝 기술의 개발이 필요합니다. 소프트웨어의 다양성으로 인해 새로운 마이닝 서비스가 계속 등장하여 강력하고 빠르게 증가하는 분야의 데이터 마이닝을 개발하고 있습니다.
예를 들어, 데이터 네트워크에서 효과적인 지식 검색을 위해 통합 클러스터링 및 순위 지정을 통해 상위 네트워크에서 고품질 클러스터 및 개체 순위를 찾을 수 있습니다.
다차원 공간에서 지식 마이닝 − 높은 데이터 집합에서 지식을 탐색할 때 다차원 공간에서 정보를 분석할 수 있습니다. 여러 추상화 수준에서 차원 집합(속성) 간에 흥미로운 패턴을 검색할 수 있습니다. 이러한 마이닝을 (탐색) 다차원 데이터 마이닝이라고 합니다.
여러 경우에 데이터를 수집하거나 다차원 데이터 큐브로 간주할 수 있습니다. 큐브 영역의 마이닝 지식은 데이터 마이닝의 능력과 적응성을 높일 수 있습니다.
데이터 마이닝 - 학제간 노력 − 여러 분야의 새로운 기술을 통합하여 데이터 마이닝의 능력을 향상시킬 수 있습니다. 예를 들어, 자연어 텍스트로 레코드를 마이닝할 수 있으며 데이터 마이닝 접근 방식을 데이터 검색 및 자연어 처리 방법과 융합하는 것이 합리적입니다.
네트워크 환경에서 검색 기능 강화 − 일부 데이터 개체는 웹, 데이터베이스 연결, 파일 또는 레코드에 관계 없이 연결되거나 상호 연결된 환경에 있습니다. 여러 데이터 개체에 대한 의미론적 연결을 사용하여 데이터 마이닝의 이점을 얻을 수 있습니다. 한 개체 집합에서 변경된 지식은 개체의 "연관된" 또는 의미적으로 연결된 그룹에서 지식의 발견을 늘리는 데 사용할 수 있습니다.
데이터의 불확실성, 노이즈 또는 불완전성 처리 − 데이터에 노이즈, 오류, 예외 또는 모호성이 포함되거나 불완전합니다. 오류와 노이즈는 데이터 마이닝 단계를 혼동하여 잘못된 설계를 유도할 수 있습니다. 데이터 정리, 데이터 사전 처리, 이상값 감지 및 제거, 모호성 추론은 데이터 마이닝 프로세스와 통합되어야 하는 방법의 예입니다.
패턴 평가 및 패턴 또는 제약 조건 기반 마이닝 − 데이터 마이닝 과정에서 생성된 일부 패턴이 흥미롭지 않습니다. 사용자마다 흥미로운 패턴을 만들 수 있습니다. 따라서 주관적인 척도에 따라 발견된 패턴의 흥미도를 평가하는 기술이 필요합니다.
이들은 주어진 사용자 클래스와 관련된 패턴의 가치를 계산하며, 사용자의 믿음이나 기대에 달려 있습니다. 또한, 흥미도 측정이나 사용자 정의 제약을 사용하여 발견 프로세스를 이해함으로써 더 흥미로운 패턴을 만들고 검색 공간을 줄일 수 있습니다.