다음과 같은 데이터 마이닝 방법론과 관련된 다양한 사용자 상호 작용 문제가 있습니다. -
데이터베이스에서 다양한 종류의 지식 마이닝 − 다른 사용자는 다른 종류의 지식에 관심을 가질 수 있습니다. 따라서 데이터 마이닝은 데이터 특성화, 식별, 연관, 분류, 클러스터링, 추세 및 편차 분석, 유사성 분석을 포함하는 광범위한 데이터 분석 및 지식 발견 작업을 다루어야 합니다.
다중 추상화 수준에서 대화형 지식 마이닝 − 데이터베이스 내에서 무엇을 찾을 수 있는지 정확히 아는 것은 복잡하기 때문에 데이터 마이닝 프로세스는 대화식이어야 합니다. 대화형 마이닝을 통해 사용자는 패턴 검색을 대상으로 하여 반환된 결과를 기반으로 데이터 마이닝 요청을 지원하고 구체화할 수 있습니다. 이렇게 하면 사용자가 정보를 보고 여러 각도에서 여러 각도에서 패턴을 발견할 수 있습니다.
배경 지식의 통합 − 무결성 제약 조건 및 추론 규칙을 포함하여 데이터베이스와 관련된 도메인 지식은 데이터 마이닝 프로세스를 대상으로 지정하고 속도를 높이거나 식별된 패턴의 흥미도를 판단하는 데 도움이 될 수 있습니다.
데이터 마이닝 쿼리 언어 및 임시 데이터 마이닝 - 사용자가 분석을 위한 관련 데이터 세트의 사양을 지원하여 임시 데이터 마이닝 작업을 정의할 수 있도록 데이터베이스 또는 데이터 웨어하우스 쿼리 언어와 통합할 수 있는 개발이 필요한 고급 데이터 마이닝 쿼리 언어, 도메인 지식, 마이닝할 지식 유형, 식별된 패턴에 적용할 조건 및 흥미 제약.
데이터 마이닝 결과의 프레젠테이션 및 시각화 − 발견된 지식은 사람이 간단하게 학습하고 사용할 수 있도록 고급 언어, 시각적 정의 또는 기타 표현 형식으로 정의되어야 합니다.
이상값 또는 불완전한 데이터 처리 − 데이터베이스에 저장된 데이터는 이상치의 노이즈, 예외적인 경우 또는 식별된 패턴의 정확도를 저하시킬 수 있는 불완전한 데이터 개체를 반영할 수 있습니다. 이상치를 관리할 수 있는 데이터 정리 방법과 데이터 분석 방법이 필요하다.
패턴 평가 − 데이터 마이닝 시스템은 수백 가지 패턴을 발견할 수 있습니다. 발견된 패턴 중 일부는 주어진 사용자에게 흥미롭지 않거나 일반적인 지식을 정의하거나 새로움이 부족할 수 있습니다. 흥미로운 부분을 사용하여 발견 프로세스를 안내하고 검색 공간을 줄이는 것은 연구의 또 다른 활성 영역입니다.
병렬, 분산 및 증분 업데이트 알고리즘 - 여러 데이터베이스의 큰 크기, 데이터의 광범위한 분포, 일부 데이터 마이닝 방법의 계산 복잡성은 병렬 및 분산 데이터 마이닝 알고리즘의 발전을 동기 부여하는 요소입니다.