Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

제약 기반 연관 마이닝이란 무엇입니까?

<시간/>

데이터 마이닝 절차는 주어진 정보 집합에서 수천 개의 규칙을 찾아낼 수 있으며, 대부분은 결국 사용자에게 독립적이거나 지루합니다. 사용자는 마이닝의 "방향"이 흥미로운 패턴으로 이어질 수 있고 그들이 발견하고 싶은 패턴 또는 규칙의 "형태"에 대해 가장 잘 알고 있습니다.

따라서 좋은 휴리스틱은 사용자가 이러한 직관이나 기대를 검색 공간을 제한하는 제약 조건으로 정의하도록 하는 것입니다. 이 전략을 제약 조건 기반 마이닝이라고 합니다.

제약 조건 기반 알고리즘은 빈번한 항목 집합 생성 단계에서 검색 영역을 줄이기 위해 제약 조건이 필요합니다(연관 규칙 생성 단계는 전체 알고리즘의 단계와 동일합니다).

일반 제약은 지원 최소 임계값입니다. 제약 조건이 제어되지 않는 경우 마이닝 단계에 포함하면 탐색 공간 격자 내부의 경계 정의로 인해 탐색 공간이 크게 줄어들어 탐색이 필요하지 않습니다.

중요한 제약 조건은 잘 정의되어 있습니다. 사용자에게 어필하는 연관 규칙만 생성합니다. 이 방법은 매우 간단하고 규칙 공간이 줄어들어 나머지 방법이 제약 조건을 충족합니다.

제약 기반 클러스터링은 사용자 정의 기본 설정 또는 제약 조건을 충족하는 클러스터를 검색합니다. 제약 조건의 특성에 따라 다르며 제약 조건 기반 클러스터링은 다른 접근 방식보다 채택할 수 있습니다.

제약 조건에는 다음이 포함될 수 있습니다. -

지식 유형 제약 조건 − 연관 또는 상관 관계를 포함하여 채굴할 지식의 유형을 정의합니다.

데이터 제약 − 차원/레벨 제약 조건과 같은 작업 관련 정보 집합을 정의합니다. − 마이닝에 사용할 정보의 원하는 차원(또는 속성) 또는 개념 계층 구조의 방법을 정의합니다.

흥미도 제약 − 지원, 신뢰도 및 상관 관계를 포함하여 규칙 관심도의 수치적 측정에 대한 임계값을 정의합니다.

규칙 제약 - 채굴할 규칙의 형태를 정의합니다. 이러한 제약 조건은 메타규칙(규칙 템플릿), 규칙 선행 또는 후행에 나타날 수 있는 술어의 최대 또는 최소 수, 또는 속성, 속성 값 및/또는 집계 간의 관계로 정의될 수 있습니다.

다음 제약 조건은 높은 수준의 선언적 데이터 마이닝 쿼리 언어 및 사용자 인터페이스를 사용하여 설명할 수 있습니다. 이러한 형태의 제약 기반 마이닝을 통해 사용자는 원하는 규칙을 정의할 수 있으므로 데이터 마이닝 프로세스를 보다 효율적으로 생성할 수 있습니다.

또한 정교한 마이닝 쿼리 옵티마이저를 사용하여 사용자가 정의한 제약 조건을 수행함으로써 마이닝 프로세스를 보다 효율적으로 만들 수 있습니다. 제약 조건 기반 마이닝은 대화형 탐색 마이닝 및 분석을 향상합니다.