Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝에서 제약 조건의 범주화란 무엇입니까?

<시간/>

제약 조건 기반 알고리즘은 빈번한 항목 집합 생성 단계에서 검색 영역을 줄이기 위해 제약 조건이 필요합니다(연관 규칙 생성 단계는 전체 알고리즘의 단계와 동일합니다).

제약 조건의 중요성은 잘 정의되어 있으며 고객에게 흥미로운 연관 규칙만 만듭니다. 이 방법은 매우 간단하며 나머지 규칙이 제약 조건을 사용하는 규칙 영역이 줄어듭니다.

다음과 같은 세 가지 유형의 제약 조건이 있습니다. -

인스턴스에 대한 제약조건 − 인스턴스에 대한 제약 조건은 클러스터 분석에서 인스턴스 쌍 또는 세트를 그룹화하는 방법을 정의합니다. 이 범주에는 다음과 같은 두 가지 유형의 제약 조건이 있습니다. -

  • 반드시 연결 제약 조건 - must-link 제약 조건이 두 개의 객체 x와 y에 정의된 경우 x와 y는 클러스터 분석의 출력에서 ​​하나의 클러스터로 그룹화되어야 합니다. 이러한 필수 링크 제약 조건은 전이적입니다. 즉, must-link(x, y) 및 must-link(y,z), 그 다음 must-link(x,z)입니다.

  • 연결 불가 제약 조건 − 연결할 수 없는 제약 조건은 연결해야 하는 제약 조건의 반대입니다. 연결할 수 없음 제약 조건이 x 및 y라는 두 객체에 대해 정의된 경우 클러스터 분석의 출력에서 ​​x 및 y는 여러 클러스터에 속해야 합니다. 연결할 수 없는 제약 조건이 수반될 수 있습니다. 연결할 수 없는 경우(x, y), 연결해야 함(x, x ' ) 및 필수 링크(y, y ' ), 연결할 수 없음(x ' , y ' ).

클러스터의 제약조건 - 클러스터에 대한 제약 조건은 클러스터에 대한 요구 사항을 정의하며 가능한 클러스터의 속성을 활용합니다. 예를 들어, 제약 조건은 클러스터의 최소 개체 수, 클러스터의 최대 지름 또는 클러스터의 모양(예:볼록)을 정의할 수 있습니다. 클러스터링 방법을 분할하기 위해 정의된 클러스터의 수는 클러스터에 대한 제약 조건으로 표시될 수 있습니다.

유사성 측정에 대한 제약 − 유클리드 거리를 포함한 유사도 측정은 클러스터 분석에서 객체 간의 유사도를 계산하는 데 사용됩니다. 다양한 응용 프로그램에서 예외가 사용됩니다. 유사성 측정에 대한 제약 조건은 유사성 계산이 준수해야 하는 요구 사항을 정의합니다.

예를 들어 광장에서 사람을 변화시키는 물체로 묶을 수 있고 유클리드 거리는 두 지점 사이의 도보 거리를 생성할 수 있지만 가장 짧은 거리를 실행하는 궤적이 벽을 넘을 수 없다는 유사성 측정의 제약이 있습니다.

클러스터링 제약 조건을 분류하는 또 다른 접근 방식은 제약 조건이 얼마나 엄격하게 준수되어야 하는지를 고려합니다. 제약 조건을 방해하는 클러스터링이 허용되지 않는 경우 제약 조건이 어렵습니다. 제약 조건을 방해하는 클러스터링이 바람직하지 않지만 더 나은 솔루션을 찾을 수 없을 때 허용되는 경우 제약 조건은 부드럽습니다. 소프트 제약 조건은 기본 설정이라고도 합니다.