CLIQUE는 고차원 영역에서 차원 성장 하위 영역 클러스터링을 위해 계획된 첫 번째 알고리즘입니다. 차원 성장 하위 영역 클러스터링에서 클러스터링 프로세스는 1차원 하위 공간에서 시작하여 상위 차원 하위 공간으로 증가합니다.
CLIQUE는 그리드 아키텍처와 같은 각 차원을 분할하고 포함하는 여러 점을 기반으로 셀이 밀집되어 있는지 여부를 결정하기 때문입니다. 밀도 기반 및 그리드 기반 클러스터링 접근 방식의 통합으로 볼 수 있습니다.
CLIQUE 클러스터링 알고리즘의 아이디어는 다음과 같습니다 -
-
다차원 데이터 포인트의 큰 그룹이 주어지면 데이터 영역은 일반적으로 데이터 포인트에 의해 균일하게 사용되지 않습니다. CLIQUE의 클러스터링은 공간(또는 단위)에서 희소 및 "밀집" 영역을 인식하여 데이터 세트의 완전한 분포 패턴을 찾습니다.
-
단위에 포함된 총 데이터 포인트의 비율이 입력 모델 매개변수를 초과하는 경우 단위는 솔리드입니다. CLIQUE에서 클러스터는 연결된 밀집 단위의 최대 그룹으로 표시됩니다.
CLIQUE는 다음과 같은 두 가지 프로세스로 다차원 클러스터링을 구현합니다. - 첫 번째 프로세스에서 CLIQUE는 d-차원 데이터 영역을 겹치지 않는 직사각형 단위로 분할하여 이들 사이의 조밀한 단위를 인식합니다. 이것은 각 차원에 대해 완료됩니다(1-D로).
학생 검색 공간의 식별은 연관 규칙 마이닝에 사용된 Apriori 속성에 따라 다릅니다. 일반적으로 속성은 검색 영역의 항목에 대한 사전 지식을 사용하여 영역의 일부를 잘라낼 수 있습니다.
CLIQUE의 속성은 다음과 같습니다. k 차원 단위가 조밀하면 (k-1) 차원 영역의 투영도 조밀합니다. 즉, k 차원의 학생 밀집 단위가 주어졌을 때 (k-1) 번째 투영 단위를 확인하고 조밀하지 않은 것을 발견할 수 있다면 k차원 단위도 조밀할 수 없다는 것을 이해할 수 있습니다.
따라서 (k − 1) 차원 영역에서 발견되는 밀집 단위에서 k 차원 영역에서 잠재 또는 학생 밀집 단위를 만들 수 있습니다. 일반적으로 검색된 결과 영역은 원래 영역보다 훨씬 작습니다. 밀집된 단위는 클러스터를 결정하기 위해 검사됩니다.
두 번째 프로세스에서 CLIQUE는 다음과 같이 각 클러스터에 대한 최소한의 설명을 만듭니다. 각 클러스터에 대해 연결된 밀집 단위의 클러스터를 덮는 최대 면적을 결정합니다. 각 클러스터에 대한 최소 커버(논리 설명)를 결정합니다.
CLIQUE는 고밀도 클러스터를 포함하여 가장 차원이 큰 부분 공간이 해당 부분 공간에 존재함을 반드시 발견합니다. 일련의 입력 개체에 민감하지 않으며 일부 표준 데이터 배포를 가장하지 않습니다. 입력 크기에 따라 선형적으로 확장되며 데이터의 다차원이 향상됨에 따라 최고의 확장성을 갖습니다.