프로토타입 기반 클러스터링이란 무엇입니까?

<시간/>

프로토타입 기반 클러스터링에서 클러스터는 일부 객체가 다른 클러스터의 프로토타입보다 클러스터를 나타내는 프로토타입에 더 가까운 객체 그룹입니다. 클러스터의 프로토타입으로 클러스터에 있는 요소의 중심이 필요한 간단한 프로토타입 기반 클러스터링 알고리즘입니다.

프로토타입 기반 클러스터링에는 다음과 같은 다양한 접근 방식이 있습니다. -

개체는 둘 이상의 클러스터에 속할 수 있습니다. 또한 개체는 약간의 가중치를 가진 각 클러스터에 속합니다. 이러한 방법은 일부 개체가 여러 클러스터 프로토타입에 유사하게 가깝다는 사실을 해결합니다.
클러스터는 통계 분포로 모델링됩니다. 즉, 개체는 평균 및 분산을 포함한 여러 통계 매개변수에 의한 특징인 통계 분포의 임의 단계에 의해 생성됩니다. 이 관점은 프로토타입의 개념을 일반화하고 잘 정립된 통계적 접근의 필요성을 허용합니다.
클러스터는 일정한 연결을 갖도록 제한됩니다. 이러한 관계는 두 클러스터가 서로 이웃하는 정도와 같은 이웃 관계를 정의하는 제약 조건입니다. 클러스터 간의 관계를 제한하면 데이터의 실행 및 시각화를 정의할 수 있습니다.

퍼지 c-means는 퍼지 논리 및 퍼지 집합 이론 영역의 개념을 사용하여 클러스터링 설계를 제안합니다. 이는 K-means와 유사하지만 하나의 클러스터에만 포인트를 할당할 필요가 없습니다.

혼합 모델 클러스터링은 클러스터 그룹이 각 클러스터에 대해 하나씩 분포의 조합으로 모델링될 수 있는 방법을 사용합니다. 클러스터링 체계는 SOM(Self-Organizing Maps)에 따라 달라집니다. 클러스터는 2차원 그리드 구조를 포함하여 서로 미리 지정된 연관이 있어야 하는 구조 내에서 클러스터링을 구현합니다.

퍼지 클러스터링 − 데이터 개체가 잘 독립적인 집합으로 분포되어 있는 경우 개체를 분리된 클러스터로 명확하게 설명하는 것이 이상적인 방법인 것 같습니다. 그러나 어떤 경우에는 데이터 세트의 개체를 잘 독립적인 클러스터로 나눌 수 없으며 개체를 특정 클러스터에 할당하는 데 특정 임의성이 있습니다.

두 클러스터의 경계에 가깝지만 그 중 하나에 더 가까운 물체를 고려하십시오. 어떤 경우에는 개체가 클러스터보다 앞서 있는 정도를 나타내는 가중치를 모든 개체와 각 클러스터에 할당하는 것이 더 적합할 수 있습니다.

확률적 방법도 이러한 가중치를 지원할 수 있습니다. 확률적 방법은 여러 상황에서 유용하지만 적절한 통계 모델을 결정하는 것이 복잡한 경우가 있습니다. 일반적으로 동일한 기능을 제공하려면 비확률적 클러스터링 방법이 필요합니다.