이 포스트에서는 분류와 클러스터링의 차이점을 이해할 것입니다.
분류
-
지도 학습과 함께 사용됩니다.
-
입력 인스턴스를 해당 클래스 레이블에 따라 분류하는 프로세스입니다.
-
레이블이 있으므로 모델을 확인하기 위해 데이터 세트를 훈련하고 테스트해야 합니다.
-
클러스터링에 비해 더 복잡합니다.
-
예:로지스틱 회귀, Naive Bayes 분류기, 지원 벡터 머신.
클러스터링
-
비지도 학습과 함께 사용됩니다.
-
클래스 레이블을 사용하지 않고 인스턴스가 얼마나 유사한지에 따라 인스턴스를 그룹화합니다.
-
데이터세트를 훈련하고 테스트하는 데 필요하지 않습니다.
-
분류에 비해 덜 복잡합니다.
-
예:k-평균 클러스터링 알고리즘, 가우스(EM) 클러스터링 알고리즘.