Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝에서 클러스터링의 예는 무엇입니까?

<시간/>

물리적 또는 추상적인 개체 집합을 동일한 개체의 클래스로 결합하는 프로세스를 클러스터링이라고 합니다. 클러스터는 동일한 클러스터 내에서 서로 동일하고 다른 클러스터의 개체와 다른 데이터 개체 집합입니다. 데이터 개체의 클러스터는 여러 응용 프로그램에서 집합적으로 하나의 그룹으로 간주될 수 있습니다. 클러스터 분석은 필수적인 인간 활동입니다.

클러스터 분석은 이러한 레코드에 대해 수행된 다양한 측정에 따라 동일한 레코드의 그룹 또는 클러스터를 형성하는 데 사용됩니다. 핵심 설계는 분석 목적에 유용할 수 있는 방식으로 클러스터를 정의하는 것입니다. 이 데이터는 천문학, 고고학, 의학, 화학, 교육, 심리학, 언어학, 사회학 등 여러 분야에서 사용되었습니다.

다음과 같은 클러스터링의 몇 가지 예가 있습니다. -

생물학 - 생물학자들은 왕국, 문(phylum), 클래스(class), 시리즈(series), 과(family), 속(genus), 종(species)과 같은 모든 생물에 대한 분류(계층적 분류)를 생성하는 데 몇 년을 보냈습니다. 따라서 클러스터 분석의 일부 초기 작업에서 이러한 분류 구조를 찾을 수 있는 수치 분류학 분야를 생성하려고 시도한 것은 놀라운 일이 아닙니다.

게다가, 생물학자들은 접근 가능한 엄청난 양의 유전 데이터를 분석하기 위해 클러스터링을 사용했습니다. 예를 들어, 클러스터링은 동일한 기능을 가진 유전자 그룹을 발견하는 데 사용되었습니다.

정보 검색 − World Wide Web에는 수십억 개의 웹 페이지가 포함되어 있으며 검색 엔진에 대한 쿼리 결과는 수백만 페이지를 복원할 수 있습니다. 클러스터링을 사용하여 이러한 검색 결과를 몇 개의 클러스터로 그룹화할 수 있으며, 각 클러스터는 쿼리의 특정 요소를 사용합니다.

예를 들어 "영화"라는 검색어는 리뷰, 예고편, 스타, 극장 등의 범주로 결합된 웹 페이지를 복원할 수 있습니다. 각 클러스터는 하위 범주(하위 클러스터)로 분할되어 쿼리 결과에 대한 사용자의 분석을 지원하는 계층 구조를 만들 수 있습니다.

기후 − 대기와 해양의 패턴을 찾는 데 필요한 지구의 기후를 학습할 수 있습니다. 클러스터 분석은 육지 기후에 필수적인 영향을 미치는 극지방과 해양 지역의 대기압 패턴을 발견하는 데 사용되었습니다.

심리학 및 의학 − 질병이나 상태에 여러 변경 사항이 있는 경우가 많으며 클러스터 연구를 사용하여 이러한 여러 하위 범주를 인식할 수 있습니다. 예를 들어, 클러스터링은 여러 유형의 우울증을 식별하는 데 사용할 수 있습니다. 클러스터 분석은 또한 질병의 공간적 또는 시간적 할당 패턴을 식별하는 데 사용됩니다.

비즈니스 − 기업은 현재 및 잠재적 사용자에 대한 엄청난 양의 데이터를 수집합니다. 일반적으로 더 많은 분석 및 마케팅 이벤트를 위해 사용자를 소수의 팀으로 분류하는 데 사용됩니다.