관련 없는 속성을 필터링하거나 관련 속성의 순위를 지정하기 위해 데이터를 사전 처리하는 통계적 접근 방식입니다. 속성 관련성 분석의 측정은 개념 설명 프로세스에서 승인되지 않을 수 있는 관련 없는 속성을 인식하는 데 사용할 수 있습니다. 이 전처리 단계를 클래스 특성화 또는 비교에 통합하는 것을 분석적 특성화로 정의합니다.
데이터 차별은 대상 클래스와 대조 클래스로 정의된 두 클래스 간의 객체의 일반적인 특징을 비교하는 식별 규칙을 만듭니다.
대상 클래스 데이터 개체의 일반적인 특성과 대조되는 클래스 중 하나 또는 집합의 개체의 일반적인 특성을 비교한 것입니다. 사용자는 대상 및 대조 클래스를 정의할 수 있습니다. 데이터 식별에 사용된 방법은 데이터 식별 결과에 비교 측정이 포함된다는 점을 제외하고 데이터 특성화에 사용된 접근 방식과 매우 유사합니다.
속성 관련성 분석의 이유
속성 관련성 분석에는 다음과 같은 몇 가지 이유가 있습니다 -
-
포함해야 하는 차원을 결정할 수 있습니다.
-
높은 수준의 일반화를 생성할 수 있습니다.
-
패턴을 쉽게 읽을 수 있도록 지원하는 속성의 수를 줄일 수 있습니다.
속성 관련성 분석의 기본 개념은 주어진 클래스 또는 개념에 대한 속성의 관련성을 계산할 수 있는 일부 측정값을 평가하는 것입니다. 이러한 측정에는 정보 획득, 모호성 및 상관 계수가 포함됩니다.
개념 설명에 대한 속성 관련성 분석은 다음과 같이 구현됩니다. -
데이터 수집 − 쿼리 처리를 통해 대상 클래스와 대조 클래스 모두에 대한 데이터를 수집할 수 있습니다.
보수적 AOI를 사용한 예비 관련성 분석 − 이 단계에서는 선택한 관련성 측정이 사용될 차원 및 속성 집합을 인식합니다.
AOI는 고유 값이 많은 속성을 제거하여 데이터에 대한 예비 분석을 구현하는 데 사용할 수 있습니다. 보수적일 수 있으며 구현된 AOI는 선택한 측정에 의한 추가 관련성 분석에서 더 많은 속성을 처리할 수 있도록 합리적으로 크게 설정된 속성 일반화 임계값을 사용해야 합니다.
제거 − 이 프로세스는 선택한 관련성 분석 측정을 사용하여 관련성이 없고 관련성이 약한 속성을 제거합니다.
AOI를 사용하여 개념 설명 생성 - 덜 보수적인 속성 일반화 임계값 세트를 사용하여 AOI를 구현할 수 있습니다. 기술적인 마이닝 기능이 클래스 특성화인 경우 이제 원래 대상 클래스 작업 관계만 포함됩니다.
기술적인 마이닝 기능이 클래스 특성화인 경우 원래 대상 클래스 작업 관계만 포함됩니다. 기술적인 마이닝 기능이 클래스 특성화인 경우 원래 대상 클래스 작업 관계만 포함됩니다. 기술적인 마이닝 기능이 클래스 비교인 경우 원래 대상 클래스 작업 관계와 원래 대조되는 클래스 작업 관계가 모두 포함됩니다.