Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

대화형 의사결정 트리 구성을 지원하기 위해 데이터를 어떻게 시각화할 수 있습니까?

<시간/>

PBC(Perception-Based Classification)는 다차원 시각화 방법을 기반으로 하는 대화형 방법이며 사용자가 의사결정 트리를 구성할 때 데이터에 대한 배경 지식을 통합할 수 있도록 합니다.

데이터와 광학적으로 상호 작용함으로써 사용자는 데이터에 대한 더 깊은 학습을 생성할 수 있습니다. 결과 트리는 전통적인 의사 결정 트리 유도 기술을 사용하는 구성보다 작을 가능성이 높으므로 해석이 더 간단하면서도 비슷한 정확도를 달성합니다.

PBC는 클래스 레이블 데이터와 함께 다차원 데이터를 고려하기 위해 픽셀 지향 방법이 필요합니다. d-차원 정보 개체를 d-세그먼트로 분할된 원에 매핑하는 원형 세그먼트 방법이 적용되었으며 각각은 하나의 속성을 정의합니다.

데이터 요소의 속성 값은 개체의 클래스 레이블을 검사하여 하나의 컬러 픽셀에 매핑됩니다. 이 매핑은 모든 데이터 개체의 모든 속성-값 쌍에 대해 완료됩니다. 세그먼트 내 정렬 시리즈를 결정하기 위해 각 속성에 대한 정렬이 완료됩니다.

예를 들어, 주어진 세그먼트 내의 속성 값은 유사한 속성 값 내에서 동종(클래스 레이블과 관련하여) 영역을 표시하도록 구성될 수 있습니다. 한번에 예상할 수 있는 훈련 정보의 양은 대략적으로 다중 속성과 다중 데이터 객체의 곱에 의해 결정됩니다.

PBC 시스템은 데이터 상호 작용 창과 지식 상호 작용 창을 포함한 분할 화면을 표시합니다. 데이터 상호 작용 창에는 확인 중인 데이터의 원 세그먼트가 표시되고 지식 상호 작용 창에는 지금까지 구축된 의사 결정 트리가 표시됩니다. 전체 교육 세트는 데이터 상호 작용 창에서 시각화되는 반면 지식 상호 작용 창에는 null 의사 결정 트리가 표시됩니다.

기존의 의사결정 트리 알고리즘은 통계적 속성에 대해 이진 분할만 가능하게 합니다. PBC를 사용하면 사용자가 여러 분할점을 정의할 수 있으므로 개별 트리 노드에서 여러 가지가 성장할 수 있습니다.

트리는 다음과 같이 대화식으로 구축됩니다. 사용자는 데이터 상호작용 창에서 다차원 데이터를 예상하고 분할 속성과 여러 분할점을 선택합니다. 지식 상호 작용 창의 최신 의사 결정 트리가 확장됩니다.

사용자는 의사 결정 트리의 노드를 선택합니다. 사용자는 노드에 대한 클래스 레이블을 만들거나(노드를 리프로 생성) 노드에 해당하는 교육 정보의 시각화를 요청할 수 있습니다. 이는 루트에서 유사한 경로의 요소를 분할하는 데 사용되는 속성을 제외하고 각 속성의 새로운 시각화로 이어집니다. 의사결정 트리의 모든 리프에 클래스가 생성될 때까지 대화형 절차가 계속됩니다.