Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

범주 데이터에 대한 이산화 및 개념 계층 생성 기술이란 무엇입니까?

<시간/>

범주형 데이터는 이산 데이터입니다. 범주 속성은 고정된 수의 고유 값을 가지며 지리적 영역, 직업 범주 및 항목 유형과 관련된 값 사이에 순서가 없습니다. 범주형 데이터에 대한 개념 계층을 생성하는 다양한 방법은 다음과 같습니다. -

  • 사용자 또는 전문가가 스키마 수준에서 명시적으로 속성의 부분 순서 지정 − 범주 속성 또는 차원에 대한 개념 계층은 일반적으로 속성 그룹을 포함합니다. 사용자나 전문가는 스키마 수준에서 속성의 부분적 또는 전체적 순서를 정의하여 개념 계층을 간단히 나타낼 수 있습니다.

예를 들어, 관계형 데이터베이스 또는 데이터 웨어하우스의 차원 영역에는 거리, 시, 도 또는 주 및 국가와 같은 특성 팀이 포함될 수 있습니다. 거리 <시 <도 또는 주 <국가

를 포함하여 스키마 수준에서 이러한 속성 간의 전체 순서를 정의하여 계층 구조를 나타낼 수 있습니다.
  • 명시적 데이터 그룹화에 의한 계층 구조의 일부 지정 - 이것은 개념 계층의 일부에 대한 수동 정의입니다. 높은 데이터베이스에서 명시적 값 열거로 전체 개념 계층을 표현하는 것은 비현실적입니다. 반대로 중간 수준 데이터의 작은 부분에 대한 명시적 그룹화를 단순히 나타낼 수 있습니다.

  • 속성 집합의 지정(부분적 순서가 아님) − 사용자는 개념 계층을 형성하는 속성 집합을 설명할 수 있지만 부분 순서를 명시적으로 설명하지 않습니다. 시스템은 의미 있는 개념 계층 구조를 구성하기 위해 속성 순서를 자동으로 생성하려고 시도할 수 있습니다.

이 관찰을 기반으로 하며, 주어진 속성 세트의 속성당 여러 고유 값을 기반으로 개념 계층이 자동으로 생성될 수 있습니다. 가장 고유한 값을 가진 속성은 계층 구조의 가장 낮은 수준에 있습니다. 속성의 다중 고유 값이 낮을수록 생성된 개념 계층 구조에서 더 높아집니다. 이 발견적 규칙은 경우에 따라 잘 작동합니다. 생성된 계층 구조를 분석한 후 필요한 경우 사용자 또는 전문가가 일부 로컬 수준 스와핑 또는 조정을 사용할 수 있습니다.

  • 속성의 일부만 지정 − 사용자는 계층 구조에 무엇이 포함되어야 하는지 막연할 수 있습니다. 예를 들어 사용자 이름은 성과 이름만 지정할 수 있고 중간 이름은 포함할 수 없습니다. 이러한 부분적으로 지정된 계층은 빠른 의미 연결로 속성을 함께 고정하기 위해 데이터베이스 디자인에 데이터 의미를 설치하여 관리됩니다.