Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 기능은 무엇입니까?

<시간/>

데이터 마이닝 기능은 데이터 마이닝 작업에서 발견해야 하는 패턴 유형을 나타내는 데 사용됩니다. 일반적으로 데이터 마이닝 작업은 기술 및 예측의 두 가지 유형으로 분류할 수 있습니다. 설명적 마이닝 작업은 데이터베이스에 있는 데이터의 공통 기능을 정의하고 예측적 마이닝 작업은 예측을 개발하기 위해 현재 정보에 대한 추론을 수행합니다.

다음과 같은 다양한 데이터 마이닝 기능이 있습니다 -

  • 데이터 특성화 - 데이터의 객체 클래스의 일반적인 특성을 요약한 것입니다. 사용자 지정 클래스에 해당하는 데이터는 일반적으로 데이터베이스 쿼리를 통해 수집됩니다. 데이터 특성화의 출력은 여러 형식으로 표시될 수 있습니다.

  • 데이터 차별 - 대상 클래스 데이터 개체의 일반적인 특성과 대조되는 클래스 집합 또는 하나의 개체의 일반적인 특성을 비교한 것입니다. 대상 클래스와 대조 클래스는 사용자에 의해 표현될 수 있으며, 동등한 데이터 개체는 데이터베이스 쿼리를 통해 가져옵니다.

  • 연관 분석 − 트랜잭션 데이터 세트에서 일반적으로 함께 발생하는 항목 집합을 분석합니다. 연관 규칙을 결정하는 데 사용되는 두 가지 매개변수가 있습니다. -

    • 데이터베이스에 설정된 공통 항목을 식별하는 항목을 제공합니다.

    • 신뢰는 다른 항목이 발생할 때 트랜잭션에서 항목이 발생할 조건부 확률입니다.

  • 분류 - 분류는 클래스 레이블이 익명인 객체의 클래스를 예측하기 위해 모델을 사용할 수 있도록 하기 위해 데이터 클래스 또는 개념을 나타내고 구별하는 모델을 발견하는 절차입니다. 파생된 모델은 훈련 데이터 세트(즉, 클래스 레이블이 공통적인 데이터 개체)의 분석을 기반으로 설정됩니다.

  • 예측 - 사용할 수 없는 일부 데이터 값 또는 보류 중인 추세를 예측하는 것을 정의합니다. 객체의 속성값과 클래스의 속성값을 기반으로 객체를 예상할 수 있다. 누락된 숫자 값을 예측하거나 시간 관련 정보의 증가/감소 추세를 예측할 수 있습니다.

  • 클러스터링 − 분류와 유사하지만 클래스가 미리 정의되어 있지 않습니다. 클래스는 데이터 속성으로 표시됩니다. 비지도 학습입니다. 개체는 클래스 내 유사성을 최대화하고 클래스 내 유사성을 최소화하는 원칙에 따라 클러스터되거나 그룹화됩니다.

  • 이상치 분석 − 이상치는 주어진 클래스 또는 클러스터에서 그룹화할 수 없는 데이터 요소입니다. 이들은 다른 데이터 개체의 일반적인 동작에서 여러 동작을 갖는 데이터 개체입니다. 이러한 유형의 데이터 분석은 지식을 마이닝하는 데 필수적일 수 있습니다.

  • 진화 분석 − 일정 시간 동안 동작이 변하는 개체의 경향을 정의합니다.