Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

다중 관계형 데이터 마이닝이란 무엇입니까?


다중 관계형 데이터 마이닝(MRDM) 방법은 관계형 데이터베이스의 여러 테이블(관계)을 포함하는 디자인을 검색합니다. 각 테이블 또는 관계는 속성 집합으로 설명되는 엔터티 또는 관계를 나타냅니다. 관계 간의 링크는 관계 간의 관계를 보여줍니다.

데이터가 단일 테이블에 있다고 가정하는 기존 데이터 마이닝 방법을 적용하는 한 가지 방법은 조인 및 집계를 사용하여 다중 관계 데이터를 단일 플랫 데이터 관계로 변환하는 명제화입니다.

이는 거대하고 바람직하지 않은 "보편적 관계"(모든 속성을 포함)의 생성으로 이어질 수 있습니다. 또한 데이터베이스 디자인의 링크로 표시되는 필수 의미론적 정보를 포함하여 정보가 손실될 수 있습니다.

다중 관계형 데이터 마이닝은 관계형 데이터에서 직접 지식을 발견하는 것을 목표로 합니다. 다국적 분류, 클러스터링 및 빈번한 패턴 마이닝과 같은 다양한 다중 관계형 데이터 마이닝 기능이 있습니다.

다중 관계 분류의 장점은 서로 다른 관계의 정보를 활용하는 분류 모델을 구축할 수 있다는 것입니다. 다중 관계형 클러스터링은 튜플을 속성과 다른 관계에서 관련된 튜플을 사용하여 클러스터로 그룹화하는 것을 목표로 합니다. 다중 관계형 빈발 패턴 마이닝은 서로 다른 관계의 상호 연결된 항목과 관련된 패턴을 찾는 것을 목표로 합니다. 먼저 다중 관계형 데이터 마이닝의 목적과 절차를 설명하기 위해 다중 관계형 분류를 예로 사용할 수 있습니다.

다중 관계 분류를 위한 데이터베이스에는 하나의 대상 관계 Rt가 있으며, 이 튜플을 대상 튜플이라고 하며 클래스 레이블과 관련됩니다. 다른 관계는 대상이 아닙니다. 각 릴레이션은 하나의 기본 키( 릴레이션의 튜플을 고유하게 인식함)와 여러 외래 키(한 릴레이션의 기본 키가 다른 릴레이션의 외래 키에 연결될 수 있음)를 가질 수 있습니다.

두 개의 클래스 문제를 고려할 수 있는 경우 하나의 클래스를 포지티브 클래스로, 다른 클래스를 네거티브 클래스로 선택할 수 있습니다. 정확한 다중 관계형 분류기를 구축하기 위한 서비스는 포지티브 및 네거티브 대상 튜플을 분류하는 데 도움이 되는 다양한 관계에서 관련 기능을 찾는 것입니다.

다중 관계형 분류에 대한 가장 인기 있는 형태의 가설은 규칙 집합입니다. 각 규칙은 클래스 레이블과 연결된 술어 목록(논리적 결합)입니다. 술어는 관계의 속성에 대한 제약 조건입니다. 술어는 특정 조인 경로를 기반으로 정의되는 경우가 많습니다. 대상 튜플은 규칙의 모든 술어를 충족하는 경우에만 규칙을 충족합니다.