Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

튜플 ID 전파란 무엇입니까?

<시간/>

Tuple ID 전파는 가상 조인을 구현하기 위한 접근 방식으로 다중 관계 분류의 효율성을 크게 향상시킵니다. 물리적으로 관계를 연결하는 것이 아니라 대상 튜플의 ID를 대상이 아닌 관계의 튜플에 연결하여 가상으로 결합합니다.

이 방법에서 술어는 물리적 조인이 구현된 것처럼 계산될 수 있습니다. Tuple ID 전파는 유연하고 효과적입니다. ID는 적은 양의 데이터 전송과 더 많은 저장 공간만 필요로 하는 일부 두 관계 간에 간단히 전파될 수 있기 때문입니다. 이렇게 하면 작은 중복 계산으로 여러 관계의 술어를 계산할 수 있습니다.

튜플 ID 전파는 특정 제약 조건으로 시행되어야 합니다. 그러한 전파가 역효과를 낼 수 있는 두 가지 경우가 있습니다 -

  • 대규모 팬아웃을 통한 전파

  • 길고 약한 링크를 통한 전파.

첫 번째 경우는 ID를 관계 R에 전파한 후 R의 각 튜플이 일부 대상 튜플과 결합되고 각 대상 튜플이 R의 일부 튜플과 결합된다는 것을 발견할 때 나타납니다. R과 대상 관계 간의 의미 연결 연결이 비선택적이기 때문에 매우 약합니다.

예를 들어, 출생 국가 링크를 통한 사람들 간의 전파는 생산적이지 않습니다. 두 번째 경우는 전파가 긴 연결을 통해 진행될 때 나타납니다(예:학생과 자동차 딜러의 애완동물을 연결하는 것은 생산적이지 않음). 효율성과 확실성의 이점에서 이러한 연결을 통한 전파는 권장되지 않습니다.

CrossMine은 다중 관계형 분류를 위해 튜플 ID 전파가 필요한 방법입니다. ID 전파 데이터를 더 잘 결합할 수 있으며 CrossMine은 규칙 구성 요소로 복잡한 술어가 필요합니다. 복잡한 술어 p는 다음과 같은 두 부분을 포함합니다. -

소품 경로 − ID를 전파하는 방법을 나타냅니다. 예를 들어 "대출. account_ID → Account.account_ID”는 account_ID를 사용하여 Loan에서 Account로 ID를 전파하는 것을 나타냅니다. ID 전파가 포함되지 않은 경우 prop-path는 null입니다.

제약조건 - ID가 전파되는 관계에 대한 제약을 나타내는 술어이다. 범주형 또는 숫자형일 수 있습니다.

CrossMine은 일련의 규칙을 포함하는 분류기를 구성하며, 각각은 복잡한 술어 목록과 클래스 레이블을 포함합니다. CrossMine은 FOIL과 같은 순차적인 커버링 알고리즘입니다. 규칙을 한 번에 하나씩 구성할 수 있습니다. 규칙 r이 생성된 후 r을 만족하는 모든 양의 대상 튜플은 데이터 세트에서 삭제됩니다.

CrossMine은 중지 기준이 조립될 때까지 가장 복잡한 술어를 정기적으로 검색하여 최신 규칙에 추가합니다. 현재 규칙에서 발생하는 경우 관계가 활성화됩니다. 다음 최상의 술어를 검색하기 전에 각 활성 관계는 모든 튜플에 대해 전파된 ID의 ID 집합이 있어야 합니다.