Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

빈번한 패턴 마이닝의 기준은 무엇입니까?

<시간/>

다음과 같은 빈번한 패턴 마이닝의 몇 가지 기준이 있습니다 -

채굴할 패턴의 완성도 기반 − 최소 지원 임계값을 제공하는 빈도 항목 집합, 폐쇄 빈도 항목 집합 및 최대 빈도 항목 집합의 전체 컬렉션을 마이닝할 수 있습니다.

또한 제한된 빈도 항목 집합(사용자 정의 제약 조건의 집합을 만족할 수 있음), 근사 빈도 항목 집합(채굴된 빈도 항목 집합에 대한 대략적인 지원 개수만 변경할 수 있음), 근접 일치 빈도 항목 집합(지원 개수를 계산할 수 있음)을 추출할 수 있습니다. 상대적으로 일치하는 항목 집합 중), top-k 빈도 항목 집합(즉, 사용자 지정 값에 대한 k 가장 빈번한 항목 집합, k) 등

여러 응용 프로그램이 채굴할 패턴의 무결성과 관련하여 여러 요구 사항을 가질 수 있으며, 이로 인해 다양한 계산 및 최적화 접근 방식이 발생할 수 있습니다.

규칙 집합에 포함된 추상화 수준 기반 − 여러 추상화 수준에서 규칙을 발견할 수 있는 연관 규칙 마이닝을 위한 여러 방법이 있습니다. 예를 들어, 마이닝된 연관 규칙 그룹이 X가 고객을 정의하는 변수인 다음 규칙을 포함한다고 가정합니다. -

구매(X, "컴퓨터") ⇒ 구매(X, "HP 프린터")

buys(X, “노트북 컴퓨터”) ⇒ buys(X, “HP 프린터”)

규칙에 포함된 데이터 측정기준의 수를 기반으로 함 − 연관 규칙의 항목 또는 속성이 하나의 차원만 참조하는 경우 단일 차원 연관 규칙입니다.

규칙에서 처리되는 값 유형 기반 − 규칙에 항목의 유무에 대한 연관이 포함되어 있으면 부울 연관 규칙입니다. 규칙이 양적 항목 또는 속성 간의 연관을 정의하는 경우 이는 양적 연관 규칙입니다. 이 규칙에서 항목 또는 속성의 양적 값은 간격으로 구분됩니다.

마이닝할 규칙의 종류에 따라 − 빈번한 패턴 분석은 여러 종류의 규칙과 다양한 흥미로운 관계를 생성할 수 있습니다. 연관 규칙은 빈번한 패턴에서 생성되는 유명한 종류의 규칙입니다.

채굴할 패턴의 종류에 따라 − 여러 종류의 데이터 세트에서 여러 종류의 빈도 패턴을 마이닝할 수 있습니다. 주요 목표는 빈번한 항목 집합 마이닝, 즉 트랜잭션 또는 관계형 데이터 집합에서 빈번한 항목 집합(항목 집합)을 마이닝하는 것입니다.

순차 패턴 마이닝은 시퀀스 데이터 세트에서 빈번한 하위 시퀀스를 검색합니다. 여기서 시퀀스 데이터는 이벤트의 순서입니다. 예를 들어 순차 패턴 마이닝을 사용하면 일반적으로 항목을 구매하는 시리즈를 연구할 수 있습니다. 예를 들어, 사용자는 PC를 먼저 구매하고 디지털 카메라를 구매한 다음 메모리 카드를 구매하는 경향이 있습니다.