연관 규칙 마이닝은 지원(빈도) 및 신뢰도(신뢰도)로 측정된 "If A, then B" 규칙을 사용하여 데이터 세트의 항목 간의 관계를 검색합니다. 다단계 연관 규칙 마이닝은 이를 확장하여 개별 제품과 제품 카테고리 등 다양한 세부 수준에서 관계를 찾습니다.
연관 규칙 기본 사항
Apriori 알고리즘은 마이닝 연관 규칙에 널리 사용됩니다. 반복적으로 후보 항목 세트를 생성하고 지지/신뢰도 임계값 미만인 항목을 정리합니다.
전자제품 노트북 휴대폰 태블릿 Dell HP 레벨 0 레벨 1 레벨 2유형
- 다양한 차원(제품, 지역, 시간)에 걸친 다차원적 관계
- 세분성 수준(개별 항목 ← 카테고리)에 걸친 다단계 관계
지원 임계값 접근 방식
애플리케이션
- 소매 고객의 구매 행동, 제품 배치 최적화.
- 의료질병 패턴 식별, 치료 최적화
- 사기 탐지 금융 및 보험 분야의 이상 탐지
- 웹 마이닝 사용자 선호도 분석, 콘텐츠 개인화
- 소셜 네트워크 커뮤니티 감지, 영향력 있는 사람 식별.
도전
- 높은 차원성 속성이 많으면 복잡성이 증가합니다.
- 대형 데이터 세트 레코드의 양으로 인해 처리 속도가 느려집니다.
- 확장성 데이터 세트가 너무 커서 메모리에 맞지 않으면 분산 접근 방식이 필요합니다.
결론
다중 레벨 연관 규칙 마이닝은 단일 레벨 마이닝이 놓칠 수 있는 다양한 세분성 레벨에서 관계를 발견합니다. 지원 임계값 접근 방식(균일, 축소 또는 그룹 기반)을 선택하면 패턴 검색과 계산 비용의 균형이 유지됩니다. 소매업, 의료, 사기 탐지, 웹 마이닝 분야에 널리 적용됩니다.