Computer >> 컴퓨터 >  >> 프로그래밍 >> SQL

다단계 연관 규칙 발견:Apriori를 사용하여 제품에서 카테고리까지

연관 규칙 마이닝은 지원(빈도) 및 신뢰도(신뢰도)로 측정된 "If A, then B" 규칙을 사용하여 데이터 세트의 항목 간의 관계를 검색합니다. 다단계 연관 규칙 마이닝은 이를 확장하여 개별 제품과 제품 카테고리 등 다양한 세부 수준에서 관계를 찾습니다.

연관 규칙 기본 사항

Apriori 알고리즘은 마이닝 연관 규칙에 널리 사용됩니다. 반복적으로 후보 항목 세트를 생성하고 지지/신뢰도 임계값 미만인 항목을 정리합니다.

전자제품 노트북 휴대폰 태블릿 Dell HP 레벨 0 레벨 1 레벨 2

유형

  • 다양한 차원(제품, 지역, 시간)에 걸친 다차원적 관계
  • 세분성 수준(개별 항목 ← 카테고리)에 걸친 다단계 관계

지원 임계값 접근 방식

접근 설명 절충점 균일한 지원모든 수준에 대해 동일한 임계값간단하지만 낮은 수준의 패턴을 놓칠 수 있음감소 지원낮은 수준에서 더 낮은 임계값더 많은 패턴을 포착하지만 더 많은 계산그룹 기반 SupportExpert가 그룹/범주별로 임계값 설정가장 유연하며 도메인 지식 필요

애플리케이션

  • 소매 고객의 구매 행동, 제품 배치 최적화.
  • 의료질병 패턴 식별, 치료 최적화
  • 사기 탐지 금융 및 보험 분야의 이상 탐지
  • 웹 마이닝 사용자 선호도 분석, 콘텐츠 개인화
  • 소셜 네트워크 커뮤니티 감지, 영향력 있는 사람 식별.

도전

  • 높은 차원성 속성이 많으면 복잡성이 증가합니다.
  • 대형 데이터 세트 레코드의 양으로 인해 처리 속도가 느려집니다.
  • 확장성 데이터 세트가 너무 커서 메모리에 맞지 않으면 분산 접근 방식이 필요합니다.

결론

다중 레벨 연관 규칙 마이닝은 단일 레벨 마이닝이 놓칠 수 있는 다양한 세분성 레벨에서 관계를 발견합니다. 지원 임계값 접근 방식(균일, 축소 또는 그룹 기반)을 선택하면 패턴 검색과 계산 비용의 균형이 유지됩니다. 소매업, 의료, 사기 탐지, 웹 마이닝 분야에 널리 적용됩니다.

다단계 연관 규칙 발견:Apriori를 사용하여 제품에서 카테고리까지