연관 규칙 학습은 한 데이터 요소가 다른 데이터 요소에 의존하는지 테스트하고 적절하게 설계하여 보다 비용 효율적일 수 있도록 하는 일종의 비지도 학습 기법입니다. 데이터 세트의 변수 사이에 몇 가지 흥미로운 관계 또는 연관성을 발견하려고 시도합니다. 데이터베이스에서 변수 간의 흥미로운 관계를 찾는 것은 다양한 규칙에 따라 달라집니다.
연관 규칙 학습은 머신 러닝의 가장 중요한 접근 방식이며 장바구니 분석, 웹 사용 마이닝, 연속 생산 등에 사용됩니다. 장바구니 분석에서는 항목.
웹 마이닝은 적응된 데이터 마이닝 방법을 인터넷에 적용한 것으로 볼 수 있지만 데이터 마이닝은 지식 발견 프로세스에 고정된 대부분의 구조화된 데이터에서 패턴을 발견하기 위한 알고리즘의 적용으로 정의됩니다.
웹 마이닝에는 여러 데이터 유형 모음을 지원하는 고유한 속성이 있습니다. 웹에는 텍스트를 포함하는 웹 페이지, 하이퍼링크를 통해 연결되는 웹 페이지, 웹 서버 로그를 통해 사용자 활동을 모니터링할 수 있는 등 마이닝 프로세스에 대한 여러 접근 방식을 제공하는 여러 측면이 있습니다.
장바구니 분석에서는 고객이 장바구니에 담는 다양한 품목 간의 연관성을 찾아 고객의 구매 습관을 분석합니다. 이러한 연관성을 발견하여 유통업체는 사용자가 자주 구매하는 요소를 분석하여 마케팅 방법을 생성합니다. 이 연관성은 소매업체가 선반 영역에 대한 선택적 마케팅 및 계획을 수행하도록 지원하여 판매 증가로 이어질 수 있습니다.
연관 규칙 학습 유형
다음과 같은 연관 규칙 학습 유형이 있습니다. -
선험적 알고리즘 − 이 알고리즘은 연관 규칙을 생성하기 위해 빈번한 데이터 세트가 필요합니다. 트랜잭션을 포함하는 데이터베이스에서 작동하도록 설계되었습니다. 이 알고리즘은 항목 집합을 효율적으로 계산하기 위해 너비 우선 검색과 해시 트리가 필요합니다.
일반적으로 장바구니 분석 및 함께 구매할 수 있는 상품을 학습할 수 있도록 지원하는 용도로 사용됩니다. 의료 분야에서 환자에 대한 약물 반응을 발견하는 데 사용할 수 있습니다.
Eclat 알고리즘 - Eclat 알고리즘은 Equivalence Class Transformation을 나타냅니다. 이 알고리즘은 트랜잭션 데이터베이스에서 빈번한 항목 집합을 찾기 위해 깊이 우선 검색 방법이 필요합니다. Apriori Algorithm보다 빠른 실행을 구현합니다.
F-P 성장 알고리즘 − F-P 성장 알고리즘은 빈번한 패턴을 나타냅니다. Apriori 알고리즘의 향상된 버전입니다. 빈번한 패턴 또는 트리라고 하는 트리 구조의 형태로 데이터베이스를 설명합니다. 이 빈번한 트리는 가장 빈번한 패턴을 추출하는 것을 목표로 합니다.