연관 규칙 학습은 한 데이터 요소가 다른 데이터 요소에 종속되는지 테스트하고 적절하게 생성하여 더 효과적일 수 있도록 하는 일종의 비지도 학습 방법입니다. 데이터 세트의 변수 사이에 흥미로운 관계나 관계를 찾으려고 합니다. 데이터베이스에서 변수 간의 흥미로운 관계를 찾는 것은 여러 규칙에 따라 다릅니다.
연관 규칙 학습은 기계 학습의 중요한 기술이며 장바구니 분석, 웹 사용 마이닝, 연속 생산 등에 사용됩니다. 장바구니 분석에서는 여러 대형 소매업체에서 항목 간의 관계를 찾는 데 적절하게 사용합니다.
장바구니 분석에서 사용자의 구매 습관은 사용자가 장바구니에 넣은 다양한 품목 간의 연관성을 발견하여 분석됩니다. 이러한 연관성을 찾아내어 소매업체는 사용자가 일반적으로 구매하는 구성 요소를 분석하여 접근하는 마케팅을 만듭니다. 이러한 연관성은 소매업체가 선반 공간에 대한 선택적 마케팅 및 디자인을 수행할 수 있도록 함으로써 판매 증가에 영향을 미칠 수 있습니다.
다단계 연계의 잘 알려진 응용 분야는 개념 계층의 개념에서 나타난 함께 자주 구매되는 품목의 그룹을 검색하여 사용자의 구매 습관을 이해하는 장바구니 분석입니다.
연결 규칙은 하나 이상의 제품 또는 서비스 제공 및 트랜잭션에 대한 일부 기본 데이터를 포함하는 트랜잭션으로 시작됩니다. 분석의 목적을 위해 제공하는 제품과 서비스를 아이템이라고 합니다.
이러한 트랜잭션은 구매 항목만 포함하는 데 사용되었습니다. 날짜와 시간, 사용자가 현금으로 결제했는지 신용카드로 결제했는지 등의 데이터를 사용할 수 있습니다.
모든 거래는 어떤 제품이 다른 제품과 함께 구매되는지에 대한 데이터를 제공합니다. 이것은 일부 제품 쌍이 함께 구매되었음을 여러 번 알려주는 공동 출현 테이블에 표시됩니다.
이러한 관찰은 연관 사례이며 사용자가 탄산음료를 구매하면 사용자가 오렌지 주스도 구매하는 것과 같은 공식 규칙을 제안할 수 있습니다. 데이터에서 5건의 거래 중 2건에는 탄산음료와 오렌지 주스가 모두 포함되어 있습니다. 이 두 트랜잭션은 규칙을 제공합니다. 규칙에 대한 지지율은 5% 중 2% 또는 40%입니다.
탄산음료를 포함하는 두 거래 모두 오렌지 주스도 포함하기 때문에 규칙에 대한 신뢰도가 높습니다. 탄산음료가 포함된 세 가지 트랜잭션 중 두 개에는 오렌지 주스도 포함되므로 "소다이면 오렌지 주스"라는 규칙의 신뢰도는 67%입니다. 역 규칙인 "오렌지 주스라면 탄산음료"는 신뢰도가 낮습니다.