Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

메타룰은 데이터 마이닝에 어떻게 유용합니까?

<시간/>

데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 전송하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 프로세스입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.

데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 찾기 위해 다량의 정보를 선택, 탐색 및 모델링하는 절차입니다.

데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 단계에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝을 비롯한 여러 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 완료됩니다.

Metarules를 사용하면 사용자가 마이닝과 관련된 규칙의 구문 형식을 정의할 수 있습니다. 규칙 형식을 제약 조건으로 사용하여 마이닝 단계의 효율성을 높일 수 있습니다. 메타 규칙은 데이터에 대한 분석가의 경험, 기대 또는 직관을 기반으로 하거나 데이터베이스 스키마에 따라 자동으로 생성될 수 있습니다.

메타룰 기반 마이닝 − AllElectronics의 시장 분석가로서 고객을 정의하는 데이터(고객 연령, 주소 및 신용 등급 포함)와 고객 거래 목록에 액세스할 수 있다고 생각하십시오.

고객 특성과 고객이 구매하는 품목 간의 연관성을 찾을 수 있습니다. 그러나 이러한 관계를 반영하는 몇 가지 연관 규칙을 찾는 대신 사무용 소프트웨어 판매를 향상시키는 고객 특성 쌍을 결정하는 데만 관심이 있습니다.

그러한 메타룰의 예는

P1 (X, Y)∧ P2 (X, W) ⇒ 구매(X, "사무용 소프트웨어")

여기서 P1 및 P2 마이닝 단계에서 주어진 데이터베이스의 속성으로 인스턴스화되는 술어 변수이고, X는 고객을 정의하는 변수이며, Y와 W는 P1에 할당된 속성 값을 취합니다. 및 P2 , 따라서.

일반적으로 사용자는 인스턴스화를 위해 처리할 속성 목록을 P1로 정의할 수 있습니다. 및 P2 . 따라서 기본 세트를 사용할 수 있습니다.

일반적으로 메타룰은 사용자가 지각하거나 확인하는 관계에 관한 가설을 형성합니다. 데이터 마이닝 시스템은 주어진 메타룰을 연결하는 규칙을 검색할 수 있습니다. 예를 들어,

age(X, "30...39")∧ income(X, "41K...60K") ⇒ 구매(X, "오피스 소프트웨어")