Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝 모델의 유형은 무엇입니까?

<시간/>

데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 전송하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 프로세스입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.

데이터 마이닝 기술을 사용하여 서술적 프로파일링, 지시적 프로파일링, 예측과 같은 3가지 종류의 작업에 대한 3가지 종류의 모델을 만들 수 있습니다.

설명적 프로파일링 − 기술 모델은 기록에 있는 내용을 정의합니다. 출력은 진행 상황을 정의하는 여러 차트, 숫자 또는 그래픽입니다. 가설 테스트는 기술 모델을 만듭니다. 다시 말해, 직접 프로파일링과 예측 모두 모델을 구성할 때 목표를 염두에 두고 있습니다.

프로파일링 모델에서 초점은 입력과 유사한 시간 프레임에 있습니다. 예측 모델에서 초점은 다음 시간 프레임입니다. 예측은 한 기간의 데이터에서 다음 기간의 결과를 정의할 수 있는 디자인을 발견하는 것을 정의합니다. 프로파일링과 예측의 구분을 강화하는 이유는 모델링 방법론, 특히 모델 세트 형성 시 시간 분석과 관련이 있기 때문입니다.

지시된 프로파일링 − 프로파일링은 많은 문제에 대한 친숙한 접근 방식입니다. 정교한 데이터 분석이 필요하지 않습니다. 예를 들어 설문조사는 고객 프로필을 구축하는 일반적인 방법 중 하나입니다. 설문 조사는 고객과 잠재 고객이 어떤 모습인지 또는 최소한 설문 조사 응답자가 질문에 답변하는 방식을 보여줍니다.

프로필은 지리적 위치, 성별 및 연령과 같은 인구 통계학적 변수를 기반으로 하는 경우가 많습니다. 광고는 이와 같은 변수에 따라 판매되기 때문에 인구통계학적 프로필은 바로 미디어 전략으로 전환될 수 있습니다.

예측 − 프로파일링은 과거의 데이터를 사용하여 과거에 발생한 일을 설명합니다. 예측은 한 단계 더 나아갑니다. 예측은 과거의 데이터를 사용하여 미래에 일어날 가능성을 예측합니다. 이것은 정보의 동적 사용입니다.

낮은 보관 잔고와 CD 소유권 간의 상관 관계는 CD 보유자의 프로필에 도움이 되지 않지만 보관 잔고가 높으면 (다른 지표와 함께) 향후 CD 구매를 예측할 수 있습니다.

예측 모델을 구축하는 것은 모델 입력 또는 예측자와 모델 출력 사이의 시간적 분리, 즉 예측 대상이 필요합니다. 이 파티션이 지원되지 않으면 모델이 작동하지 않습니다.