Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝 메트릭이란 무엇입니까?

<시간/>

데이터 마이닝은 지각 모델, 분석 모델 및 다중 알고리즘을 사용하여 인간 두뇌의 기술을 시뮬레이션하는 인공 지능의 한 형태입니다. 데이터 마이닝은 기계가 인간의 결정을 내리고 인간의 선택을 할 수 있도록 지원합니다.

데이터 마이닝 도구의 사용자는 의사 결정을 지원하기 위해 기계 규칙, 기본 설정 및 경험을 지시해야 합니다. 데이터 마이닝 메트릭은 다음과 같습니다. -

유용성 − 유용성은 모델이 유용한 데이터를 제공하는지 여부를 알려주는 몇 가지 메트릭을 포함합니다. 예를 들어, 위치 저장과 판매 사이의 상관 관계를 나타내는 데이터 마이닝 모델은 정확하고 신뢰할 수 있지만 같은 위치에 더 많은 상점을 삽입하여 그 결과를 일반화할 수 없기 때문에 유용하지 않습니다.

또한 특정 위치에서 더 많은 매출이 발생하는 이유에 대한 근본적인 비즈니스 질문에 답하지 않습니다. 또한 성공적인 것처럼 보이는 모델은 데이터의 상호 상관에 의존하기 때문에 무의미하다는 것을 알 수 있습니다.

투자 수익률(ROI) − 데이터 마이닝 도구는 데이터 안에 숨겨진 흥미로운 패턴을 찾고 예측 모델을 개발합니다. 이 모델에는 기록에 얼마나 잘 맞는지를 나타내는 몇 가지 측정값이 있습니다. 데이터 마이닝 분석의 요소로 보고된 일부 측정값을 기반으로 결정을 내리는 방법이 명확하지 않습니다.

데이터 마이닝 중 재무 정보 액세스 − 재정적 측면에서 의사 결정을 구성하는 가장 간단한 방법은 일반적으로 재무 데이터도 포함하도록 채굴되는 원시 정보를 보강하는 것입니다. 일부 조직에서는 데이터 웨어하우스와 데이터 마트에 투자하고 개발하고 있습니다.

웨어하우스 또는 마트의 설계에는 예상 쿼리에 필요한 분석 및 데이터 유형에 대한 고려 사항이 포함됩니다. 제품 속성, 사용자 프로필 등에 대한 보다 일반적인 데이터에 대한 액세스와 함께 재무 정보에 대한 액세스가 유용할 수 있는 방식으로 창고를 설계하고 있습니다.

데이터 마이닝 측정항목을 재정 조건으로 변환 − 일반적인 데이터 마이닝 메트릭은 "상승도"의 척도입니다. 상승도는 모델이 사용되지 않는 기본 비율과 관련하여 특정 모델이나 패턴을 사용하여 달성한 것을 측정한 것입니다. 높은 값은 많은 것을 달성했음을 의미합니다. 그러면 단순히 리프트를 기반으로 결정을 내릴 수 있을 것 같습니다.

정확도 − 정확도는 모델이 지원되는 데이터의 속성과 결과를 얼마나 잘 연관시키는지를 측정한 것입니다. 정확도 측정은 여러 가지가 있지만 모든 정확도 측정은 사용되는 정보에 따라 다릅니다. 실제로 값이 누락되거나 근사치일 수 있거나 데이터가 여러 프로세스에 의해 변경되었을 수 있습니다.

이는 탐색 및 개발 절차이며, 특히 데이터의 특성이 상당히 균일한 경우 데이터의 특정 오류 양을 수용하기로 결정할 수 있습니다. 예를 들어, 과거 판매를 기반으로 특정 상점의 판매를 예측하는 모델은 해당 상점이 지속적으로 잘못된 회계 기술을 사용하더라도 강력한 상관 관계가 있고 매우 정확할 수 있습니다. 따라서 정확도 측정은 신뢰성 평가와 균형을 이루어야 합니다.