가설 테스트는 데이터를 회사의 의사 결정 프로세스에 통합하는 가장 간단한 접근 방식입니다. 가설 테스트의 목적은 선입견을 입증하거나 반증하는 것이며 거의 모든 데이터 마이닝 노력의 일부입니다.
데이터 마이너는 관찰된 행동에 대한 가능한 설명을 먼저 생각하고 이러한 가설이 데이터 계산을 지시하도록 하여 메서드 간에 앞뒤로 바운스를 제공합니다.
가설 테스트는 과학자와 통계학자가 전통적으로 평생을 보내는 일입니다. 가설은 데이터를 분석하여 타당성을 검증할 수 있는 제안된 설명입니다. 이러한 정보는 관찰을 통해 쉽게 수집하거나 테스트 메일링을 포함한 실험을 통해 생성할 수 있습니다.
가설 테스트는 산업 영역에서 조직의 행동을 안내해 온 가정이 틀렸음을 드러낼 때 가장 가치가 있습니다. 예를 들어, 조직의 광고가 제품이나 서비스의 목표 시장과 반응의 특징에 대한 몇 가지 가설에 의존한다고 생각해 보십시오. 이러한 가설이 실제 응답에 의해 뒷받침되는지 여부를 테스트할 가치가 있습니다.
한 가지 접근 방식은 서로 다른 광고에서 서로 다른 발신 번호를 사용하고 각 응답자가 다이얼한 번호를 기록하는 것입니다. 통화 중에 수집된 정보는 광고가 도달하도록 설계된 인구의 프로필과 비교할 수 있습니다.
가설 생성의 핵심은 조직 전체에서, 그리고 적절한 경우 외부에서도 다양한 입력을 받는 것입니다. 아이디어의 흐름을 시작하는 데 필요한 모든 것은 특히 이전에 문제로 인식되지 않았던 문제인 경우 문제 자체에 대한 명확한 설명입니다.
문제가 조직의 성과를 평가하는 데 사용되는 지표에 포착되지 않기 때문에 문제가 인식되지 않을 것이라고 생각하는 것보다 더 자주 발생합니다.
조직이 매월 여러 번의 신규 판매를 통해 영업 인력을 계산해 왔다면, 영업 사원은 신규 사용자가 얼마나 오래 활성 상태를 유지하는지 또는 조직과의 관계 전반에 걸쳐 얼마를 지출하는지에 대해 깊이 생각해 본 적이 없을 것입니다.피>
가설 검정은 확실히 유용하지만 충분하지 않을 때가 있습니다. 이 책의 나머지 부분에서 설명하는 데이터 마이닝 기술은 모두 데이터를 기반으로 모델을 만들어 새로운 것을 배우도록 설계되었습니다.
가장 일반적인 의미에서 모델은 실제 세계를 추론하는 데 사용할 수 있을 만큼 현실을 잘 반영하는 작동 방식에 대한 설명 또는 설명입니다.