Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝과 통계의 차이점은 무엇입니까?

<시간/>

데이터 마이닝

데이터 마이닝은 중요한 패턴과 정책을 발견하는 방법으로 방대한 양의 사실을 자동 또는 반자동 방식으로 탐색 및 분석하는 기술입니다. 데이터베이스 소유자에게 명확하고 유용한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 발견하기 위해 대량의 데이터를 선택, 탐색 및 모델링하는 프로세스입니다.

데이터 마이닝은 의미 있는 패턴과 규칙을 찾기 위해 엄청난 양의 데이터를 자동 또는 반자동 수단으로 탐색 및 분석하는 절차입니다. 컴퓨터 알고리즘이나 통계 기법의 사용에 국한되지 않습니다. 회사 결정을 지원하기 위해 정보 기술과 함께 사용할 수 있는 비즈니스 인텔리전스 프로세스입니다.

데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 프로세스에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝과 같은 다양한 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 수행됩니다.

데이터 마이닝을 아웃소싱함으로써 낮은 운영 비용으로 모든 작업을 더 빠르게 완료할 수 있습니다. 전문 기업은 새로운 기술을 사용하여 수동으로 배치할 수 없는 데이터를 설정할 수도 있습니다. 다양한 플랫폼에서 사용할 수 있는 정보는 많지만 액세스할 수 있는 지식은 거의 없습니다.

통계

통계는 모든 데이터 마이닝 알고리즘의 주요 부분인 숫자 데이터의 분석 및 표시를 말합니다. 방대한 양의 데이터를 처리할 수 있는 도구 및 분석 방법을 지원합니다. 통계에는 계획, 설계, 정보 수집, 연구 결과 분석 및 보고가 포함됩니다. 이러한 통계로 인해 수학에만 국한되지 않고 비즈니스 분석가도 통계를 사용하여 비즈니스 문제를 해결합니다.

추론 통계는 표본이 모집단 매개변수의 값을 추정하는 데 사용됩니다. 두 데이터 세트가 유사하거나 다른지 확인하기 위해 가설 테스트를 수행할 수 있습니다. 인과관계를 설명하기 위해 선형 또는 다중 회귀 분석을 수행하는 데 사용됩니다.

가설 테스트는 두 데이터 세트를 수치적으로 비교할 수 있습니다. 예를 들어, 이 판매량이 주요 경쟁자의 판매량과 비슷하거나 더 낫다고 느낄(가설) 수 있습니다. 가설 테스트를 사용하여 이 가정을 수학적으로 확인하거나 거부할 수 있습니다. 상관 분석은 원하는 비즈니스 결과에 큰 영향을 미치는 비즈니스 변수를 확인하기 위해 종종 거대한 데이터 세트에서 관찰되는 여러 무작위 변수에서 관심 변수를 분리하는 간단한 도구입니다.