데이터 마이닝은 통계적, 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 전송하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 프로세스입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.
데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 찾기 위해 다량의 정보를 선택, 탐색 및 모델링하는 절차입니다.
데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 단계에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝을 비롯한 여러 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 완료됩니다.
데이터 마이닝을 아웃소싱함으로써 낮은 운영 비용으로 모든 작업을 더 빠르게 수행할 수 있습니다. 특정 회사는 새로운 기술을 사용하여 수동으로 찾을 수 없는 데이터를 저장할 수도 있습니다. 여러 플랫폼에서 사용할 수 있는 수많은 데이터가 있지만 액세스할 수 있는 지식은 매우 제한적입니다.
주요 과제는 데이터를 분석하여 문제를 해결하거나 회사 발전에 사용할 수 있는 필수 데이터를 추출하는 것입니다. 데이터를 마이닝하고 데이터에서 더 나은 판단을 찾는 데 사용할 수 있는 동적 도구와 기술이 많이 있습니다.
데이터 마이닝은 KDD(Knowledge Discovery in Database)라고도 합니다. . 프로세스로서의 지식 발견에는 다음 단계의 반복적인 시리즈가 포함됩니다. -
-
데이터 정리 − 노이즈 및 일관성 없는 정보를 제거할 수 있습니다.
-
데이터 통합 − 여러 데이터 소스를 연결할 수 있는 데이터 통합에서.
-
데이터 선택 − 데이터 선택 시 데이터베이스에서 분석 기능과 관련된 데이터를 가져옵니다.
-
데이터 변환 − 데이터 변환에서 요약 또는 집계 작업을 실행하여 데이터가 마이닝에 적용 가능한 형식으로 변환되거나 연결됩니다.
-
데이터 마이닝 − 지능적인 방법을 사용하여 데이터 패턴을 추출하는 중요한 단계입니다.
-
패턴 평가 − 몇 가지 흥미로운 측정을 기반으로 지식을 정의하는 정말 흥미로운 패턴을 인식할 수 있습니다.
-
지식 프레젠테이션 − 지식 프레젠테이션에서 시각화 및 지식 표현 방법을 사용하여 마이닝된 지식을 고객에게 제공합니다.