데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 공유하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 절차입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.
데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 찾기 위해 다량의 정보를 선택, 탐색 및 모델링하는 절차입니다.
컴퓨터 알고리즘이나 통계 기법의 사용에 국한되지 않습니다. 회사 결정을 지원하기 위해 정보 기술과 함께 사용할 수 있는 비즈니스 인텔리전스 프로세스입니다.
데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 단계에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝을 비롯한 여러 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 완료됩니다.
데이터 마이닝은 방대한 양의 데이터가 광범위하게 이용 가능하고 그러한 데이터를 유익한 데이터 및 지식으로 전환하는 데 필요하기 때문에 최근 몇 년 동안 정보 시장과 사회 전반에서 엄청난 관심을 받았습니다. 획득한 정보와 지식은 산업 분석, 사기 탐지, 사용자 유지, 생산 관리 및 과학 탐구에 이르는 소프트웨어에 사용할 수 있습니다.
데이터 마이닝은 데이터 기술의 자연스러운 발전의 결과로 간주될 수 있습니다. 데이터베이스 시스템 시장은 데이터 수집 및 데이터베이스 생성, 데이터 관리, 고급 데이터 분석을 포함한 다음 기능의 개발에서 진화 방향을 지원했습니다.
예를 들어, 최근의 데이터 수집 및 데이터베이스 생성 구조의 발전은 이후의 데이터 저장 및 검색, 쿼리 및 트랜잭션 처리를 위한 효과적인 구조의 개발에 필요한 역할을 했습니다. 쿼리와 트랜잭션 처리를 공통으로 제공하는 다양한 데이터베이스 시스템과 함께 고급 데이터 분석은 다음 대상으로 발전했습니다.
데이터는 여러 유형의 데이터베이스 및 데이터 저장소에 저장할 수 있습니다. 관리 의사 결정을 지원하기 위해 개별 사이트에서 통합된 스키마로 구성된 여러 이기종 데이터 소스의 저장소인 데이터 웨어하우스에 나타난 하나의 데이터 저장소 구조입니다.
데이터 웨어하우스 기술에는 데이터 정리, 데이터 통합 및 OLAP(온라인 분석 처리), 특히 요약, 통합 및 집계를 비롯한 기능과 여러 각도에서 데이터를 볼 수 있는 기능이 있는 분석 기술이 포함됩니다.