Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 역사는 무엇입니까?

<시간/>

데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 전송하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 프로세스입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.

데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 찾기 위해 다량의 정보를 선택, 탐색 및 모델링하는 절차입니다.

데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 단계에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝을 비롯한 여러 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 완료됩니다.

데이터 마이닝을 아웃소싱함으로써 낮은 운영 비용으로 모든 작업을 더 빠르게 수행할 수 있습니다. 특정 회사는 새로운 기술을 사용하여 수동으로 찾을 수 없는 데이터를 저장할 수도 있습니다. 여러 플랫폼에서 사용할 수 있는 수많은 데이터가 있지만 액세스할 수 있는 지식은 매우 제한적입니다.

데이터에서 유용한 패턴을 찾는 접근 방식에는 데이터 마이닝, 지식 추출, 데이터 발견, 데이터 수집, 데이터 고고학 및 데이터 패턴 처리를 포함하는 여러 이름이 주어졌습니다. 데이터 마이닝은 통계학자, 데이터 분석가 및 MIS(관리 정보 시스템) 커뮤니티에서 사용되었습니다.

데이터베이스 영역에서도 인지도가 높아졌다. 데이터베이스의 지식 발견 프로세스는 지식이 데이터 기반 발견의 최종 산물임을 유지하기 위해 1989년 첫 번째 KDD 워크숍(Piatetsky-Shapiro 1991)에서 발명되었습니다. 인공 지능과 머신 러닝 분야에서 대중화되었습니다.

KDD는 데이터에서 유용한 지식을 발견하는 전체 프로세스를 정의하고 데이터 마이닝은 이 프로세스의 특정 단계를 정의합니다. 데이터 마이닝은 데이터에서 패턴을 추출하기 위한 특정 알고리즘의 응용 프로그램입니다. KDD 프로세스와 데이터 마이닝 단계(프로세스 내)의 차이점은 이 개체의 핵심입니다.

데이터 준비, 데이터 선택, 데이터 정리, 적절한 사전 지식 통합 및 마이닝 결과의 적절한 분석을 포함한 KDD 프로세스의 추가 단계는 유용한 지식이 데이터에서 변경된다는 것을 제공하는 데 중요합니다.

데이터 마이닝 기술의 맹목적인 적용(통계 문헌에서 데이터 준설로 정당하게 승인되지 않음)은 위험한 활동이 될 수 있으며 무의미하고 잘못된 디자인을 쉽게 발견하게 됩니다.