KDD는 데이터베이스의 지식 발견을 나타냅니다. 데이터에서 지식을 발견하는 광범위한 프로세스를 정의하고 명확한 데이터 마이닝 기술의 상위 수준 응용 프로그램을 강조합니다. 인공 지능, 머신 러닝, 패턴 인식, 데이터베이스, 통계, 전문 시스템을 위한 지식 습득, 데이터 시각화 등 여러 분야의 연구자들이 관심을 갖고 있는 분야입니다.
KDD 프로세스의 주요 목적은 거대한 데이터베이스의 맥락에서 정보에서 데이터를 추출하는 것입니다. 지식으로 간주되는 것을 인식하기 위해 데이터 마이닝 알고리즘을 사용하여 이를 수행합니다. 데이터베이스의 지식 발견은 거대한 데이터 저장소의 프로그래밍된 탐색적 분석 및 모델링으로 처리됩니다. KDD는 크고 어려운 데이터 세트에서 유효하고 유용하며 이해하기 쉬운 디자인을 인식하는 조직화된 프로세스입니다.
KDD는 데이터에서 유효하고, 새롭고, 아마도 유용하고, 기본적으로 논리적인 설계를 식별하는 간단한 절차입니다. 이 프로세스는 KDD가 데이터 준비, 패턴 검색, 지식 평가 및 개선을 포함하는 많은 단계를 포함하며 모두 여러 번 반복됨을 나타냅니다. 사소하지 않다는 것은 일부 검색이나 추론이 포함되어 있음을 의미합니다. 즉, 숫자 집합의 평균값을 계산하는 것처럼 미리 정의된 양을 계산하는 것이 쉽지 않습니다.
데이터 마이닝은 기록을 조사하고, 모델을 개발하고, 이전에 알려지지 않은 패턴을 발견하는 알고리즘의 추론과 같은 KDD 절차의 루트입니다. 모델은 정보에서 지식을 추출하고 정보를 분석하고 정보를 예측하는 데 사용됩니다.
데이터 마이닝은 데이터 분석 및 검색 알고리즘 적용을 포함하는 KDD 프로세스의 한 단계로, 허용 가능한 계산 효율성 제한에서 데이터에 대한 패턴(또는 모델)의 특정 열거를 만듭니다.
패턴의 분야는 종종 무한하며, 패턴의 열거는 이 공간에서 어떤 형태의 검색을 포함합니다. 실제적인 계산 제약은 데이터 마이닝 알고리즘으로 분석할 수 있는 부분 공간에 심각한 제한을 가합니다.
KDD 프로세스에는 일부 필수 선택, 사전 처리, 서브샘플링 및 변환과 함께 데이터베이스 사용이 포함됩니다. 데이터 마이닝 방법(알고리즘)을 사용하여 패턴을 열거합니다. 및 지식으로 간주되는 열거된 패턴의 하위 집합을 인식하기 위해 데이터 마이닝의 제품을 계산합니다.
KDD 프로세스의 데이터 마이닝 구성 요소는 레코드에서 패턴을 추출하고 열거하는 알고리즘 방식과 관련이 있습니다. 완전한 KDD 프로세스에는 새로운 지식으로 처리할 수 있는 패턴을 결정하기 위해 마이닝된 패턴에 대한 평가 및 가능한 해석이 포함됩니다.