Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 작업은 무엇입니까?

<시간/>

데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 전송하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 프로세스입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.

데이터 마이닝 작업은 데이터 마이닝 시스템에 입력되는 데이터 마이닝 쿼리의 디자인에서 정의할 수 있습니다. 데이터 마이닝 쿼리는 데이터 마이닝 작업 프리미티브의 조건으로 표현됩니다. 이러한 기본 요소를 통해 사용자는 탐색 중에 데이터 마이닝 시스템과 상호 연결하여 마이닝 프로세스를 지시하거나 여러 각도 또는 깊이에서 결과를 테스트할 수 있습니다.

데이터 마이닝의 작업은 다음과 같습니다 -

마이닝할 작업 관련 데이터 세트 - 이것은 사용자가 관련된 데이터베이스 또는 정보 집합의 부분을 정의합니다. 여기에는 데이터베이스 속성 또는 관심 있는 데이터 웨어하우스 차원(관련 속성 또는 차원으로 정의됨)이 포함됩니다.

채굴할 지식의 종류 − 특성화, 판별, 연관 또는 상관 분석, 분류, 예측, 클러스터링, 이상값 분석 또는 진화 분석을 포함하여 작동할 데이터 마이닝 기능을 정의합니다.

검색 프로세스에 사용할 배경 지식 − 채굴할 도메인에 대한 이 지식은 지식 발견 프로세스를 지시하고 확립된 패턴을 계산하는 데 도움이 됩니다. 개념 계층은 여러 추상화 방법으로 데이터를 마이닝할 수 있도록 하는 배경 지식의 유명한 형태입니다.

패턴 평가를 위한 흥미도 측정 및 임계값 − 마이닝 프로세스를 안내하거나 발견 후 발견된 패턴을 계산하는 데 사용할 수 있습니다. 여러 유형의 지식은 서로 다른 흥미로운 측정값을 가질 수 있습니다.

발견된 패턴을 시각화하기 위해 예상되는 표현 − 규칙, 테이블, 차트, 그래프, 의사결정 트리 및 큐브를 포함할 수 있는 발견된 패턴이 표시되는 형식을 나타냅니다.

데이터 마이닝 쿼리 언어는 이러한 기본 요소를 통합하여 사용자가 데이터 마이닝 시스템에 유연하게 연결할 수 있도록 설계할 수 있습니다. 데이터 마이닝 쿼리 언어는 사용자 친화적인 그래픽 인터페이스를 구성할 수 있는 권한을 지원합니다. 이는 데이터 마이닝 시스템과 다른 데이터 시스템 간의 통신 및 전체 데이터 처리 환경과의 통합을 촉진합니다.

데이터 마이닝은 데이터 특성화에서 진화 분석에 이르기까지 광범위한 기능을 보호하기 때문에 포괄적인 데이터 마이닝 언어를 설계하는 것은 어려운 일입니다. 각 작업에는 몇 가지 요구 사항이 있습니다. 효과적인 데이터 마이닝 쿼리 언어를 설계하려면 다양한 유형의 데이터 마이닝 작업의 힘, 한계 및 기본 구조에 대한 폭넓은 학습이 필요했습니다.