데이터 마이닝의 이론적 토대는 무엇입니까?

<시간/>

데이터 마이닝의 기초에는 다음과 같은 몇 가지 이론이 있습니다. -

데이터 축소 − 이 이론에서 데이터 마이닝의 기본은 데이터 표현을 줄이는 것입니다. 데이터 축소는 거대한 데이터베이스에 대한 쿼리에 대한 대략적인 답변을 빠르게 얻어야 하는 필요성에 대한 응답으로 속도에 대한 확실성을 교환합니다.

데이터 축소 방법에는 특이값 분해(주성분 분석의 원동력), 웨이블릿, 회귀, 로그 선형 모델, 히스토그램, 클러스터링, 샘플링 및 인덱스 트리 개발이 포함됩니다.

데이터 압축 − 이 이론에 따르면 데이터 마이닝의 기본은 주어진 정보를 비트, 연관 규칙, 결정 트리, 클러스터 등으로 인코딩하여 압축하는 것입니다.

패턴 발견 − 이 이론에서 데이터 마이닝의 기본은 연관, 분류 모델, 순차 패턴 등 데이터베이스에 나타나는 패턴을 찾는 것입니다. 머신 러닝, 신경망, 연관 마이닝, 순차 패턴 마이닝, 클러스터링, 여러 다른 하위 필드가 이 이론에 기여합니다.

확률 이론 - 통계이론에 근거한 내용입니다. 이 이론에서 데이터 마이닝의 기초는 랜덤 변수(예:베이지안 믿음 네트워크 또는 계층적 베이지안 모델)의 공동 확률 분포를 찾는 것입니다.

미시경제적 관점 − 미시경제적 관점은 데이터 마이닝을 일부 기업의 의사결정 절차(예:마케팅 접근 방식 및 생산 계획 관련)에 사용할 수 있는 정도로만 매혹적인 패턴을 발견하는 서비스로 간주합니다.

이 보기는 패턴이 기반으로 할 수 있는 경우 흥미로운 것으로 간주되는 서비스 중 하나입니다. 기업은 결정의 서비스 또는 가치를 극대화하는 것이 목적인 최적화 문제에 직면한 것으로 간주됩니다. 이 이론에서 데이터 마이닝은 비선형 최적화 문제가 됩니다.

귀납적 데이터베이스 − 이 이론에 따르면 데이터베이스 스키마는 데이터베이스에 저장된 데이터와 패턴을 포함합니다. 데이터 마이닝은 데이터베이스의 정보와 이론(즉, 패턴)을 쿼리하는 기능인 데이터베이스에서 유도를 구현하는 문제입니다. 이 견해는 데이터베이스 시스템의 여러 연구원들 사이에서 유명합니다.

이러한 이론은 공동으로 배타적이지 않습니다. 예를 들어, 패턴 발견은 데이터 축소 또는 데이터 압축의 설계로 볼 수도 있습니다. 이상적으로는 이론적 프레임워크가 일반적인 데이터 마이닝 작업(연관, 분류 및 클러스터링 포함)을 모델링할 수 있어야 하고, 확률적 기능이 있어야 하며, 여러 형태의 데이터를 관리할 수 있어야 하며, 데이터 마이닝의 반복적이고 상호작용적인 본질을 다룰 수 있어야 합니다. 또한 이러한 요구 사항을 충족하는 데이터 마이닝에 대한 잘 정의된 구조를 구축하기 위한 노력이 필요합니다.