Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 응용 프로그램은 무엇입니까?


데이터 마이닝은 통계 및 수학적 기법뿐만 아니라 패턴 인식 기술을 사용하여 저장소에 저장된 대량의 데이터를 선별하여 의미 있는 새로운 상관 관계, 패턴 및 추세를 발견하는 프로세스입니다.

예상치 못한 관계를 발견하고 데이터 소유자에게 이해하기 쉽고 유익한 새로운 기술로 기록을 요약하는 것은 관찰 데이터 세트의 분석입니다. 다음과 같은 데이터 마이닝의 다양한 응용 프로그램이 있습니다 -

데이터 웨어하우스 및 데이터 사전 처리 − 데이터 웨어하우스는 정보 교환 및 데이터 마이닝에 필수적입니다. 지리정보의 영역이지만, 진정한 지리정보 웨어하우스는 현재 존재하지 않습니다.

이러한 웨어하우스를 만들려면 의미 체계, 참조 시스템, 기하학, 정확성 및 정밀도 조정과 같은 지리적 및 시간적 데이터 비호환성을 해결하기 위한 수단을 찾아야 합니다.

일반적으로 수학 소프트웨어의 경우 이기종 소스의 정보(서로 다른 기간을 다루는 데이터 포함)를 통합하고 활동을 식별하는 방법이 필요합니다. 예를 들어, 기후 및 생태계 데이터(공간 및 시간)의 경우 문제는 공간 영역에서 너무 많은 이벤트가 있고 시간 영역에서 너무 적은 이벤트가 있다는 것입니다.

복잡한 데이터 유형 마이닝 − 과학 데이터 세트는 본질적으로 이질적이며 일반적으로 멀티미디어 데이터 및 지리 참조 스트림 데이터를 포함하여 반정형 및 비정형 데이터를 포함합니다. 시공간 데이터, 관련 개념 계층 및 복잡한 지리적 관계(예:비유클리드 거리)를 처리하려면 강력한 방법이 필요합니다.

그래프 기반 마이닝 − 기존 모델링 접근 방식의 한계로 인해 여러 물리적 현상 및 프로세스를 모델링하는 것이 어렵거나 불가능한 경우가 많습니다. 또는 레이블이 지정된 그래프를 사용하여 숫자 데이터 세트에 존재하는 공간적, 토폴로지적, 기하학적 및 기타 관계적 특성 중 일부를 정복할 수 있습니다.

그래프 모델링에서 마이닝할 모든 데이터는 그래프의 정점으로 설명되고 정점 사이의 가장자리는 개체 간의 관계를 설명합니다. 예를 들어, 그래프는 유체 흐름 시뮬레이션과 같은 수치 시뮬레이션으로 생성된 데이터 및 화학 구조를 모델링하는 데 사용할 수 있습니다.

그러나 그래프 모델링의 성공 여부는 분류, 빈번한 패턴 마이닝 및 클러스터링과 같은 많은 기존 데이터 마이닝 작업의 확장성과 효율성 향상에 달려 있습니다.

시각화 도구 및 도메인별 지식 − 수치 데이터 마이닝 시스템에는 높은 수준의 그래픽 사용자 인터페이스와 시각화 도구가 필요합니다. 이들은 기존의 도메인별 데이터 시스템 및 데이터베이스 시스템과 통합되어 연구원 및 일반 사용자가 디자인을 검색하고, 발견된 디자인을 해석 및 시각화하고, 의사 결정에 발견된 지식을 활용하도록 안내해야 합니다.