Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 특징은 무엇입니까?

<시간/>

다음과 같은 데이터 마이닝의 다양한 기능이 있습니다 -

데이터 유형 − 업계에서 액세스할 수 있는 대부분의 데이터 마이닝 시스템은 통계, 범주 및 기호 속성이 있는 형식이 지정된 레코드 기반 관계형 데이터를 처리합니다. 데이터는 ASCII 텍스트, 관계형 데이터베이스 데이터 또는 데이터 웨어하우스 데이터 형식일 수 있습니다. 처리 중인 각 시스템이 처리할 수 있는 정확한 형식을 테스트하는 것이 중요합니다.

일부 유형의 데이터 또는 응용 프로그램은 패턴을 검색하기 위해 특수 알고리즘이 필요할 수 있으므로 해당 요구 사항은 기성품의 일반 데이터 마이닝 시스템으로 관리할 수 없습니다. 그 대신 텍스트 보고서, 지리 공간 데이터, 멀티미디어 데이터, 스트림 데이터, 시간 순서 데이터, 생물학적 데이터 또는 웹 데이터를 마이닝하거나 특정 응용 프로그램(금융, 소매 산업 포함 , 또는 통신).

시스템 문제 − 주어진 데이터 마이닝 시스템은 하나 또는 여러 개의 운영 프레임워크에서만 실행할 수 있습니다. 데이터 마이닝 소프트웨어를 호스팅하는 유명한 운영 체제는 UNIX/Linux 및 Microsoft Windows입니다. Macintosh, OS/2 등에서 실행되는 데이터 마이닝 시스템도 있습니다. 대규모 시장 지향 데이터

대규모 시장 지향적인 데이터 마이닝 시스템은 종종 클라이언트/서버 아키텍처를 채택합니다. 여기서 클라이언트는 개인용 컴퓨터가 될 수 있고 서버는 강력한 병렬 컴퓨터의 모음이 될 수 있습니다. 현재 추세에는 웹 기반 인터페이스를 지원하고 XML 데이터를 입력 및/또는 출력으로 활성화하는 데이터 마이닝 시스템이 있습니다.

데이터 소스 - 이것은 데이터 마이닝 시스템이 작동할 특정 데이터 형식을 정의합니다. 일부 시스템은 ASCII 텍스트 파일에서만 실행되는 반면 일부 시스템은 관계형 데이터 또는 데이터 웨어하우스 데이터에서 작동하여 여러 관계형 데이터 소스에 액세스합니다.

데이터 마이닝 시스템은 ODBC 연결 또는 ODBC 연결용 OLE DB를 제공해야 합니다. 이는 개방형 데이터베이스 연결, 특히 모든 관계형 데이터(IBM/DB2, Microsoft SQL Server, Microsoft Access, Oracle, Sybase 등의 관계형 데이터 포함) 및 형식이 지정된 ASCII 텍스트 데이터에 액세스할 수 있는 기능을 제공합니다.

데이터 마이닝 기능 및 방법론 − 데이터 마이닝 기능은 데이터 마이닝 시스템의 핵심을 형성합니다. 일부 데이터 마이닝 시스템은 분류와 같은 하나의 데이터 마이닝 기능만 지원합니다. 다른 것들은 개념 설명, 발견 중심 OLAP 분석, 연관 마이닝, 연결 분석, 통계 분석, 분류, 예측, 클러스터링, 이상값 분석, 유사성 검색, 순차 패턴 분석 및 시각적 데이터 마이닝을 포함한 여러 데이터 마이닝 기능을 도울 수 있습니다.

특정 데이터 마이닝 기능(분류 포함)에 대해 일부 시스템은 하나의 방법만 제공할 수 있는 반면 다른 시스템은 다양한 방법(의사결정 트리 분석, 베이지안 네트워크, 신경망, 지원 벡터 기계, 규칙 기반 분류, k-최근접 이웃 방법, 유전 알고리즘 및 사례 기반 추론).

여러 데이터 마이닝 기능과 기능당 여러 방법을 제공하는 데이터 마이닝 시스템은 사용자에게 더 높은 유연성과 분석 능력을 지원합니다. 일부 문제는 사용자가 몇 가지 다른 마이닝 기능을 시도하거나 몇 가지를 함께 통합해야 할 수 있으며 다른 종류의 데이터에 대해 다른 방법이 다른 방법보다 더 효율적일 수 있습니다.