Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

어떤 종류의 데이터를 채굴할 수 있습니까?

<시간/>

데이터 마이닝은 방대한 양의 데이터에서 지식을 추출하거나 마이닝하는 것을 정의합니다. 데이터 마이닝은 일반적으로 엄청난 양의 데이터가 저장되고 처리되는 곳에서 사용됩니다. 예를 들어, 은행 시스템은 데이터 마이닝을 사용하여 지속적으로 처리되는 엄청난 양의 데이터를 저장합니다.

데이터 마이닝에서 데이터의 숨겨진 패턴은 여러 범주에 따라 유용한 데이터 조각으로 고려됩니다. 이 데이터는 데이터 웨어하우스가 포함된 영역에서 이를 분석하여 수집하고 데이터 마이닝 알고리즘을 수행합니다. 이 데이터는 가치를 줄이고 수익을 높이는 효과적인 결정을 내리는 데 도움이 됩니다.

데이터에 사용되는 다양한 유형의 데이터 마이닝 응용 프로그램은 다음과 같습니다 -

  • 관계형 데이터베이스 - 데이터베이스 시스템은 데이터베이스 관리 시스템이라고도 합니다. 여기에는 데이터베이스라고 하는 상호 관련된 데이터 세트와 데이터를 처리하고 액세스하기 위한 소프트웨어 프로그램 세트가 포함됩니다.

관계형 데이터베이스는 각각 고유한 이름이 부여된 테이블 세트입니다. 각 테이블은 일련의 속성(열 또는 필드)을 포함하고 일반적으로 거대한 튜플 세트(레코드 또는 행)를 저장합니다. 관계형 테이블의 각 튜플은 고유 키로 식별되고 속성 값 집합으로 표시되는 개체를 정의합니다. ER(Entity-Relationship) 데이터 모델을 포함하는 시맨틱 데이터 모델은 일반적으로 관계형 데이터베이스를 위해 구축된다. ER 데이터 모델은 데이터베이스를 엔터티 및 해당 관계의 집합으로 정의합니다.

  • 트랜잭션 데이터베이스 − 트랜잭션 데이터베이스에는 각 레코드가 트랜잭션을 정의하는 파일이 포함됩니다. 트랜잭션에는 일반적으로 고유한 트랜잭션 ID 번호(트랜스 ID)와 트랜잭션을 구성하는 항목(예:상점에서 구매한 항목) 목록이 포함됩니다.

거래 데이터베이스에는 거래 날짜, 고객 ID 번호, 판매원 및 판매가 발생한 지점의 ID 번호 등 판매와 관련된 기타 데이터가 포함된 관련 추가 테이블이 있을 수 있습니다.

  • 객체 관계형 데이터베이스 − 개체 관계형 데이터베이스는 개체 관계형 데이터 모델을 기반으로 조합됩니다. 이 모델은 복잡한 개체 및 개체 방향을 관리하기 위한 풍부한 데이터 유형을 지원하여 관계형 모델을 계속합니다.

  • 임시 데이터베이스 - 시간 데이터베이스는 일반적으로 시간 관련 속성을 포함하는 관계형 데이터를 저장합니다. 이러한 속성에는 각각 여러 의미가 있는 여러 타임스탬프가 포함될 수 있습니다.

  • 시퀀스 데이터베이스 − 시퀀스 데이터베이스는 시간에 대한 사실적 개념이 있든 없든 순서가 지정된 이벤트의 시퀀스를 저장합니다. 예를 들어 고객 쇼핑 순서, 웹 클릭 스트림 및 생물학적 순서가 있습니다.

  • 시계열 데이터베이스 − 시계열 데이터베이스는 반복적인 시간 측정(예:매시간, 매일, 매주)을 통해 액세스되는 일련의 값 또는 이벤트를 저장합니다. 예를 들어 증권 거래소, 재고 관리 및 자연 현상(예:온도 및 바람) 측정에서 수집한 데이터가 있습니다.