Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

패턴 마이닝의 응용 프로그램은 무엇입니까?

<시간/>

다음과 같은 패턴 마이닝의 다양한 응용 프로그램이 있습니다 -

패턴 마이닝은 일반적으로 여러 데이터 집약적 애플리케이션에서 전처리로 노이즈 필터링 및 데이터 정리에 사용됩니다. 예를 들어 수만 가지 차원(예:유전자 설명)을 포함하는 마이크로어레이 데이터를 탐색하는 데 사용할 수 있습니다.

패턴 마이닝은 데이터에 숨겨진 고유 메커니즘 및 클러스터의 발견을 제공합니다. 예를 들어, DBLP 데이터 세트가 주어지면 빈번한 패턴 마이닝은 공동 저자 클러스터(일반적으로 협업하는 저자를 결정함으로써) 및 회의 클러스터(여러 저자 및 용어의 공유를 결정함으로써)와 같은 흥미로운 클러스터를 간단히 발견할 수 있습니다. 이러한 아키텍처 또는 클러스터 검색은 추가적인 정교한 데이터 마이닝을 위한 전처리로 사용할 수 있습니다.

빈번한 패턴은 고차원 영역의 부분 공간 클러스터링에 효과적으로 사용할 수 있습니다. 클러스터링은 두 물체 사이의 거리를 측정하기 복잡한 고차원 공간에서 어렵습니다. 이는 이러한 거리가 개체가 차지하는 여러 차원 집합에 의해 지배되기 때문입니다.

패턴 분석은 시공간 정보, 시계열 데이터, 이미지 데이터, 비디오 데이터 및 멀티미디어 데이터 분석에 유용합니다. 시공간 데이터 분석의 응용은 코로케이션 패턴의 분석입니다. 이러한 정보는 특정 질병이 지리적으로 우물, 병원 또는 강과 같은 특정 물체와 같은 위치에 있는지 판단하는 데 도움이 될 수 있습니다.

시계열 데이터 분석에서 연구자들은 시계열 값을 여러 간격으로 이산화하여 작은 변동과 값 차이를 무시할 수 있습니다. 데이터를 순차적 패턴으로 요약할 수 있으며, 이를 인덱싱하여 유사성 검색 또는 비교 분석을 단순화할 수 있습니다.

이미지 분석 및 패턴 인식에서 연구자들은 시각적인 단편을 시각적 단어로 질서 있게 자주 표시하여 효율적인 클러스터링, 분류 및 비교 분석에 사용할 수 있습니다.

패턴 마이닝은 트리, 그래프, 하위 시퀀스 및 네트워크를 포함한 시퀀스 또는 구조 데이터의 분석에 사용되었습니다. 소프트웨어 엔지니어링에서 연구원들은 소프트웨어 오류 식별을 지원하는 순차적 패턴으로 코드 실행에서 일관된 연속 또는 간격 하위 시퀀스를 사용합니다.

대규모 소프트웨어 프로그램의 복사 및 붙여넣기 오류는 소스 코드의 확장된 순차적 패턴 분석을 통해 인식할 수 있습니다. 표절된 소프트웨어 프로그램은 실질적으로 동일한 프로그램 흐름/루프 메커니즘을 기반으로 인식될 수 있습니다.

빈번하고 구별되는 패턴을 기본 인덱싱 메커니즘(그래프 인덱스라고 함)으로 사용하여 크고 복잡하며 구조화된 데이터 세트 및 네트워크 검색을 제공할 수 있습니다. 이들은 화합물 데이터베이스 또는 XML 구조의 데이터베이스를 포함하여 그래프 구조의 데이터에서 유사성 검색을 제공합니다. 이러한 패턴은 데이터 압축 및 설명에 사용할 수 있습니다.