Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

KDD가 필요한 이유는 무엇입니까?


데이터를 지식으로 바꾸는 전통적인 기술은 수동 분석 및 해석에 달려 있습니다. 예를 들어, 헬스케어 업계에서는 전문가들이 헬스케어 데이터의 현재 동향과 변화를 분기별로 체계적으로 분석하는 것이 익숙합니다.

전문가는 후원하는 의료 기관에 대한 분석을 자세히 설명하는 보고서를 지원합니다. 이 보고서는 향후 의료 관리를 위한 의사 결정 및 계획의 기초가 됩니다. 행성 지질학자들이 원격으로 감지된 행성과 소행성의 이미지를 샅샅이 살펴보고 충돌 분화구와 같은 관심 지질 대상을 주의 깊게 배치하고 목록화하는 것을 포함하여 여러 유형의 응용 프로그램이 있습니다.

이러한 형태의 데이터 세트 수동 조사는 느리고 비용이 많이 들고 매우 주관적입니다. 데이터 볼륨이 극적으로 생성됨에 따라 이러한 종류의 수동 데이터 분석은 여러 영역에서 완전히 비실용적이 되고 있습니다.

비즈니스에서 주요 KDD 응용 분야에는 마케팅, 금융(특히 투자), 사기 탐지, 제조, 통신 및 웹 에이전트가 포함됩니다.

마케팅 − 마케팅에서 기본 응용 프로그램은 여러 고객 그룹을 인식하고 행동을 예측하기 위해 고객 데이터베이스를 분석하는 데이터베이스 마케팅 시스템입니다.

투자 − 몇몇 회사는 투자를 위해 데이터 마이닝을 사용하지만 대부분은 자신의 시스템을 대표하지 않습니다. 한 가지 예외는 LBS Capital Management입니다. 이 시스템은 전문 시스템, 신경망 및 유전 알고리즘을 사용하여 총 6억 달러에 달하는 포트폴리오를 처리합니다. 1993년에 시작된 이래 시스템은 광범위한 주식 시장을 능가했습니다.

사기 감지 − HNC Falcon 및 Nestor PRISM 시스템은 수백만 개의 계정을 감시하는 신용 ​​카드 사기를 확인하는 데 사용됩니다. 미국 재무부 금융 범죄 집행 네트워크의 FAIS 시스템은 자금 세탁 활동을 나타낼 수 있는 금융 거래를 식별할 수 있습니다.

제조 − General Electric과 SNECMA 간의 합작 투자 요소로 개발된 CASSIOPEE 문제 해결 시스템. 유럽 ​​3대 항공사에서 보잉 737의 문제를 진단하고 예측하는 데 사용했습니다.

통신 − TASA(통신 경보 시퀀스 분석기)는 통신 장비 및 3개의 전화 네트워크 제조업체와 협력하여 개발되었습니다(Mannila, Toivonen 및 Verkamo 1995). 시스템은 알람 스트림에서 자주 발생하는 알람 에피소드를 찾아 규칙으로 표시하기 위한 새로운 인프라를 사용합니다.

상호작용과 반복을 제공하는 유연한 데이터 검색 도구로 탐색할 수 있는 발견된 규칙의 집합이 엄청나게 많습니다. 이 방법에서 TASA는 규칙에 대한 기본 무차별 대입 검색 결과를 구체화하기 위해 가지치기, 그룹화 및 정렬 장치를 제공합니다.

데이터 정리 − MERGE-PURGE 시스템은 중복 복지 청구 식별에 사용되었습니다(Hernandez and Stolfo 1995). 워싱턴주 복지부의 데이터에 강력하게 사용되었습니다.