Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝과 관련된 다양한 문제는 무엇입니까?

<시간/>

데이터 마이닝은 통계 및 수학적 기법을 포함한 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 공유하여 유용한 새로운 상관 관계, 패턴 및 추세를 찾는 절차입니다. 의심하지 않은 관계를 발견하고 데이터 소유자에게 논리적이고 도움이 되는 새로운 방법으로 기록을 요약하기 위한 사실 데이터 세트의 분석입니다.

데이터 마이닝과 관련된 다양한 문제는 다음과 같습니다 -

  • 개인정보 보호 문제 − 이것은 기술의 비즈니스가 아닌 사회적인 비즈니스와 관련된 근본적인 문제입니다. 싱글 프라이버시 문제입니다. 데이터 마이닝을 통해 일상적인 비즈니스 거래를 분석하고 단일 구매 습관 및 선호도에 대한 필수 데이터를 수집하는 데 적용할 수 있습니다.

  • 데이터 무결성 문제 − 주요 구현 과제는 여러 소스에서 충돌하거나 중복되는 정보를 병합하는 것입니다. 예를 들어, 은행은 다른 데이터베이스에 있는 신용 카드 계정을 보호할 수 있습니다. 개별 카드 소지자의 주소는 각각 다를 수 있습니다. 소프트웨어는 한 시스템에서 다른 시스템으로 데이터를 변환하고 가장 현재 입력된 주소를 선택해야 합니다.

  • 관계형 데이터베이스 구조 또는 다차원 구조 - 기술적인 문제는 관계형 데이터베이스 구조를 시작하는 것이 좋은지 다차원적인 구조로 시작하는 것이 좋은가입니다. 관계형 구조에서 데이터는 테이블에 저장되어 Adhoc 쿼리가 가능합니다. 다차원 구조에서 큐브 집합은 범주에 따라 생성된 하위 집합과 함께 배열로 연결됩니다. 다차원 구조가 다차원 데이터 마이닝을 지원하는 반면, 관계형 구조는 클라이언트/서버 환경에서 훨씬 더 잘 구현되었습니다.

  • 비용 − 데이터 마이닝 쿼리가 더 효과적일수록 데이터에서 수집되는 정보의 활용도가 높아지고 수집 및 유지 관리되는 데이터의 양을 늘려야 하는 압력이 커지므로 더 빠르고 강력한 데이터 마이닝 쿼리에 대한 압력이 높아집니다. 이는 더 크고 더 빠른 시스템에 대한 압력을 증가시키며 더 높은 가격을 제공합니다.

  • 데이터 품질 − 데이터 마이닝의 가장 큰 과제 중 하나입니다. 데이터 품질은 데이터의 정확성과 무결성을 정의합니다. 데이터 품질은 분석되는 정보의 구조와 일관성과도 관련이 있습니다. 중복 데이터의 존재, 데이터 표준의 부재, 업데이트의 적시성 및 인적 오류는 더 복잡한 데이터 마이닝 기술의 효율성에 자동으로 영향을 미칠 수 있습니다.

  • 상호 운용성 − 평균 표준 및 프로세스를 사용하여 다른 시스템 또는 데이터와 함께 작동하는 컴퓨터 시스템 또는 데이터의 능력을 정의합니다. 데이터 마이닝의 경우 데이터베이스와 소프트웨어의 상호 운용성은 여러 데이터베이스를 동시에 검색 및 분석할 수 있도록 하고 여러 기관의 데이터 마이닝 활동의 호환성을 제공하는 데 필수적입니다.