Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

과학 및 공학에서 데이터 마이닝의 역할은 무엇입니까?

<시간/>

과학 및 공학에서 데이터 마이닝의 다양한 역할은 다음과 같습니다 -

데이터 웨어하우스 및 데이터 사전 처리 − 데이터 전처리 및 데이터 웨어하우스는 데이터 교환 및 데이터 마이닝에 중요합니다. 여러 환경과 여러 기간에서 수집된 일관성이 없거나 호환되지 않는 정보를 해결하기 위한 수단을 발견해야 하는 창고를 만들고 있습니다.

이를 위해서는 의미론, 참조 시스템, 수학, 측정, 효율성 및 정밀도를 조정해야 했습니다. 이기종 소스의 데이터를 통합하고 이벤트를 식별하기 위한 방법이 필요합니다.

복잡한 데이터 유형 마이닝 − 수치 데이터 세트는 본질적으로 이질적입니다. 여기에는 일반적으로 멀티미디어 데이터 및 지리 참조 스트림 데이터를 포함한 반구조화 및 비구조화 데이터와 정교하고 깊이 숨겨진 의미론이 포함된 데이터(예:게놈 및 단백질 기록)가 포함됩니다.

시공간 데이터, 생물학적 데이터, 관련 개념 계층 및 어려운 의미 관계를 관리하려면 강력하고 전용 분석 방법이 필요합니다.

그래프 기반 및 네트워크 기반 마이닝 − 그래프나 네트워크 모델링에서 마이닝할 각 객체는 그래프의 꼭짓점으로 정의되고, 꼭짓점 사이의 에지는 객체 간의 관계를 정의합니다. 예를 들어, 그래프는 유체 흐름 시뮬레이션을 포함한 정수 시뮬레이션으로 생성된 데이터 및 화학적 구조, 생물학적 경로 및 데이터를 모델링하는 데 사용할 수 있습니다.

분류, 빈번한 패턴 마이닝 및 클러스터링을 포함한 여러 그래프 기반 데이터 마이닝 서비스의 확장성 및 효율성 향상을 기반으로 한 그래프 또는 네트워크 모델링의 성공

시각화 도구 및 도메인별 지식 − 수학적 데이터 마이닝 시스템에는 높은 수준의 그래픽 사용자 인터페이스와 시각화 도구가 필요합니다. 이들은 패턴을 찾고, 찾기 패턴을 표현 및 시각화하고, 의사 결정에서 발견된 지식을 활용하는 연구원 및 일반 사용자를 모델링하기 위해 현재 도메인별 데이터 및 데이터 시스템과 통합되어야 합니다.

엔지니어링의 데이터 마이닝은 과학의 데이터 마이닝과 몇 가지 유사점을 공유합니다. 두 가지 방법 모두 많은 양의 데이터를 수집하고 데이터 사전 처리, 데이터 웨어하우징 및 어려운 데이터 유형의 확장 가능한 마이닝이 필요합니다. 둘 다 일반적으로 시각화를 사용하고 그래프와 네트워크를 최대한 활용합니다. 또한 여러 엔지니어링 프로세스에는 실시간 응답이 필요하므로 실시간으로 데이터 스트림을 마이닝하는 경우가 종종 필수 구성 요소가 됩니다.

우리의 일상 생활에는 엄청난 양의 인간 관계 데이터가 쏟아져 들어옵니다. 이러한 커뮤니케이션은 뉴스, 블로그, 기사, 웹 페이지, 온라인 토론, 제품 리뷰, 트위터, 메시지, 방송 및 커뮤니케이션과 같은 여러 형태로 인터넷과 여러 유형의 소셜 네트워크에 존재합니다.

따라서 사회 과학 및 사회 연구의 데이터 마이닝은 점점 유명해졌습니다. 또한 제품, 연설 및 기사에 대한 고객 또는 독자 피드백을 탐색하여 사회의 방향에 대한 일반적인 의견과 감정을 추론할 수 있습니다. 분석 결과는 추세를 예측하고 작업을 향상하며 의사 결정을 지원하는 데 사용할 수 있습니다.