데이터 마이닝
데이터 마이닝은 통계 및 수학적 기법뿐만 아니라 패턴 인식 기술을 사용하여 저장소에 저장된 많은 양의 데이터를 선별하여 의미 있는 새로운 상관 관계, 패턴 및 추세를 발견하는 프로세스입니다. 관찰 데이터 세트를 사용하여 예상치 못한 관계를 찾고 데이터 소유자가 이해할 수 있고 유용한 새로운 방식으로 데이터를 요약합니다.
데이터베이스 소유자에게 명확하고 유익한 결과를 얻기 위해 처음에는 알려지지 않은 규칙성 또는 관계를 발견하기 위해 방대한 양의 데이터를 선택, 탐색 및 모델링하는 절차입니다. 데이터 마이닝은 의미 있는 패턴과 규칙을 발견하기 위해 대량의 데이터를 자동 또는 반자동 수단으로 탐색 및 분석하는 프로세스입니다.
데이터 마이닝은 데이터 과학과 유사합니다. 특정 상황에서 특정 데이터 세트에 대해 목적을 가진 사람이 수행합니다. 이 프로세스에는 텍스트 마이닝, 웹 마이닝, 오디오 및 비디오 마이닝, 사진 데이터 마이닝, 소셜 미디어 마이닝과 같은 다양한 유형의 서비스가 포함됩니다. 단순하거나 매우 구체적인 소프트웨어를 통해 수행됩니다.
기계 학습
기계 학습은 거대한 데이터 처리를 위한 복잡한 알고리즘을 만들고 사용자에게 결과를 지원하는 접근 방식입니다. 경험을 통해 이해하고 예측하는 복잡한 프로그램을 사용합니다.
알고리즘은 훈련 정보를 자주 입력하여 자체적으로 개선됩니다. 머신 러닝의 주요 목표는 데이터를 학습하고 인간이 이해하고 사용할 수 있는 데이터로부터 모델을 구축하는 것입니다.
다음과 같은 두 가지 유형의 기계 학습이 있습니다. -
-
비지도 머신 러닝 − 비지도 학습은 훈련된 데이터 세트를 기반으로 결과를 예측하지 않고 클러스터링 및 결과 예측과 관련된 직접적인 기술을 사용합니다. 훈련된 데이터 세트는 출력이 알려진 입력으로 표시됩니다.
-
지도 머신 러닝 − 지도 학습은 교사로서 감독자의 존재를 정의합니다. 지도 학습은 일부 정보가 이미 실제 응답으로 표시되어 있음을 의미하는 잘 평준화된 데이터를 사용하여 기계를 가르치거나 훈련할 수 있는 학습 기술입니다. 그 후, 지도 학습 알고리즘이 훈련 정보를 분석하고 레이블이 지정된 데이터에서 정확한 결과를 제공하도록 머신이 새로운 레코드 세트로 지원됩니다.
데이터 마이닝과 머신 러닝의 비교를 살펴보겠습니다.
데이터 마이닝 | 머신 러닝 |
---|---|
데이터 마이닝(Knowledge Discovery in Data)은 비즈니스에 도움이 될 수 있는 통찰력을 얻기 위해 수백만 개의 레코드(특히 구조화된 데이터) 간의 이상, 상관 관계, 추세 또는 패턴을 식별하는 기술입니다. 의사 결정을 내리고 기존 분석에서는 놓쳤을 수 있습니다. | 머신 러닝은 대용량 데이터 처리를 위한 복잡한 알고리즘을 생성하고 사용자에게 결과를 제공하는 기술입니다. 경험을 통해 이해하고 예측할 수 있는 복잡한 프로그램을 사용합니다. |
데이터 마이닝의 주요 목표는 복잡한 수학적 알고리즘을 사용하여 이전에 무시되었거나 알려지지 않은 사실이나 정보를 찾는 것입니다. | 머신 러닝의 목표는 정보를 이해하고 인간이 이해하고 사용할 수 있는 데이터로부터 모델을 구축하는 것입니다. |
데이터 마이닝은 데이터베이스, 데이터웨어하우스 서버, 데이터 마이닝 엔진 및 패턴 평가 방법을 사용하여 유익한 데이터를 얻습니다. | 기계 학습은 신경망, 예측 모델 및 자동화된 알고리즘을 사용하여 결정을 내립니다. |
제한된 분야에서 사용할 수 있습니다. | 광범위한 영역에서 사용할 수 있습니다. |