Naive Bayes 분류기의 특징은 무엇입니까?

<시간/>

베이지안 분류기는 통계적 분류기입니다. 주어진 샘플이 특정 클래스에 적용될 확률과 같은 클래스 멤버십 확률을 예측할 수 있습니다. 베이지안 분류기는 높은 데이터베이스를 가질 수 있을 때 큰 효율성과 속도를 보여주었습니다.

클래스가 정의되어 있기 때문에 시스템은 분류를 감독하는 규칙을 추론해야 하므로 시스템은 각 클래스에 대한 설명을 검색할 수 있어야 합니다. 설명은 훈련 세트의 예측 속성을 정의하여 부정적인 인스턴스가 아닌 긍정적인 인스턴스만 설명을 충족해야 합니다. 설명에 모든 긍정적인 예가 포함되고 클래스의 부정적인 예가 하나도 포함되지 않는 경우 규칙이 올바른 것으로 간주됩니다.

모든 속성에 의한 기여는 독립적이고 각각은 분류 문제, Naïve Bayes 분류라는 간단한 분류 체계에 동등하게 기여한다고 가정합니다.

나이브 베이즈 분류는 클래스 조건부 독립성을 가정하기 때문에 나이브라고 합니다. 주어진 클래스에 대한 속성 값의 구현은 여러 속성의 값과 별개입니다. 이 가정은 계산 비용을 줄이기 위한 것이므로 순진한 것으로 간주됩니다.

관찰 가능한 변수가 주어진 훈련 기록에서 네트워크 토폴로지를 이해하기 위한 여러 알고리즘이 있습니다. 문제는 이산 최적화입니다. 인간 전문가는 일반적으로 네트워크 설계를 지원하는 분석 중인 도메인에 영향을 미치는 직접적인 조건부 종속성을 잘 파악하고 있습니다. 전문가는 직접 종속성에서 수행하는 노드에 대한 조건부 확률을 정의해야 합니다.

이러한 확률은 나머지 확률 값을 평가하는 데 사용할 수 있습니다. 네트워크 토폴로지가 인식되고 변수를 관찰할 수 있는 경우 네트워크 교육이 간단합니다. 여기에는 순진한 베이지안 분류에 포함된 확률을 평가할 때 유사하게 완료되는 CPT 항목 계산이 포함됩니다.

Naive Bayes Classifiers에는 다음과 같은 다양한 특성이 있습니다. -

데이터에서 조건부 확률을 추정할 때 이러한 포인트가 평균화되기 때문에 절연된 노이즈 포인트에 대해 강력합니다. 또한 모델 구성 및 분류 시 인스턴스를 삭제하여 누락된 값을 관리할 수 있습니다.

관련 없는 속성에 대해 강력합니다. X_i인 경우 부적절한 속성이므로 P(X_i |Y) 일관되게 배포됩니다. X_i에 대한 클래스 조건부 확률 사후 확률의 완전한 계산에 영향을 미치지 않습니다.

상관 속성은 조건부 독립 가정이 더 이상 그러한 속성에 적용되지 않기 때문에 나이브 베이즈 분류기의 성능을 저하시킬 수 있습니다. 예를 들어, 다음 확률을 고려하십시오 -

P(A=0|Y=0) =0.4, P(A=1 | Y=0) =0.6,

P(A=0|Y =1) =0.6, P(A=1 | Y =1) =0.4,

여기서 A는 이진 속성이고 Y는 이진 클래스 변수입니다. Y =0일 때 A와 완벽하게 상관되지만 Y =1일 때 A와 독립적인 다른 이진 속성 B가 있다고 가정합니다. 무결성을 위해 B에 대한 클래스 조건부 확률이 A와 동일하다고 생각하십시오.