능동 학습은 데이터가 충분하지만 클래스 레이블이 부족하거나 획득하는 데 비용이 많이 드는 상황과 관련된 반복적인 유형의 지도 학습입니다. 학습 알고리즘은 레이블에 대해 사용자(예:개인 신탁)를 주의 깊게 쿼리할 수 있다는 점에서 활성입니다. 개념을 이해하는 데 사용되는 여러 튜플 이 방법은 일반적인 지도 학습에 필요한 수보다 작습니다.
비용을 낮추는 데 사용되며 가능한 한 적은 수의 레이블이 지정된 예제를 사용하여 높은 정확도를 달성하는 능동적 학습자 목표입니다. D를 고려 중인 모든 데이터라고 하자. D에 대한 적극적인 학습을 위한 몇 가지 방법이 계속됩니다.
D의 작은 부분집합에 클래스 레이블이 지정되어 있다고 가정합니다. 이 집합은 L로 표시됩니다. U는 D에서 레이블이 지정되지 않은 데이터 집합입니다. 레이블이 지정되지 않은 데이터 풀로도 정의됩니다. 활성 학습자는 L을 원래 훈련 세트로 시작합니다. 쿼리 서비스를 사용하여 U에서 하나 이상의 데이터 샘플을 신중하게 선택하고 오라클(예:개인 주석자)에 레이블을 요청할 수 있습니다.
새로 레이블이 지정된 샘플은 표준 지도 방법에서 학습자가 필요로 하는 L에 삽입됩니다. 프로세스가 계속됩니다. 능동적인 학습 목표는 가능한 적은 수의 레이블이 지정된 튜플을 사용하여 높은 정확도를 구현하는 것입니다. 활성 학습 알고리즘은 일반적으로 쿼리된 여러 인스턴스의 함수로 정확도를 표시하는 학습 곡선을 사용하여 계산됩니다.
일부 적극적인 학습 연구는 쿼리할 데이터 튜플을 선택하는 방법을 목표로 합니다. 다양한 프레임워크가 제안되었습니다. 활성 학습자가 레이블 지정 방법이 가장 덜 구체적인 튜플을 쿼리하도록 선택하는 불확실성 샘플링이 일반적입니다.
버전 공간, 즉 관찰된 훈련 튜플에 의존할 수 있는 모든 가설의 하위 집합을 줄이기 위해 작동하는 몇 가지 방법이 있습니다. 예상 오류 감소를 계산하는 의사결정 이론적인 방법을 따를 수 있습니다.
이것은 U에 대한 예상 엔트로피를 줄이는 것을 포함하여 잘못된 예측의 총 수에서 가장 큰 감소를 초래할 수 있는 튜플을 선택합니다. 이 방법은 더 높은 계산에 영향을 줍니다.
전이 학습의 목표는 하나 이상의 소스 기능에서 지식을 도출하고 지식을 대상 작업에 사용하는 것입니다. 기존 학습 접근 방식은 사용 가능한 클래스 레이블 교육 및 테스트 정보에 따라 각각의 새로운 분류 작업에 대해 새로운 분류기를 구성합니다.
전이 학습 알고리즘은 새로운(대상) 작업에 대한 분류기를 구성할 때 소스 서비스에 대한 지식을 적용합니다. 결과 분류기의 개발에는 더 적은 훈련 데이터와 더 적은 훈련 시간이 필요했습니다. 기존 학습 알고리즘은 훈련 데이터와 테스트 데이터가 동일한 분포와 동일한 기능 영역에서 가져온 것으로 간주합니다. 따라서 분포가 변경되면 모델을 처음부터 다시 작성하는 데 이러한 기술이 필요합니다.