Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

인스턴스 기반 표현이란 무엇입니까?

<시간/>

학습의 가장 간단한 구조는 단순 암기 또는 암기 학습입니다. 훈련 인스턴스 그룹이 기억되었기 때문에 새로운 인스턴스를 만나면 새로운 인스턴스와 가장 강력하게 유사한 훈련 인스턴스에 대한 기억이 조사됩니다.

유일한 문제는 유사성을 명확히하는 방법입니다. 첫째, 이것은 인스턴스 그룹에서 추출한 "지식"을 설명하는 완전히 다른 방법입니다. - 인스턴스 자체를 저장하고 클래스가 알려진 현재 인스턴스에 클래스가 알려지지 않은 새 인스턴스를 연결하여 작동합니다. 규칙을 만들려고 하기보다 인스턴스 자체에서 직접 작업하십시오. 이를 인스턴스 기반 학습이라고 합니다.

인스턴스 기반 학습에서는 훈련 세트가 처리될 때가 아니라 새로운 인스턴스를 정의하는 시간이 나타날 때 모든 실제 작업이 완료됩니다. 이 접근 방식과 다른 접근 방식의 차이점은 "학습"이 발생하는 시간입니다.

인스턴스 기반 학습은 비활성화되어 실제 작업이 가능한 것으로 간주되는 반면 다른 방법은 데이터가 표시되는 즉시 일반화하기 위해 열심입니다. 인스턴스 기반 분류에서 각각의 새로운 인스턴스는 거리 측정법을 사용하여 현재 인스턴스와 구별되며 가장 가까운 기존 인스턴스를 사용하여 클래스를 새 인스턴스로 만듭니다. 이것을 최근접 이웃 분류 방법이라고 합니다.

때때로 둘 이상의 최근접이웃이 사용되며 가장 가까운 k 이웃의 대다수 클래스(또는 클래스가 숫자인 경우 거리 가중 평균)가 새 인스턴스에 생성됩니다. 이것은 k-최근접 이웃 방법으로 정의됩니다.

명목 속성이 최신인 경우 해당 속성의 여러 값 사이의 "거리"를 찾는 것이 필수적입니다. 다양한 속성은 다른 속성보다 중요하며 일반적으로 여러 유형의 속성 가중치에 의해 거리 측정법에 반영됩니다. 훈련 그룹에서 적절한 속성 가중치를 변경하는 것은 인스턴스 기반 학습에서 필수적인 문제입니다.

인스턴스 기반 표현의 명백한 한계는 학습된 명시적 아키텍처를 생성하지 않는다는 것입니다. 인스턴스는 거리 메트릭과 연결되어 한 클래스에서 다른 클래스를 분석하는 인스턴스 영역으로 경계를 나눕니다. 이것은 지식에 대한 명시적 설명 유형입니다.

예를 들어, 두 클래스 각각의 단일 인스턴스가 주어지면 가장 가까운 이웃 규칙은 인스턴스를 연결하는 선의 수직 이등분선을 따라 인스턴스 영역을 효율적으로 나눕니다. 모든 클래스의 여러 인스턴스가 주어지면 공간은 한 클래스의 인스턴스를 다른 클래스의 인스턴스에 연결하는 선택된 선의 수직 이등분선을 정의하는 일련의 선으로 분할됩니다.