공동 필터링이란 무엇입니까?

<시간/>

협업 필터링은 개인화된 추천을 지원하는 애플리케이션에 특히 적합한 메모리 기반 추론과 다릅니다. 협업 필터링 시스템은 개인 선호도의 이력으로 시작됩니다. 거리 함수는 같은 것을 좋아하는 사람들이 가깝다는 선호도의 중첩에 따라 유사도를 결정합니다.

또한 투표는 거리에 따라 가중치가 부여되므로 가까운 이웃의 투표가 지지에 더 많이 반영됩니다. 다시 말해서, 같은 취향으로 선택한 또래 집단의 판단을 이용하여 특정인의 현재 취향에 맞는 음악, 책, 와인 또는 다른 사람을 발견하는 접근 방식입니다. 이 방법을 소셜 정보 필터링이라고 합니다.

협업 필터링은 입소문을 활용하여 사용자가 무언가를 좋아할 수 있는지 여부를 결정하는 절차를 자동화합니다. 여러 사람이 무언가를 좋아한다는 사실은 충분하지 않습니다. 모든 사람은 일부 권장 사항을 다른 권장 사항보다 더 중요하게 생각합니다. 이전에 추천이 잘 맞았던 친한 친구의 추천은 일반적으로 싫어할 수 있는 장르의 영화라도 새로운 영화를 보러 가도록 하기에 충분할 수 있습니다.

자동화된 협업 필터링 시스템을 사용하여 신규 사용자를 위한 권장 사항을 준비하는 데는 다음과 같은 세 단계가 있습니다. -

영화, 노래 또는 레스토랑을 포함한 항목의 선택을 평가하기 위해 새로운 고객을 수신하여 사용자 프로필을 구성할 수 있습니다.
일부 유사성 측정을 사용하여 새 사용자 프로필을 다른 사용자의 프로필과 비교할 수 있습니다.
새로운 사용자가 아직 평가하지 않은 항목에 제공할 수 있는 평가를 예측하기 위해 동일한 프로필을 가진 사용자의 평가 조합을 사용할 수 있습니다.

협업 필터링의 한 가지 문제는 누군가가 달성했거나 평가할 의향이 있는 것보다 훨씬 더 많은 항목을 평가할 수 있다는 것입니다. 즉, 프로필은 일반적으로 희소하여 추천 생성에 대한 사용자의 선호도가 거의 겹치지 않음을 정의합니다. 고객 프로필을 평가할 요소의 세계에서 항목당 하나의 구성 요소가 있는 벡터로 생각하십시오. 벡터의 각 요소는 해당 요소에 대한 프로필 소유자의 등급을 -5에서 5 사이의 척도로 정의하며 0은 중립성을 나타내고 비어 있는 값은 의견이 없습니다.

벡터에 수천 개의 구성 요소가 있고 각 사용자가 평가할 구성 요소를 결정하면 두 사용자의 프로필이 겹치게 될 가능성이 높습니다. 다시 말해서, 사용자에게 특정 하위 집합을 평가하도록 강요하면 더 모호한 요소의 평가가 일반적인 요소의 평가보다 사용자에 대해 더 많은 것을 말할 수 있기 때문에 흥미로운 데이터를 놓칠 수 있습니다.