Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

인버티드 인덱스와 포워드 인덱스의 차이점


Inverted Index 및 Forward Index는 문서 또는 문서 세트에서 텍스트를 검색하는 데 사용되는 데이터 구조입니다.

역 인덱스

Inverted Index는 단어를 색인으로 저장하고 문서 이름을 매핑된 참조로 저장합니다.

포워드 인덱스

Forward Index는 문서 이름을 인덱스로, 단어를 매핑된 참조로 저장합니다.

다음은 역지수와 순지수의 중요한 차이점입니다.

Sr. 아니요. 역 인덱스 앞으로 색인
1 매핑 패턴 역 색인은 단어를 색인으로 저장하고 문서 이름을 매핑된 참조로 저장합니다. 앞으로 색인은 문서 이름을 색인으로, 단어를 매핑된 참조로 저장합니다.
2 색인 작성 프로세스
  • 문서를 스캔하고 고유한 단어 목록을 준비합니다.

  • 모든 고유 단어의 색인 목록을 준비하고 문서 검색에 매핑합니다.

  • 모든 문서에 대해 위의 단계를 반복합니다.

  • 문서를 스캔하고 고유한 단어 목록을 준비합니다.

  • 모든 단어를 색인으로 문서화하십시오.

  • 모든 문서에 대해 위의 단계를 반복합니다.

3 인덱싱 역색인은 색인을 준비하기 전에 각 단어를 확인해야 하므로 색인이 느립니다. 정방향 인덱스에서는 키워드를 찾았을 때 추가하기 때문에 인덱싱이 빠릅니다.
4 검색 중 역색인에서는 검색이 상당히 빠릅니다. 정방향 인덱스에서 검색이 느립니다.
5
Word Documents
-------------------------
Welcome doc1
Hello doc1, doc3
Hi doc2
-------------------------
Word Documents
-------------------------
doc1 Welcome, Hello
doc2 Hi
doc3 Hello
-------------------------
6 중복성 Inverted 인덱스에서는 인덱스에 중복 키워드가 저장되지 않습니다. 정방향 인덱스에서 'Hello'와 같은 인덱스에 중복 키워드가 존재할 수 있습니다.
7 실제 예시 색인 끝에 있는 용어집, 역방향 조회 책 시작 부분의 목차, DNS 조회