Inverted Index 및 Forward Index는 문서 또는 문서 세트에서 텍스트를 검색하는 데 사용되는 데이터 구조입니다.
역 인덱스
Inverted Index는 단어를 색인으로 저장하고 문서 이름을 매핑된 참조로 저장합니다.
포워드 인덱스
Forward Index는 문서 이름을 인덱스로, 단어를 매핑된 참조로 저장합니다.
다음은 역지수와 순지수의 중요한 차이점입니다.
Sr. 아니요. | 키 | 역 인덱스 | 앞으로 색인 |
---|---|---|---|
1 | 매핑 패턴 | 역 색인은 단어를 색인으로 저장하고 문서 이름을 매핑된 참조로 저장합니다. | 앞으로 색인은 문서 이름을 색인으로, 단어를 매핑된 참조로 저장합니다. |
2 | 색인 작성 프로세스 |
|
|
3 | 인덱싱 | 역색인은 색인을 준비하기 전에 각 단어를 확인해야 하므로 색인이 느립니다. | 정방향 인덱스에서는 키워드를 찾았을 때 추가하기 때문에 인덱싱이 빠릅니다. |
4 | 검색 중 | 역색인에서는 검색이 상당히 빠릅니다. | 정방향 인덱스에서 검색이 느립니다. |
5 | 예 | Word Documents ------------------------- Welcome doc1 Hello doc1, doc3 Hi doc2 ------------------------- | Word Documents ------------------------- doc1 Welcome, Hello doc2 Hi doc3 Hello ------------------------- |
6 | 중복성 | Inverted 인덱스에서는 인덱스에 중복 키워드가 저장되지 않습니다. | 정방향 인덱스에서 'Hello'와 같은 인덱스에 중복 키워드가 존재할 수 있습니다. |
7 | 실제 예시 | 색인 끝에 있는 용어집, 역방향 조회 | 책 시작 부분의 목차, DNS 조회 |