Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python 정규식 명명된 그룹을 어떻게 사용합니까?

<시간/>

명명된 그룹

대부분의 최신 정규식 엔진은 번호가 매겨진 캡처 그룹과 번호가 매겨진 역참조를 지원합니다. 그룹과 역참조가 많은 긴 정규식은 읽고 이해하기 어려울 수 있습니다. 정규식 중간에 캡처 그룹을 추가하거나 제거하는 것보다 더 많은 것은 추가되거나 제거된 그룹 뒤에 오는 모든 그룹의 수를 방해합니다.

Python의 re 모듈은 명명된 캡처링 그룹과 명명된 역참조라는 솔루션을 처음으로 제시했습니다. (?Pgroup)은 그룹의 일치 항목을 역참조 "이름"으로 캡처합니다. 이름은 문자로 시작하는 영숫자 시퀀스여야 합니다. group은 모든 정규 표현식이 될 수 있습니다. 명명된 역참조(?P=name)를 사용하여 그룹의 내용을 참조할 수 있습니다. 물음표, P, 꺾쇠 괄호 및 등호는 모두 구문의 일부입니다. 명명된 역참조의 구문은 괄호를 사용하지만 캡처 또는 그룹화를 수행하지 않는 역참조일 뿐입니다. HTML 태그 예제는 <(?P[A-Z][A-Z0-9]*)\b[^>]*>.*?.