Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python에서 정규식 그룹화는 어떻게 작동합니까?

<시간/>

그룹화

정규 표현식의 일부를 괄호로 묶어 그룹화합니다. 이것이 우리가 단일 문자 대신 전체 그룹에 연산자를 적용하는 방법입니다.

그룹 캡처

괄호는 하위 표현식을 그룹화할 뿐만 아니라 역참조도 생성합니다. 정규식의 그룹화된 부분과 일치하는 문자열 부분은 역참조에 저장됩니다. 역참조의 도움으로 정규 표현식의 일부를 재사용합니다.

실제 응용 프로그램에서는 두 개 이상의 대안 중 하나와 일치할 수 있는 정규식이 필요한 경우가 많습니다. 또한 때때로 수량자가 여러 표현식에 적용되기를 원합니다. 이 모든 것은 괄호로 묶음으로써 달성할 수 있습니다. 그리고 세로 막대(|)와 교대로 사용합니다.

대체는 여러 다른 대안 중 하나를 일치시키려는 경우에 유용합니다. 예를 들어, regex 항공기|비행기|제트는 항공기, 비행기 또는 제트기를 포함하는 모든 텍스트와 일치합니다. 정규식 공기(비행기)를 사용하여 동일한 목적을 달성할 수 있습니다.

예시

import re
s = 'Tahiti $% Tahiti *&^ 34 Atoll'
result = re.findall(r'(\w+)', s)
print result

출력

이것은 출력을 제공합니다.

['Tahiti', 'Tahiti', '34', 'Atoll']