Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python의 문자열에서 모든 특수 문자, 구두점 및 공백을 제거하는 방법은 무엇입니까?

<시간/>

문자열에서 모든 특수 문자, 구두점 및 공백을 제거하려면 문자열을 반복하고 영숫자가 아닌 모든 문자를 필터링합니다. 예:

>>> string = "Hello $#! People   Whitespace 7331"
>>> ''.join(e for e in string if e.isalnum())
'HelloPeopleWhitespace7331'

정규식을 사용하여 영숫자가 아닌 문자를 제거할 수도 있습니다. re.sub(regex, string_to_replace_with, original_string)은 영숫자가 아닌 모든 문자를 빈 문자열로 대체합니다. 예를 들어,

>>> import re
>>> re.sub('[^A-Za-z0-9]+', '', "Hello $#! People   Whitespace 7331")
'HelloPeopleWhitespace7331'