문자열에서 모든 특수 문자, 구두점 및 공백을 제거하려면 문자열을 반복하고 영숫자가 아닌 모든 문자를 필터링합니다. 예:
>>> string = "Hello $#! People Whitespace 7331" >>> ''.join(e for e in string if e.isalnum()) 'HelloPeopleWhitespace7331'
정규식을 사용하여 영숫자가 아닌 문자를 제거할 수도 있습니다. re.sub(regex, string_to_replace_with, original_string)은 영숫자가 아닌 모든 문자를 빈 문자열로 대체합니다. 예를 들어,
>>> import re >>> re.sub('[^A-Za-z0-9]+', '', "Hello $#! People Whitespace 7331") 'HelloPeopleWhitespace7331'