텍스트에서 숫자만 추출하는 것은 파이썬 데이터 분석에서 매우 일반적인 요구 사항입니다. 파이썬 정규식 라이브러리를 사용하여 쉽게 수행할 수 있습니다. 이 라이브러리는 부분 문자열로 추출할 수 있는 숫자의 패턴을 정의하는 데 도움이 됩니다.
예시
아래 예제에서는 re 모듈의 findall() 함수를 사용합니다. 이 함수의 매개변수는 추출하려는 패턴과 추출하려는 문자열입니다. 아래 예에서는 소수점이나 음수 부호가 아닌 숫자만 얻습니다.
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list = re.findall(r'\d+', str) print(num_list)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '8', '4', '112']
소수점 및 기호 캡처
소수점과 음수 또는 양수 기호도 검색 결과에 포함하도록 검색 패턴을 확장할 수 있습니다.
예시
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list=re.findall(r'[-+]?[.]?[\d]+',str) print(num_list)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '.8', '-4', '.112']