Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python Pandas – DataFrame 열의 문자열에서 숫자 제거

<시간/>

문자열에서 숫자를 제거하려면 replace() 메서드를 사용하고 간단히 바꿀 수 있습니다. 먼저 require 라이브러리를 가져오자 -

import pandas as pd

학생 기록으로 DataFrame을 만듭니다. Id 열에 숫자가 포함된 문자열이 있습니다. -

dataFrame = pd.DataFrame(
   {
      "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

특정 열의 문자열에서 숫자 제거, 즉 "Id" 여기 −

dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')

다음은 코드입니다 -

import pandas as pd

# Create DataFrame with student records
dataFrame = pd.DataFrame(
   {
      "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# removing number from strings of a specific column
dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')

print"\nUpdated DataFrame...\n", dataFrame

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame ...
     Id      Name   Result
0   S01      Jack     Pass
1   S02     Robin     Fail
2   S03       Ted     Pass
3   S04     Robin     Fail
4   S05  Scarlett     Pass
5   S06       Kat     Pass
6   S07       Ted     Pass

Updated DataFrame...
   Id      Name   Result
0   S      Jack     Pass
1   S     Robin     Fail
2   S       Ted     Pass
3   S     Robin     Fail
4   S  Scarlett     Pass
5   S       Kat     Pass
6   S       Ted     Pass