파이썬 프로그램을 실행할 때 데이터 분석을 위해 데이터셋을 사용해야 합니다. 파이썬에는 다양한 파일 형식의 외부 데이터를 파이썬 프로그램으로 가져오는 데 도움이 되는 다양한 모듈이 있습니다. 이 예에서는 다양한 형식의 데이터를 파이썬 프로그램으로 가져오는 방법을 볼 것입니다.
csv 파일 가져오기
csv 모듈을 사용하면 쉼표를 구분 기호로 사용하여 파일의 각 행을 읽을 수 있습니다. 먼저 파일을 읽기 전용 모드로 연 다음 구분 기호를 할당합니다. 마지막으로 for 루프를 사용하여 csv 파일에서 각 행을 읽습니다.
예
열린 csv("E:\\customers.csv",'r')를 custfile:rows=csv.reader(custfile,delimiter=',')for r in rows:print(r)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn']['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No' ]['5575-GNVDE', '남성', '1년', '아니요', '아니요']['3668-QPYBK', '남성', '월별', '예', '예 ']['7795-CFOCW', '남성', '1년', '아니요', '아니요']……….
판다와 함께
pandas 라이브러리는 실제로 csv 파일을 포함한 대부분의 파일 형식을 처리할 수 있습니다. 이 프로그램에서 pandas 라이브러리가 read_excel 모듈을 사용하여 Excel 파일을 처리하는 방법을 살펴보겠습니다. 아래 예에서는 위 파일의 Excel 버전을 읽고 파일을 읽을 때 동일한 결과를 얻습니다.
예
판다를 pddf =pd.ExcelFile("E:\\customers.xlsx")data=df.parse("customers")print(data.head(10))로 가져오기
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
customerID 성별 계약 PaperlessBilling Churn0 7590-VHVEG 여성 월간 예 아니요1 5575-GNVDE 남성 1년 아니요 아니요2 3668-QPYBK 남성 월간 예 예3 7795-CFOCW 남성 1년 아니요 아니요4 9237-HQITU 여성 월간 예 예5 9305-CDSKC 여성 월간 예 예6 1452-KIOVK 남성 월간 예 아니요7 6713-OKOMC 여성 월간 아니오 아니요8 7892-POOKP 여성 월간 예 Yes9 6388-TABGU 남성 1년 아니요 아니요
pyodbc 사용
pyodbc라는 모듈을 사용하여 데이터베이스 서버에 연결할 수도 있습니다. 이렇게 하면 SQL 쿼리를 사용하여 관계형 소스에서 데이터를 가져오는 데 도움이 됩니다. 물론 쿼리를 전달하기 전에 db에 대한 연결 세부 정보도 정의해야 합니다.
예
가져오기 pyodbcsql_conn =pyodbc.connect("드라이버={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;")data_sql =pd.read_sql_query(SQL QUERY', sql_conn)data_sql. 머리()
출력
SQL 쿼리에 따라 결과가 표시됩니다.