Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python Pandas를 사용한 데이터 분석

<시간/>

이 튜토리얼에서는 Python pandas 라이브러리를 사용하여 데이터 분석을 볼 것입니다. 도서관 판다 C로 작성 . 따라서 속도에는 문제가 없습니다. 데이터 분석으로 유명합니다. 판다에는 두 가지 유형의 데이터 저장 구조가 있습니다. 시리즈입니다. 및 DataFrame . 하나씩 보시죠.

1.시리즈

시리즈는 맞춤형 인덱스와 값이 있는 1D 배열입니다. pandas.Series(data, index)를 사용하여 Series 객체를 생성할 수 있습니다. 수업. 시리즈는 정수, 목록, 사전을 데이터로 사용합니다. 몇 가지 예를 살펴보겠습니다.

예시

# pandas 라이브러리 가져오기import pandas as pd# datadata =[1, 2, 3]# Series 객체 생성# Series는 자동으로 기본 인덱스를 사용합니다.series =pd.Series(data)print(series)

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

0 11 22 3dtype:int64

사용자 정의 색인을 갖는 방법은 무엇입니까? 예를 참조하십시오.

예시

# pandas 라이브러리 가져오기import pandas as pd# datadata =[1, 2, 3]# indexindex =['a', 'b', 'c']# 시리즈 객체 생성 시리즈 =pd.Series(data, index) 인쇄(시리즈)

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

1b 2c 3dtype:int64

데이터를 시리즈에 사전으로 제공할 때 클래스에서 키를 인덱스로 사용하고 값을 실제 데이터로 사용합니다. 한 가지 예를 들어보겠습니다.

예시

# pandas libraryimport pandas as pd# datadata ={'a':97, 'b':98, 'c':99}# 시리즈 객체 생성 시리즈 =pd.Series(data)print(series) 

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

97b 98c 99dtype:int64

인덱스를 사용하여 Series의 데이터에 액세스할 수 있습니다. 예를 살펴보겠습니다.

예시

# pandas 라이브러리 가져오기import pandas as pd# datadata ={'a':97, 'b':98, 'c':99}# 시리즈 객체 생성 시리즈 =pd.Series(data)# indexesprint(series['a'], series['b'], series['c'])
를 사용하는 시리즈

출력

위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.

97 98 99

2.판다

판다에서 Series 클래스를 사용하는 방법이 있습니다. DataFrame을 사용하는 방법을 알아보겠습니다. 수업. 데이터프레임 행과 열을 포함하는 pandas의 데이터 구조 클래스입니다.

DataFrame을 만들 수 있습니다. 목록, 사전, 시리즈를 사용하는 개체 등등.. 리스트를 이용해서 DataFrame을 만들어 봅시다.

예시

# pandas libraryimport pandas를 pd로 가져오기# listnames =['Tutorialspoint', 'Mohit', 'Sharma']ages =[25, 32, 21]# Create a DataFramedata_frame =pd.DataFrame({'Name':names, 'Age':age})# DataFrameprint(data_frame) 인쇄

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

 이름 Age0 Tutorialspoint 251 Mohit 322 Sharma 21

Series를 사용하여 데이터 프레임 개체를 만드는 방법을 살펴보겠습니다.

예시

# pandas 라이브러리를 pd로 가져오기import pandas# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# DataFramedata_frame 생성 =pd.DataFrame({"a":_1, "b":_2, "c":_3})# DataFrameprint(data_frame) 인쇄

출력

위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.

 a b c0 1 1 11 2 4 82 3 9 27

DataFrames에서 데이터에 액세스할 수 있습니다. 열 이름을 사용합니다. 한 가지 예를 들어보겠습니다.

예시

# pandas 라이브러리를 pd로 가져오기import pandas# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# DataFramedata_frame 생성 =pd.DataFrame({"a":_1, "b":_2, "c":_3})# 'a'라는 이름의 전체 열에 액세스 print(data_frame['a' ])

출력

위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.

0 11 22 3이름:a, dtype:int64

결론

튜토리얼에서 의문점이 있으면 댓글 섹션에 언급하세요.