이 튜토리얼에서는 Python pandas 라이브러리를 사용하여 데이터 분석을 볼 것입니다. 도서관 판다 C로 작성 . 따라서 속도에는 문제가 없습니다. 데이터 분석으로 유명합니다. 판다에는 두 가지 유형의 데이터 저장 구조가 있습니다. 시리즈입니다. 및 DataFrame . 하나씩 보시죠.
1.시리즈
시리즈는 맞춤형 인덱스와 값이 있는 1D 배열입니다. pandas.Series(data, index)를 사용하여 Series 객체를 생성할 수 있습니다. 수업. 시리즈는 정수, 목록, 사전을 데이터로 사용합니다. 몇 가지 예를 살펴보겠습니다.
예시
# pandas 라이브러리 가져오기import pandas as pd# datadata =[1, 2, 3]# Series 객체 생성# Series는 자동으로 기본 인덱스를 사용합니다.series =pd.Series(data)print(series)
출력
위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.
0 11 22 3dtype:int64
사용자 정의 색인을 갖는 방법은 무엇입니까? 예를 참조하십시오.
예시
# pandas 라이브러리 가져오기import pandas as pd# datadata =[1, 2, 3]# indexindex =['a', 'b', 'c']# 시리즈 객체 생성 시리즈 =pd.Series(data, index) 인쇄(시리즈)
출력
위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.
1b 2c 3dtype:int64
데이터를 시리즈에 사전으로 제공할 때 클래스에서 키를 인덱스로 사용하고 값을 실제 데이터로 사용합니다. 한 가지 예를 들어보겠습니다.
예시
# pandas libraryimport pandas as pd# datadata ={'a':97, 'b':98, 'c':99}# 시리즈 객체 생성 시리즈 =pd.Series(data)print(series)사전>출력
위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.
97b 98c 99dtype:int64인덱스를 사용하여 Series의 데이터에 액세스할 수 있습니다. 예를 살펴보겠습니다.
예시
# pandas 라이브러리 가져오기import pandas as pd# datadata ={'a':97, 'b':98, 'c':99}# 시리즈 객체 생성 시리즈 =pd.Series(data)# indexesprint(series['a'], series['b'], series['c'])를 사용하는 시리즈출력
위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.
97 98 992.판다
판다에서 Series 클래스를 사용하는 방법이 있습니다. DataFrame을 사용하는 방법을 알아보겠습니다. 수업. 데이터프레임 행과 열을 포함하는 pandas의 데이터 구조 클래스입니다.
DataFrame을 만들 수 있습니다. 목록, 사전, 시리즈를 사용하는 개체 등등.. 리스트를 이용해서 DataFrame을 만들어 봅시다.
예시
# pandas libraryimport pandas를 pd로 가져오기# listnames =['Tutorialspoint', 'Mohit', 'Sharma']ages =[25, 32, 21]# Create a DataFramedata_frame =pd.DataFrame({'Name':names, 'Age':age})# DataFrameprint(data_frame) 인쇄출력
위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.
이름 Age0 Tutorialspoint 251 Mohit 322 Sharma 21Series를 사용하여 데이터 프레임 개체를 만드는 방법을 살펴보겠습니다.
예시
# pandas 라이브러리를 pd로 가져오기import pandas# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# DataFramedata_frame 생성 =pd.DataFrame({"a":_1, "b":_2, "c":_3})# DataFrameprint(data_frame) 인쇄출력
위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.
a b c0 1 1 11 2 4 82 3 9 27DataFrames에서 데이터에 액세스할 수 있습니다. 열 이름을 사용합니다. 한 가지 예를 들어보겠습니다.
예시
# pandas 라이브러리를 pd로 가져오기import pandas# Series_1 =pd.Series([1, 2, 3])_2 =pd.Series([1, 4, 9])_3 =pd.Series([1, 8 , 27])# DataFramedata_frame 생성 =pd.DataFrame({"a":_1, "b":_2, "c":_3})# 'a'라는 이름의 전체 열에 액세스 print(data_frame['a' ])출력
위의 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.
0 11 22 3이름:a, dtype:int64결론
튜토리얼에서 의문점이 있으면 댓글 섹션에 언급하세요.