Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python에서 Series 사전을 사용하여 데이터 프레임을 어떻게 생성할 수 있습니까?

<시간/>

Dataframe은 데이터가 행과 열의 형태로 표 형식으로 저장되는 2차원 데이터 구조입니다.

SQL 데이터 테이블 또는 Excel 시트 표현으로 시각화할 수 있습니다. 다음 생성자를 사용하여 생성할 수 있습니다. -

pd.Dataframe(data, index, columns, dtype, copy)

Series 사전을 사용하여 데이터 프레임을 생성하는 방법을 이해합시다.

  • Series는 'Pandas' 라이브러리에 있는 1차원 데이터 구조입니다.

  • 축 레이블을 총칭하여 인덱스라고 합니다.

  • 시리즈 구조는 정수, 부동 소수점, 문자열, 파이썬 개체 등과 같은 모든 유형의 데이터를 저장할 수 있습니다.

예를 들어 보겠습니다 -

예시

import pandas as pd
my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe created from dictionary of series : ")
print(my_df)

출력

The dataframe created from dictionary f series :
   ab   mn
a  1.0  56
b  2.0  78
c  3.0  13
d  NaN  13

설명

  • 필요한 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.

  • 키와 값으로 구성된 사전 값이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.

  • 이 시리즈 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.

  • 데이터 프레임은 시리즈 사전을 매개변수로 전달하여 생성됩니다.

  • 데이터 프레임이 콘솔에 인쇄됩니다.

참고 − 'NaN'은 'Not a Number'를 의미하며, 이는 특정 [row,col] 값에 유효한 항목이 없음을 의미합니다.