Dataframe은 데이터가 행과 열의 형태로 표 형식으로 저장되는 2차원 데이터 구조입니다. SQL 데이터 테이블이나 엑셀 시트 표현으로 시각화할 수 있습니다.
다음 생성자를 사용하여 생성할 수 있습니다. -
pd.Dataframe(data, index, columns, dtype, copy)
이전에 Series 데이터 구조로 새 열을 생성하는 방법을 보았습니다. 이것은 원래 데이터 프레임에 인덱싱되어 데이터 프레임에 추가되었습니다.
데이터 프레임의 이미 존재하는 열을 사용하여 열을 만드는 방법을 사용하겠습니다. 이것은 이미 존재하는 열에 대해 약간의 계산을 수행하고 그 결과를 새 열에 저장해야 할 때 유용합니다 -
예시
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' :pd.Series([56, 78, 32],index=['a','b','c'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) my_df['gh'] = my_df['ab'] + my_df['ef'] print("After adding column 0 and 2 to the dataframe, :") print(my_df)
출력
The dataframe is : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN After adding column 0 and 2 to the dataframe, : ab cd ef gh a 1.0 1 56.0 57.0 b 8.0 2 78.0 86.0 c 7.0 0 32.0 39.0 d NaN 9 NaN NaN
설명
-
필요한 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.
-
키와 값으로 구성된 사전 값이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.
-
이러한 사전 값이 여러 개 생성됩니다.
-
이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.
-
데이터 프레임은 사전을 매개변수로 전달하여 생성됩니다.
-
데이터 프레임에 새 열이 인덱싱되고 이 새 열을 만들기 위해 0번째 및 2번째 열이 추가됩니다.
-
데이터 프레임이 콘솔에 인쇄됩니다.
참고 − 'NaN'은 'Not a Number'를 의미하며, 이는 특정 [row,col] 값에 유효한 항목이 없음을 의미합니다.