Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python에서 기존 데이터 프레임에 새 열을 어떻게 추가할 수 있습니까?

<시간/>

Dataframe은 데이터가 행과 열의 형태로 표 형식으로 저장되는 2차원 데이터 구조입니다.

SQL 데이터 테이블 또는 Excel 시트 표현으로 시각화할 수 있습니다. 다음 생성자를 사용하여 생성할 수 있습니다. -

pd.Dataframe(data, index, columns, dtype, copy)

다른 방법으로 데이터 프레임에 새 열을 추가할 수 있습니다.

먼저 계열 데이터 구조를 만들고 이를 기존 데이터 프레임에 추가 열로 전달하여 새 열을 만드는 방법 중 하나를 살펴보겠습니다.

코드가 실행되는 것을 봅시다 -

예시

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
print ("Adding a new column to the dataframe by passing it as a Series structure :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("After adding a new column to the dataframe, :")
print(my_df)

출력

The dataframe is :
   ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
Adding a new column to the dataframe by passing it as a Series structure :
After adding a new column to the dataframe, :
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN

설명

  • 필요한 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.

  • 하나의 사전에 키-값 쌍이 존재하는 사전 데이터 구조가 생성됩니다.

  • 이러한 방식으로 여러 사전이 생성되어 목록에 저장됩니다.

  • 키 값 쌍의 '값'은 실제로 시리즈 데이터 구조입니다.

  • 색인은 또한 사용자 정의된 값 목록입니다.

  • 이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.

  • 데이터 프레임은 사전 값 목록을 매개변수로 전달하여 생성됩니다.

  • 다른 새 열이 생성되고 값이 초기화됩니다.

  • 이 새 열은 원래 데이터 프레임에 대한 색인이 생성됩니다.

  • 이렇게 하면 새 열이 데이터 프레임에 바인딩됩니다.

  • 데이터 프레임이 콘솔에 인쇄됩니다.

참고 − 'NaN'은 'Not a Number'를 의미하며, 이는 특정 [row,col] 값에 유효한 항목이 없음을 의미합니다.