Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - Pandas DataFrame에서 열의 분산 계산

<시간/>

열 값의 분산을 계산하려면 var() 메서드를 사용합니다. 먼저 필요한 Pandas 라이브러리를 가져옵니다. -

import pandas as pd

두 개의 열이 있는 DataFrame 만들기 -

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

var() 함수를 사용하여 "단위" 열 값의 분산 찾기 -

print"Variance of Units column from DataFrame1 = ",dataFrame1['Units'].var()
의 단위 열의 분산

같은 방식으로 2 nd 에서 Variance를 계산했습니다. 데이터프레임.

예시

다음은 전체 코드입니다 -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Finding Variance of "Units" column values
print"Variance of Units column from DataFrame1 = ",dataFrame1['Units'].var()

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Product": ['TV', 'PenDrive', 'HeadPhone', 'EarPhone', 'HDD', 'SSD'],
      "Price": [8000, 500, 3000, 1500, 3000, 4000]
   }
)

print"\nDataFrame2 ...\n",dataFrame2

# Finding Variance of "Price" column values
print"Variance of Price column from DataFrame2 = ",dataFrame2['Price'].var()

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame1 ...
       Car   Units
0      BMW    100
1    Lexus    150
2     Audi    110
3    Tesla     80
4  Bentley    110
5   Jaguar     90
Variance of Units column from DataFrame1 = 586.666666667

DataFrame2 ...
    Price   Product
0   8000    TV
1   500     PenDrive
2   3000    HeadPhone
3   1500    EarPhone
4   3000    HDD
5   4000    SSD
Variance of Price column from DataFrame2 = 6766666.66667