Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Pandas DataFrame의 두 숫자 열 간의 상관 관계

<시간/>

pandas.DataFrame.corr을 사용할 수 있습니다. NULL 값을 제외한 열의 쌍별 상관 관계를 계산합니다. 상관 계수는 두 변수 간의 선형 연관성의 강도를 나타냅니다. 계수 범위는 -1과 1 사이입니다.

Pandas 데이터 프레임에서 두 숫자 열 간의 상관 관계를 얻으려면 다음 단계를 수행할 수 있습니다.

  • 그림 크기를 설정하고 서브플롯 사이 및 주변 여백을 조정합니다.
  • 크기가 변경 가능한 2차원 테이블 형식 데이터의 Pandas 데이터 프레임을 생성합니다.
  • 두 열의 값을 비교하고 col1.corr(col2)을 사용하여 상관 계수를 계산합니다.
  • 콘솔에 상관 계수를 인쇄합니다.
  • 그림을 표시하려면 show()를 사용하세요. 방법.

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

출력

다음 출력을 생성합니다.

The correlation coefficient is: 1.0

Pandas DataFrame의 두 숫자 열 간의 상관 관계 Pandas DataFrame의 두 숫자 열 간의 상관 관계

여기서 상관계수는 완전한 상관관계를 나타내는 1.0이다. 따라서 모든 점이 직선을 따라 있기 때문에 직선을 얻습니다.