Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

파이썬의 상관관계와 회귀

<시간/>

상관 관계는 두 데이터 세트 간의 종속성을 포함하는 일부 통계적 관계를 나타냅니다. 선형 회귀는 종속 변수와 하나 이상의 독립 변수 간의 관계를 설정하는 선형 접근 방식입니다. 단일 독립 변수를 선형 회귀라고 하고 여러 독립 변수를 다중 회귀라고 합니다.

상관관계

종속 현상의 간단한 예로는 부모와 자식의 신체적 외모 사이의 상관 관계, 제품 가격과 공급 수량 간의 상관 관계가 있습니다. 우리는 seaborn python 라이브러리에서 사용할 수 있는 홍채 데이터 세트의 예를 들겠습니다. 그것에서 우리는 세 종의 창포 꽃의 꽃받침과 꽃잎의 길이와 너비 사이의 상관 관계를 설정하려고 시도합니다. 발견된 상관 관계를 기반으로 한 종을 다른 종과 쉽게 구별할 수 있는 강력한 모델을 만들 수 있습니다.

예시

import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

파이썬의 상관관계와 회귀

선형 회귀

수학적으로 선형 관계는 그래프로 그릴 때 직선을 나타냅니다. 변수의 지수가 1이 아닌 비선형 관계는 곡선을 생성합니다. 선형 회귀 관계를 찾는 Seaborn의 기능은 regplot입니다. 아래 예는 그 사용법을 보여줍니다.

예시

import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.regplot(x = "total_bill", y = "tip", data = df)
plt.show()

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

파이썬의 상관관계와 회귀