Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python에서 데이터의 비선형 추세를 이해하기 위해 다항식 회귀 모델을 어떻게 맞출 수 있습니까?

<시간/>

회귀 모델을 구축할 때 다중 공선성이 확인됩니다. 이는 연속 변수의 모든 다른 조합 사이에 존재하는 상관 관계를 이해해야 하기 때문입니다. 변수 사이에 다중공선성이 존재하는 경우 데이터에서 제거되었는지 확인해야 합니다.

현실 세계의 데이터는 일반적으로 비선형입니다. 이러한 비선형 데이터를 모델에 맞추는 메커니즘을 찾아야 합니다. 이 데이터를 시각화하기 위해 Anscombe의 데이터세트를 사용할 것입니다.

'impllot' 기능은 비선형 데이터와 함께 사용됩니다. −

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('anscombe')
sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3)
plt.show()

출력

Python에서 데이터의 비선형 추세를 이해하기 위해 다항식 회귀 모델을 어떻게 맞출 수 있습니까?

설명

  • 필수 패키지를 가져옵니다.
  • 입력 데이터는 seaborn 라이브러리에서 로드된 'anscombe'입니다.
  • 이 데이터는 데이터 프레임에 저장됩니다.
  • 'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
  • 이 데이터는 'impllot' 기능을 사용하여 시각화됩니다.
  • 여기서 데이터 프레임은 매개변수로 제공됩니다.
  • 또한 x값, y값, 차수가 지정됩니다.
  • 이 데이터는 콘솔에 표시됩니다.