데이터 시각화에 도움이 되는 Seaborn 라이브러리를 사용할 것입니다. 회귀 모델을 구축할 때 다중 공선성을 확인합니다. 이는 연속 변수의 모든 다른 조합 사이에 존재하는 상관 관계를 이해해야 하기 때문입니다. 변수 사이에 다중 공선성이 존재하는 경우 데이터에서 제거되었는지 확인해야 합니다. 현실 세계의 데이터는 일반적으로 비선형입니다.
이러한 비선형 데이터를 모델에 맞추는 메커니즘을 찾아야 합니다. 이 데이터를 시각화하기 위해 Anscombe의 데이터 세트를 사용할 것입니다. 이 비선형 데이터에는 'implot' 함수가 사용됩니다.
다음은 예입니다 -
예시
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x="x", y="y", data=my_df.query("dataset == 'I'")) plt.show()
출력
설명
- 필수 패키지를 가져옵니다.
- 입력 데이터는 seaborn 라이브러리에서 로드된 'anscombe'입니다.
- 이 데이터는 데이터 프레임에 저장됩니다.
- 'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
- 이 데이터는 'impllot' 기능을 사용하여 시각화됩니다.
- 여기서 데이터 프레임은 매개변수로 제공됩니다.
- 또한 x 및 y 값이 지정됩니다.
- 이 데이터는 콘솔에 표시됩니다.