Seaborn은 데이터 시각화에 도움이 되는 라이브러리입니다. 맞춤형 테마와 고급 인터페이스가 함께 제공됩니다.
회귀 모델을 구축할 때 다중 공선성이 확인됩니다. 이는 연속 변수의 모든 다른 조합 사이에 존재하는 상관 관계를 이해해야 하기 때문입니다. 변수 사이에 다중 공선성이 존재하는 경우 데이터에서 제거되었는지 확인해야 합니다. 여기서 'regpot' 및 'implot' 기능이 작동합니다. 선형 회귀에서 변수 간의 선형 관계를 시각화하는 데 도움이 됩니다.
'regplot' 함수는 다양한 형식의 변수 'x' 및 'y'에 대한 값을 허용하며 여기에는 numpy 배열, pandas 시리즈 개체, 변수에 대한 참조 또는 pandas 데이터 프레임의 값이 포함됩니다.
반면, 'implot' 함수는 사용자가 데이터에 대한 특정 매개변수를 전달해야 하며 변수 'x' 및 'y'의 값은 문자열이어야 합니다. 이러한 유형의 데이터 형식을 긴 형식 데이터라고 합니다. 다음은 예입니다 -
예
import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.regplot(x = "total_bill", y = "tip", data = my_df) sb.lmplot(x = "total_bill", y = "tip", data = my_df) plt.show()
출력
설명
- 필수 패키지를 가져옵니다.
- 입력 데이터는 Seaborn 라이브러리에서 로드되는 '팁'입니다.
- 이 데이터는 데이터 프레임에 저장됩니다.
- 'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
- 이 데이터는 'regplot' 기능을 사용하여 시각화됩니다.
- 이 데이터는 'impllot' 기능을 사용하여 시각화됩니다.
- 여기서 데이터 프레임은 매개변수로 제공됩니다.
- 또한 x 및 y 값이 지정됩니다.
- 이 데이터는 콘솔에 표시됩니다.