Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python에서 Seaborn을 사용하여 여러 변수가 있는 데이터를 어떻게 시각화할 수 있습니까?

<시간/>

Seaborn은 데이터 시각화에 도움이 되는 라이브러리입니다. 그것은 사용자 정의 테마와 높은 수준의 인터페이스와 함께 제공됩니다. 실시간 상황에서 데이터 세트에는 많은 변수가 포함됩니다. 때로는 모든 변수와 데이터 세트의 다른 모든 변수와의 관계를 분석해야 할 수도 있습니다. 이러한 상황에서 이변량 분포는 시간이 너무 많이 걸리고 복잡해질 수 있습니다.

여기에서 다중 쌍별 이변량 분포가 나타납니다. 'pairplot' 함수는 데이터 프레임에서 변수 조합 간의 관계를 얻는 데 사용할 수 있습니다. 출력은 일변량 플롯이 됩니다.

페어플롯 함수의 구문

seaborn.pairplot(data,…)

이제 그래프에 표시하는 방법을 알아보겠습니다. −

예시

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(my_df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()

출력

Python에서 Seaborn을 사용하여 여러 변수가 있는 데이터를 어떻게 시각화할 수 있습니까?


Python에서 Seaborn을 사용하여 여러 변수가 있는 데이터를 어떻게 시각화할 수 있습니까?

설명

  • 필수 패키지를 가져옵니다.
  • 입력 데이터는 scikit Learn 라이브러리에서 로드되는 'iris_data'입니다.
  • 이 데이터는 데이터 프레임에 저장됩니다.
  • 'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
  • 이 데이터는 'pairplot' 기능을 사용하여 시각화됩니다.
  • 여기서 데이터 프레임은 매개변수로 제공됩니다.
  • 여기서 'kind' 매개변수는 'kde'로 지정되어 플롯이 커널 밀도 추정치를 인쇄할 수 있도록 이해합니다.
  • 그림 유형은 산점도로 언급됩니다.
  • 이 데이터는 콘솔에 표시됩니다.