Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python의 범주형 산점도 Seaborn Library에서 스트립 플롯을 사용하는 동안 포인트가 겹치는 것을 피하는 방법은 무엇입니까?

<시간/>

데이터 시각화는 실제로 숫자를 보고 복잡한 계산을 수행하지 않고도 데이터에서 무슨 일이 일어나고 있는지 이해하는 데 도움이 되기 때문에 중요한 단계입니다. Seaborn은 데이터 시각화에 도움이 되는 라이브러리입니다. 맞춤형 테마와 높은 수준의 인터페이스가 함께 제공됩니다.

작업해야 하는 변수가 본질적으로 범주형인 경우 일반 산점도, 히스토그램 등을 사용할 수 없습니다. 이때 범주형 산점도를 사용해야 합니다.

'stripplot', 'swarmplot'과 같은 도표는 범주형 변수로 작업하는 데 사용됩니다. 'stripplot' 함수는 변수 중 하나 이상이 범주형일 때 사용됩니다. 데이터는 축 중 하나를 따라 정렬된 방식으로 표시됩니다. 그러나 단점은 특정 지점이 겹친다는 것입니다. 여기에서 'jitter' 매개변수를 사용하여 변수 간의 겹침을 방지해야 합니다.

데이터 세트에 임의의 노이즈를 추가하고 범주 축을 따라 값의 위치를 ​​조정합니다.

스트립플롯 함수의 구문

seaborn.stripplot(x, y,data, jitter = …)

'jitter' 매개변수를 사용하여 데이터세트에서 범주형 변수를 그리는 방법을 살펴보겠습니다. −

예시

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

출력

Python의 범주형 산점도 Seaborn Library에서 스트립 플롯을 사용하는 동안 포인트가 겹치는 것을 피하는 방법은 무엇입니까?

설명

  • 필수 패키지를 가져옵니다.
  • 입력 데이터는 scikit Learn 라이브러리에서 로드되는 'iris_data'입니다.
  • 이 데이터는 데이터 프레임에 저장됩니다.
  • 'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
  • 이 데이터는 'stripplot' 기능을 사용하여 시각화됩니다.
  • 데이터 이름 값의 중복을 피하기 위해 'jitter'라는 추가 매개변수가 전달됩니다.
  • 여기서 데이터 프레임은 매개변수로 제공됩니다.
  • 또한 x 및 y 값이 지정됩니다.
  • 이 데이터는 콘솔에 표시됩니다.