Python의 범주형 산점도 Seaborn Library에서 스트립 플롯을 사용하는 동안 포인트가 겹치는 것을 피하는 방법은 무엇입니까?

<시간/>

데이터 시각화는 실제로 숫자를 보고 복잡한 계산을 수행하지 않고도 데이터에서 무슨 일이 일어나고 있는지 이해하는 데 도움이 되기 때문에 중요한 단계입니다. Seaborn은 데이터 시각화에 도움이 되는 라이브러리입니다. 맞춤형 테마와 높은 수준의 인터페이스가 함께 제공됩니다.

작업해야 하는 변수가 본질적으로 범주형인 경우 일반 산점도, 히스토그램 등을 사용할 수 없습니다. 이때 범주형 산점도를 사용해야 합니다.

'stripplot', 'swarmplot'과 같은 도표는 범주형 변수로 작업하는 데 사용됩니다. 'stripplot' 함수는 변수 중 하나 이상이 범주형일 때 사용됩니다. 데이터는 축 중 하나를 따라 정렬된 방식으로 표시됩니다. 그러나 단점은 특정 지점이 겹친다는 것입니다. 여기에서 'jitter' 매개변수를 사용하여 변수 간의 겹침을 방지해야 합니다.

데이터 세트에 임의의 노이즈를 추가하고 범주 축을 따라 값의 위치를 조정합니다.

스트립플롯 함수의 구문

seaborn.stripplot(x, y,data, jitter = …)

'jitter' 매개변수를 사용하여 데이터세트에서 범주형 변수를 그리는 방법을 살펴보겠습니다. −

예시

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

출력

Python의 범주형 산점도 Seaborn Library에서 스트립 플롯을 사용하는 동안 포인트가 겹치는 것을 피하는 방법은 무엇입니까?

설명

필수 패키지를 가져옵니다.
입력 데이터는 scikit Learn 라이브러리에서 로드되는 'iris_data'입니다.
이 데이터는 데이터 프레임에 저장됩니다.
'load_dataset' 함수는 홍채 데이터를 로드하는 데 사용됩니다.
이 데이터는 'stripplot' 기능을 사용하여 시각화됩니다.
데이터 이름 값의 중복을 피하기 위해 'jitter'라는 추가 매개변수가 전달됩니다.
여기서 데이터 프레임은 매개변수로 제공됩니다.
또한 x 및 y 값이 지정됩니다.
이 데이터는 콘솔에 표시됩니다.