Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - Sklearn을 사용하여 테스트 데이터 세트 생성

<시간/>

Sklearn python 라이브러리는 다양한 그래프 플롯을 만드는 데 사용할 수 있는 샘플 데이터 세트를 제공합니다. 이러한 데이터 세트의 유용성은 샘플 그래프 및 차트를 생성하고 값이 변경됨에 따라 그래프의 동작을 예측하는 데 있습니다. 또한 실제 데이터 세트를 사용하기 전에 이 샘플 그래프에서 색상 및 축 등을 결정하는 것과 같은 다른 매개변수에 대해 작업할 수 있습니다.

make_blobs 사용

아래 예제에서는 matplotlib와 함께 sklearn 라이브러리를 사용하여 특정 스타일의 산점도를 생성합니다. 200개의 데이터 포인트 샘플을 선택하고 클러스터의 색상과 유형도 선택합니다.

예시

 sklearn.datasets에서 make_blobs를 matplotlib에서 가져오기 pyplot을 matplotlib에서 plt로 가져오기 stylestyle.use("빠른")X, y =make_blobs(n_samples=200, 센터=, cluster_std=1, n_features=2)plt.scatter(X [:, 0], X[:, 1], s=60, 색상='r')plt.xlabel("X")plt.ylabel("Y")plt.show()plt.clf() 

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

Python - Sklearn을 사용하여 테스트 데이터 세트 생성

make_circles 사용

위의 접근 방식과 유사하게 make_circles 함수를 사용하여 샘플 크기가 100이고 색상이 파란색인 원을 만듭니다.

예시

sklearn.datasets에서 가져오기 make_circlesfrom matplotlib에서 pyplot을 plt로 가져오기 matplotlib에서 가져오기 stylestyle.use("fast")X, y =make_circles(n_samples=100, noise=0.04)plt.scatter(X[:, 0], X [:, 1], s=40, 색상='b')plt.xlabel("X")plt.ylabel("Y")plt.show()plt.clf()

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

Python - Sklearn을 사용하여 테스트 데이터 세트 생성