일반적으로 sklearn으로 알려진 Scikit-learn은 기계 학습 알고리즘을 구현하기 위해 사용되는 Python의 오픈 소스 라이브러리입니다.
여기에는 Python의 강력하고 안정적인 인터페이스를 통해 분류, 회귀, 클러스터링, 차원 축소 등이 포함됩니다. 이 라이브러리는 Numpy, SciPy 및 Matplotlib 라이브러리를 기반으로 합니다.
데이터를 로드하는 예를 살펴보겠습니다 -
예시
from sklearn.datasets import load_iris my_data = load_iris() X = my_data.data y = my_data.target feature_name = my_data.feature_names target_name = my_data.target_names print("Feature names are : ", feature_name) print("Target names are : ", target_name) print("\nFirst 8 rows of the dataset are : \n", X[:8])
출력
Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)'] Target names are : ['setosa' 'versicolor' 'virginica'] First 8 rows of the dataset are : [[5.1 3.5 1.4 0.2] [4.9 3. 1.4 0.2] [4.7 3.2 1.3 0.2] [4.6 3.1 1.5 0.2] [5. 3.6 1.4 0.2] [5.4 3.9 1.7 0.4] [4.6 3.4 1.4 0.3] [5. 3.4 1.5 0.2]]
설명
- 필수 패키지를 가져옵니다.
- 이 작업에 필요한 데이터세트도 환경에 로드됩니다.
- 특성 및 대상 값은 데이터세트에서 분리됩니다.
- 이러한 기능과 대상은 콘솔에 인쇄되어 있습니다.
- 또한 데이터의 샘플을 보기 위해 데이터의 처음 8행이 콘솔에 인쇄됩니다.