scikit-learn 라이브러리를 사용하여 Python에서 데이터를 로드하는 방법은 무엇입니까?

<시간/>

일반적으로 sklearn으로 알려진 Scikit-learn은 기계 학습 알고리즘을 구현하기 위해 사용되는 Python의 오픈 소스 라이브러리입니다.

여기에는 Python의 강력하고 안정적인 인터페이스를 통해 분류, 회귀, 클러스터링, 차원 축소 등이 포함됩니다. 이 라이브러리는 Numpy, SciPy 및 Matplotlib 라이브러리를 기반으로 합니다.

데이터를 로드하는 예를 살펴보겠습니다 -

예시

from sklearn.datasets import load_iris
my_data = load_iris()
X = my_data.data
y = my_data.target
feature_name = my_data.feature_names
target_name = my_data.target_names
print("Feature names are : ", feature_name)
print("Target names are : ", target_name)
print("\nFirst 8 rows of the dataset are : \n", X[:8])

출력

Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Target names are : ['setosa' 'versicolor' 'virginica']
First 8 rows of the dataset are :
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]]

설명

필수 패키지를 가져옵니다.
이 작업에 필요한 데이터세트도 환경에 로드됩니다.
특성 및 대상 값은 데이터세트에서 분리됩니다.
이러한 기능과 대상은 콘솔에 인쇄되어 있습니다.
또한 데이터의 샘플을 보기 위해 데이터의 처음 8행이 콘솔에 인쇄됩니다.