Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python을 사용하여 Fashion MNIST 데이터 세트를 다운로드하고 탐색하는 데 TensorFlow를 어떻게 사용할 수 있습니까?


Tensorflow는 Google에서 제공하는 기계 학습 프레임워크입니다. 알고리즘, 딥 러닝 애플리케이션 등을 구현하기 위해 Python과 함께 사용되는 오픈 소스 프레임워크입니다. 연구 및 생산 목적으로 사용됩니다.

'tensorflow' 패키지는 아래 코드 줄을 사용하여 Windows에 설치할 수 있습니다 -

pip install tensorflow

'Fashion MNIST' 데이터셋에는 다양한 종류의 의복 이미지가 포함되어 있습니다. 10가지 카테고리에 속하는 70,000개 이상의 옷에 대한 회색조 이미지가 포함되어 있습니다. 이 이미지는 저해상도(28 x 28픽셀)입니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

다음은 코드입니다 -

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

print("The tensorflow version used is ")
print(tf.__version__)
print("The dataset is being loaded")
fashion_mnist = tf.keras.datasets.fashion_mnist
print("The dataset is being classified into training and testing data ")
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("The dimensions of training data ")          
print(train_images.shape)

print("The number of rows in the training data")
print(len(train_labels))

print("The column names of dataset")
print(train_labels)
print("The dimensions of test data ")          
print(test_images.shape)
print("The number of rows in the test data")
print(len(test_labels))

코드 크레딧 - https://www.tensorflow.org/tutorials/keras/classification

출력

The tensorflow version used is
2.4.0
The dataset is being loaded
The dataset is being classified into training and testing data
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 0s 0us/step
The dimensions of training data
(60000, 28, 28)
The number of rows in the training data
60000
The column names of dataset
[9 0 0 ... 3 0 5]
The dimensions of test data
(10000, 28, 28)
The number of rows in the test data
10000

설명

  • 필요한 패키지를 가져옵니다.

  • 사용 중인 Tensorflow의 버전이 결정됩니다.

  • Fashion MNIST 데이터 세트가 로드되고 Fashion MNIST 데이터 세트는 TensorFlow에서 직접 액세스할 수 있습니다.

  • 다음으로 데이터는 훈련 및 테스트 데이터 세트로 분할됩니다.

  • 데이터세트에는 총 70000개의 행이 있으며, 이 중 60k 이미지는 훈련에 사용되고 10k는 모델이 이미지를 다른 레이블로 분류하는 방법을 얼마나 잘 학습했는지 평가하는 데 사용됩니다.

  • 데이터세트의 모든 이미지에 특정 레이블이 부여되는 분류 문제입니다.

  • 이 이미지는 의상이며 각각의 레이블이 할당되어 있습니다.

  • 모양, 훈련 및 테스트 데이터 세트의 행 수, 데이터 세트의 열 이름이 콘솔에 표시됩니다.