Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Tensorflow를 사용하여 꽃 훈련 데이터 세트를 사전 처리하는 방법은 무엇입니까?

<시간/>

꽃 데이터 세트는 keras 전처리 API를 사용하여 전처리할 수 있습니다. 유효성 검사 세트, 데이터가 저장되는 디렉토리 및 데이터 세트를 처리하기 위한 기타 매개변수를 취하는 'image_dataset_from_directory'라는 메소드가 있습니다.

자세히 알아보기: TensorFlow란 무엇이며 Keras가 TensorFlow와 함께 신경망을 생성하는 방법은 무엇입니까?

모든 레이어에 정확히 하나의 입력 텐서와 하나의 출력 텐서가 있는 일반 레이어 스택으로 작업하는 데 사용되는 순차 모델을 구축하는 데 도움이 되는 Keras Sequential API를 사용할 것입니다. 이미지 분류기는 keras.Sequential 모델을 사용하여 생성되고 데이터는 preprocessing.image_dataset_from_directory를 사용하여 로드됩니다.

데이터는 디스크에서 효율적으로 로드됩니다. 과적합이 식별되고 이를 완화하기 위한 기술이 적용됩니다. 이러한 기술에는 데이터 증대 및 드롭아웃이 포함됩니다. 3700개의 꽃 이미지가 있습니다. 이 데이터셋은 5개의 하위 디렉터리를 포함하며 클래스당 하나의 하위 디렉터리가 있습니다. 데이지, 민들레, 장미, 해바라기, 튤립입니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

print("Pre-processing the dataset using keras.preprocessing")
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="validation",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)
class_names = train_ds.class_names
print("The class names are:")
print(class_names)

코드 크레딧:https://www.tensorflow.org/tutorials/images/classification

출력

Pre-processing the dataset using keras.preprocessing
Found 3670 files belonging to 5 classes.
Using 734 files for validation.
The class names are:
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

설명

  • keras.preprocessing 메소드를 사용하여 데이터세트를 처리합니다.
  • 다음 단계는 콘솔에 클래스 이름을 표시하는 것입니다.