Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Tensorflow를 Estimators와 함께 사용하여 Python을 사용하여 거대한 데이터 세트를 검사하는 방법은 무엇입니까?

<시간/>

거대한 데이터 세트는 기능을 반복하고 기능을 목록으로 변환하고 콘솔에 표시하여 Tensorflow 및 추정기를 사용하여 검사할 수 있습니다.

자세히 알아보기: TensorFlow란 무엇이며 Keras가 TensorFlow와 함께 신경망을 생성하는 방법은 무엇입니까?

모든 레이어에 정확히 하나의 입력 텐서와 하나의 출력 텐서가 있는 일반 레이어 스택으로 작업하는 데 사용되는 순차 모델을 구축하는 데 도움이 되는 Keras Sequential API를 사용할 것입니다.

하나 이상의 레이어를 포함하는 신경망을 컨볼루션 레이어라고 합니다. Convolutional Neural Network를 사용하여 학습 모델을 구축할 수 있습니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

Estimator는 완전한 모델에 대한 TensorFlow의 상위 수준 표현입니다. 손쉬운 확장 및 비동기식 교육을 위해 설계되었습니다.

tf.estimator API를 사용하여 로지스틱 회귀 모델을 훈련할 것입니다. 이 모델은 다른 알고리즘의 기준선으로 사용됩니다. 우리는 성별, 연령, 등급 등과 같은 특성을 고려하여 승객 생존을 예측하는 것을 목표로 타이타닉 데이터 세트를 사용합니다.

추정기는 기능 열을 사용하여 모델이 원시 입력 기능을 해석하는 방법을 설명합니다. Estimator는 숫자 입력의 벡터를 예상하고 특성 열은 모델이 데이터 세트의 모든 특성을 변환하는 방법을 설명하는 데 도움이 됩니다. 효과적인 모델을 학습하려면 올바른 기능 열 세트를 선택하고 사용하는 것이 중요합니다.

예시

print("The dataset is being inspected")
ds = make_input_fn(dftrain, y_train, batch_size=10)()
for feature_batch, label_batch in ds.take(1):
print('Some feature keys are:', list(feature_batch.keys()))
print()
print('A batch of class:', feature_batch['class'].numpy())
print()
print('A batch of Labels:', label_batch.numpy())

코드 크레딧 −https://www.tensorflow.org/tutorials/estimator/linear

출력

The dataset is being inspected
Some feature keys are: ['sex', 'age', 'n_siblings_spouses', 'parch', 'fare', 'class', 'deck', 'embark_town', 'alone']
A batch of class: [b'First' b'First' b'First' b'Third' b'Third' b'Third' b'First' b'Third'
b'Second' b'Third']
A batch of Labels: [0 1 1 0 0 0 1 0 0 0]

설명

  • 데이터세트를 검사합니다.
  • 기능 키, 레이블 및 클래스가 콘솔에 표시됩니다.
  • 일괄 데이터세트를 반복하여 수행됩니다.