Tensorflow는 Google에서 제공하는 기계 학습 프레임워크입니다. 알고리즘, 딥 러닝 애플리케이션 등을 구현하기 위해 Python과 함께 사용되는 오픈 소스 프레임워크입니다. 연구 및 생산 목적으로 사용됩니다.
'tensorflow' 패키지는 아래 코드 줄을 사용하여 Windows에 설치할 수 있습니다 -
pip install tensorflow
Tensor는 TensorFlow에서 사용되는 데이터 구조입니다. 흐름도에서 가장자리를 연결하는 데 도움이 됩니다. 이 흐름도를 '데이터 흐름 그래프'라고 합니다. 텐서는 다차원 배열 또는 목록에 불과합니다.
Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.
예
다음은 코드 조각입니다 -
print("1234 ---> ", int_vectorize_layer.get_vocabulary()[1289]) print("321 ---> ", int_vectorize_layer.get_vocabulary()[313]) print("Vocabulary size is : {}".format(len(int_vectorize_layer.get_vocabulary()))) print("The text vectorization is applied to the training dataset") binary_train_ds = raw_train_ds.map(binary_vectorize_text) print("The text vectorization is applied to the validation dataset") binary_val_ds = raw_val_ds.map(binary_vectorize_text) print("The text vectorization is applied to the test dataset") binary_test_ds = raw_test_ds.map(binary_vectorize_text) int_train_ds = raw_train_ds.map(int_vectorize_text) int_val_ds = raw_val_ds.map(int_vectorize_text) int_test_ds = raw_test_ds.map(int_vectorize_text)
코드 크레딧 - https://www.tensorflow.org/tutorials/load_data/text
출력
1234 ---> substring 321 ---> 20 Vocabulary size is : 10000 The text vectorization is applied to the training dataset The text vectorization is applied to the validation dataset The text vectorization is applied to the test dataset
설명
-
최종 전처리 단계로 트레이닝 데이터, 테스트 데이터, 검증 데이터셋에 'TextVectorization' 레이어가 적용됩니다.