Python에서 부스트 트리와 함께 Tensorflow를 어떻게 사용할 수 있습니까?

<시간/>

Tensorflow는 부스트 트리와 함께 사용하여 데이터 세트의 예측 성능을 향상시킬 수 있습니다. 데이터가 로드되고 평소와 같이 전처리되지만, 예측이 이루어지면 예측에 여러 모델이 사용되며 이러한 모든 모델의 출력이 결합되어 최종 결과가 나옵니다.

자세히 알아보기: TensorFlow란 무엇이며 Keras가 TensorFlow와 함께 신경망을 생성하는 방법은 무엇입니까?

모든 레이어에 정확히 하나의 입력 텐서와 하나의 출력 텐서가 있는 일반 레이어 스택으로 작업하는 데 사용되는 순차 모델을 구축하는 데 도움이 되는 Keras Sequential API를 사용할 것입니다.

하나 이상의 레이어를 포함하는 신경망을 컨볼루션 레이어라고 합니다. Convolutional Neural Network를 사용하여 학습 모델을 구축할 수 있습니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

의사 결정 트리와 tf.estimator API를 사용하여 그래디언트 부스팅 모델을 훈련하는 방법을 살펴보겠습니다. Boosted Trees 모델은 회귀 및 분류를 위한 가장 인기 있고 효과적인 기계 학습 접근 방식으로 간주됩니다. 그것은 많은(10s 또는 100s 또는 1000s) 트리 모델의 예측을 결합하는 앙상블 기술입니다. 그들은 최소한의 초매개변수 조정과 함께 인상적인 성능을 달성하는 데 도움이 됩니다.

예시

import numpy as np
import pandas as pd
from IPython.display import clear_output
from matplotlib import pyplot as plt
print("Load the dataset")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("Delete the column 'survived'")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
import tensorflow as tf
tf.random.set_seed(123)

로 가져오기

코드 크레딧 -https://www.tensorflow.org/tutorials/estimator/boosted_trees

출력

Load the dataset
Delete the column 'survived'

설명

필요한 팩개를 가져옵니다.
데이터세트가 로드되었습니다.
csv 파일로 읽습니다.
'생존' 열이 삭제되었습니다.