Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

TensorFlow를 사용하여 Auto MPG 데이터 세트(기본 회귀)로 연료 효율성을 예측하기 위해 데이터를 어떻게 가져올 수 있습니까?


Tensorflow는 Google에서 제공하는 기계 학습 프레임워크입니다. 알고리즘, 딥 러닝 애플리케이션 등을 구현하기 위해 Python과 함께 사용되는 오픈 소스 프레임워크입니다. 연구 및 생산 목적으로 사용됩니다.

'tensorflow' 패키지는 아래 코드 줄을 사용하여 Windows에 설치할 수 있습니다 -

pip install tensorflow

Tensor는 TensorFlow에서 사용되는 데이터 구조입니다. 흐름도에서 가장자리를 연결하는 데 도움이 됩니다. 이 흐름도를 '데이터 흐름 그래프'라고 합니다. 텐서는 다차원 배열 또는 목록에 불과합니다.

회귀 문제의 목적은 가격, 확률, 비가 올지 여부 등과 같은 연속형 또는 이산형 변수의 출력을 예측하는 것입니다.

우리가 사용하는 데이터셋을 'Auto MPG' 데이터셋이라고 합니다. 1970년대와 1980년대 자동차의 연비를 담고 있습니다. 여기에는 무게, 마력, 변위 등과 같은 속성이 포함됩니다. 이를 통해 특정 차량의 연비를 예측해야 합니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

다음은 Auto MPG 데이터셋으로 연비를 예측하는 코드입니다 -

예시

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

np.set_printoptions(precision=3, suppress=True)

import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.layers.experimental import preprocessing
print("The version of tensorflow is ")
print(tf.__version__)

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'
column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin']
print("The data is being loaded")
print("The column names have been defined")
raw_dataset = pd.read_csv(url, names=column_names, na_values='?', comment='\t', sep=' ', skipinitialspace=True)

dataset = raw_dataset.copy()
print("A sample of the dataset")
dataset.head(2)

코드 크레딧 - https://www.tensorflow.org/tutorials/keras/regression

출력

The version of tensorflow is
2.4.0
The data is being loaded
The column names have been defined
A sample of the dataset


sl. MPG 실린더 변위 마력 무게 가속 모델 연도 원산지
0 18.0 8 307.0 130.0 3504.0 12.0 70 1
1 15.0 8 350.0 165.0 3693.0 11.5 70 1

설명

  • 필수 패키지를 가져오고 별칭을 지정합니다.

  • 데이터가 로드되고 열 이름이 정의됩니다.

  • 데이터 세트의 샘플이 콘솔에 표시됩니다.