Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

TensorFlow를 사용하여 Auto MPG 데이터 세트로 연료 효율성을 예측하기 위해 데이터를 어떻게 정리할 수 있습니까?


Tensorflow는 Google에서 제공하는 기계 학습 프레임워크입니다. 알고리즘, 딥 러닝 애플리케이션 등을 구현하기 위해 Python과 함께 사용되는 오픈 소스 프레임워크입니다.

'tensorflow' 패키지는 아래 코드 줄을 사용하여 Windows에 설치할 수 있습니다. -

pip install tensorflow

Tensor는 TensorFlow에서 사용되는 데이터 구조입니다. 흐름도에서 가장자리를 연결하는 데 도움이 됩니다. 이 흐름도를 '데이터 흐름 그래프'라고 합니다. 텐서는 다차원 배열 또는 목록에 불과합니다.

회귀 문제의 목적은 가격, 확률, 비가 올지 여부 등과 같은 연속형 또는 이산형 변수의 출력을 예측하는 것입니다.

우리가 사용하는 데이터셋을 'Auto MPG' 데이터셋이라고 합니다. 1970년대와 1980년대 자동차의 연비를 담고 있습니다. 여기에는 무게, 마력, 변위 등과 같은 속성이 포함됩니다. 이를 통해 특정 차량의 연비를 예측해야 합니다.

Google Colaboratory를 사용하여 아래 코드를 실행하고 있습니다. Google Colab 또는 Colaboratory는 브라우저를 통해 Python 코드를 실행하는 데 도움이 되며 구성이 필요 없고 GPU(그래픽 처리 장치)에 대한 무료 액세스가 필요합니다. Colaboratory는 Jupyter Notebook을 기반으로 구축되었습니다.

다음은 TensorFlow를 사용하여 Auto MPG 데이터 세트로 연료 효율성을 예측하기 위해 데이터를 정리하는 방법을 보여주는 코드 스니펫입니다. -

예시

print("Data cleaning has begun")
dataset.isna().sum()
dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})

print("Data cleaning complete!")
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')

print("A sample of dataset after data cleaning :")
dataset.head(4)

코드 크레딧 - https://www.tensorflow.org/tutorials/keras/regression

출력

Data cleaning has begun
Data cleaning complete!
A sample of dataset after data cleaning −


<머리><번째>
MPG 실린더 변위 마력 무게 가속 모델 연도 유럽 일본 미국
0 18.0 8 307.0 130.0 3504.0 12.0 70 0 0 1
1 15.0 8 350.0 165.0 3693.0 11.5 70 0 0 1
2 18.0 8 318.0 150.0 3436.0 11.0 70 0 0 1
3 16.0 8 304.0 150.0 3433.0 12.0 70 0 0 1

설명

  • 데이터 정리는 데이터 세트에 있는 'nan'을 삭제하는 것으로 시작됩니다.

  • 'map' 함수는 레이블을 열 이름에 매핑하는 데 사용됩니다.

  • 데이터 정리 후 데이터 세트의 샘플이 콘솔에 표시됩니다.