Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python 프로그램으로 데이터 분석 및 시각화

<시간/>

이 튜토리얼에서는 pandas와 같은 모듈을 사용한 데이터 분석 및 시각화에 대해 배울 것입니다. 및 matplotlib 파이썬에서 . Python은 데이터 분석에 매우 적합합니다. 판다 모듈 설치 및 matplotlib 다음 명령을 사용합니다.

pip install pandas


pip install matplotlib

설치 프로세스가 완료되면 성공 메시지가 표시됩니다. 먼저 판다에 대해 알아보겠습니다. 그러면 matplotlib가 표시됩니다. .

판다

Pandas는 데이터 분석 도구를 제공하는 Python의 오픈 소스 라이브러리입니다. pandas에서 몇 가지 유용한 방법을 볼 것입니다. 데이터 분석을 위해.

데이터 프레임 생성

DataFrame을 생성하려면 여러 행이 필요합니다. . 어떻게 하는지 봅시다.

예시

# importing the pands package
import pandas as pd
# creating rows
hafeez = ['Hafeez', 19]
aslan = ['Aslan', 21]
kareem = ['Kareem', 18]
# pass those Series to the DataFrame
# passing columns as well
data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age'])
# displaying the DataFrame
print(data_frame)

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

Name Age
0 Hafeez 19
1 Aslan 21
2 Kareem 18

pandas를 사용하여 데이터 가져오기

링크로 이동하여 CSV를 다운로드합니다. 파일. CSV의 데이터 쉼표(,)로 구분된 행에 있습니다. pandas를 사용하여 데이터를 가져오고 사용하는 방법을 알아보겠습니다. .

예시

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# displaying the first 5 rows using data.head() method
print(data.head())

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

Python 프로그램으로 데이터 분석 및 시각화

모양 변수를 사용하여 행과 열이 몇 개인지 봅시다.

예시

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.shape)

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

(29, 16)

describe()라는 메서드가 있습니다. NaN을 제외한 다양한 통계를 계산합니다. . 한 번 보시죠.

예시

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.describe())

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

Python 프로그램으로 데이터 분석 및 시각화

데이터 플로팅

matplotlib 패키지가 있습니다. 데이터를 사용하여 그래프를 생성합니다. matplotlib를 사용하여 다양한 유형의 그래프를 만드는 방법을 알아보겠습니다. .

예시

# importing the pyplot module to create graphs
import matplotlib.pyplot as plot
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# creating a histogram of Time period
data['Time period'].hist(bins = 10)

출력

위의 프로그램을 실행하면 다음과 같은 결과를 얻을 수 있습니다.

<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>

Python 프로그램으로 데이터 분석 및 시각화

matplotlib를 사용하여 다양한 유형의 그래프를 만들 수 있습니다. 패키지.

결론

튜토리얼과 관련하여 궁금한 점이 있으면 댓글 섹션에 언급하세요.