이 기사에서는 Scikit-learn의 학습 모델 구축:Python 기계 학습 라이브러리에 대해 알아봅니다.
무료 머신러닝 라이브러리입니다. numpy 및 scipy로 직접 구현하여 랜덤 포레스트, 벡터 머신 및 k-최근접 이웃과 같은 다양한 알고리즘을 지원합니다.
데이터세트 가져오기
pandasUrl 가져오기 =<여기에 URL 지정>data=pandas.rad_csv(url)
데이터 탐색 및 정리
head 메소드를 사용하여 필요에 따라 레코드를 지정/필터링할 수 있습니다.
data.head()data.head(n=4) # 레코드를 4로 제한
데이터세트의 마지막 레코드 몇 개를 구현할 수도 있습니다.
data.tail()data.tail(n=4) # 레코드를 4로 제한
이제 데이터 시각화의 단계가 옵니다
이를 위해 Seaborn 모듈과 matplotlib를 사용하여 데이터를 시각화합니다.
import seaborn as simport matplotlib.pyplot as pltsns.set(style="whitegrid", color_codes=True)# create a countplotsns.countplot('Route To Market',data=sales_data,hue ='기회 결과')사전>데이터 전처리
from sklearn import preprocessingle =preprocessing.LabelEncoder()#열을 숫자 값으로 변환encoded_value =le.fit_transform(열 이름 목록)print(encoded_value)마침내 우리는 데이터 세트를 훈련하여 모델 구축 단계에 도달했습니다.
결론
이 기사에서는 Python에서 사용할 수 있는 라이브러리인 scikit-learn의 모델 구축에 대해 배웠습니다.