Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

데이터 마이닝의 회귀 유형은 무엇입니까?


회귀는 연속 값 속성을 예측하는 데 사용할 수 있는 감독형 머신 러닝 접근 방식 유형을 정의합니다. 회귀는 일부 비즈니스 조직에서 대상 변수 및 예측 변수 연관을 탐색할 수 있도록 합니다. 통화 예측 및 시계열 모델링에 사용할 수 있는 데이터를 탐색하는 데 필수적인 도구입니다.

다음과 같은 다양한 유형의 회귀가 있습니다. -

선형 회귀 − 선형 회귀에는 두 속성(또는 변수)에 맞는 "최적의" 선을 발견하는 것이 포함되므로 한 속성을 사용하여 다른 속성을 예측할 수 있습니다. 다중 선형 회귀는 2개 이상의 속성이 포함되고 레코드가 다차원 영역에 맞는 선형 회귀의 발전입니다.

예를 들어, 방정식은

Y = a + b*X + e.

어디,

절편을 정의합니다.

b는 회귀선의 기울기를 정의합니다.

e는 오류를 정의합니다.

X 및 Y는 그에 따라 예측 변수와 대상 변수를 정의합니다. X가 하나 이상의 변수로 구성된 경우 다중 선형 방정식으로 정의됩니다.

선형 회귀에서 가장 적합한 선은 최소 제곱 방법을 사용하여 구현되며 모든 데이터 점에서 회귀선까지의 편차 제곱의 총합을 줄입니다. 따라서 일부 편차가 제곱되어 양수 및 음수 편차가 취소되지 않습니다.

다항식 회귀 - 회귀식에서 분리변수의 거듭제곱이 1보다 크면 다항식으로 정의한다.

예를 들어, 방정식은

Y = a + b * x2

특정 회귀에서 최적선은 선형 방정식과 같은 직선으로 처리되지 않습니다. 그러나 일부 데이터 포인트에 맞는 곡선을 정의합니다.

로지스틱 회귀 − 종속변수가 0과 1, 참 또는 거짓, 성공 또는 실패와 같이 본질적으로 이항인 경우 로지스틱 회귀 방법이 존재하는 것으로 나타납니다. 따라서 목표값(Y)의 범위는 0에서 1까지이며 일반적으로 분류 기반 문제에 사용됩니다. 선형 회귀와 달리 선형 관계를 갖기 위해 일부 독립 변수와 종속 변수가 필요하지 않습니다.

릿지 회귀 − 릿지 회귀는 다중공선성 문제가 있는 다양한 회귀 데이터를 계산하는 데 사용할 수 있는 프로세스를 정의합니다. 다중 공선성은 두 개의 개별 변수 간의 선형 상관 관계의 연속입니다.

올가미 회귀 − LASSO는 최소 절대 수축 및 선택 연산자를 나타냅니다. 올가미 회귀는 수축을 사용하는 선형 회귀 방법입니다. 올가미 회귀에서 일부 데이터 포인트는 평균이라고도 하는 중심점을 향해 축소됩니다. 올가미 절차는 다른 회귀 분석보다 여러 매개변수가 있는 단순하고 희소한 모델에 가장 적합합니다. 이 회귀 방법은 다중 공선성을 견디는 모델에 적합합니다.