Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

차원 감소와 숫자 감소의 차이점은 무엇입니까?

<시간/>

차원 축소

차원 축소에서 데이터 인코딩 또는 변환은 원본 데이터의 축소 또는 "압축" 묘사에 액세스하는 데 사용됩니다. 데이터 손실 없이 압축된 데이터에서 원본 데이터를 다시 생성할 수 있는 경우 데이터 축소를 무손실이라고 합니다. 재구성된 데이터가 원본 데이터의 근사치일 경우 데이터 축소를 손실이라고 합니다.

DWT는 사인과 코사인을 포함하는 신호 처리 기술인 이산 푸리에 변환(DFT)과 거의 관련이 있습니다. 일반적으로 DWT는 더 나은 손실 압축을 달성합니다. 즉, 주어진 데이터 벡터의 DWT 및 DFT에 대해 유사한 수의 계수가 유지되는 경우 DWT 버전은 원본 데이터의 보다 정확한 근사치를 지원합니다. 따라서 등가 근사를 위해 DWT는 DFT보다 적은 면적을 필요로 합니다.

수량 감소

숫자 감소에서는 더 작은 형태의 데이터 표현을 대안으로 선택하여 데이터 볼륨을 줄입니다. 이러한 기술은 매개변수적이거나 비모수적일 수 있습니다. 매개변수 방법의 경우 모델이 데이터를 추정할 수 있으므로 로그 선형 모델과 같이 실제 데이터 대신 데이터 매개변수만 저장하면 됩니다. 비모수적 방법은 히스토그램, 클러스터링 및 샘플링을 포함하는 축소된 데이터 표현을 저장하는 데 사용됩니다.

차원 축소와 수치 축소의 비교를 살펴보겠습니다.

차원 축소 수량 감소
차원 축소에서는 원본 데이터의 축소 또는 압축 표현을 얻기 위해 데이터 인코딩 또는 변환이 적용됩니다. 수량 감소에서는 더 작은 형태의 데이터 표현을 번갈아 선택하여 데이터 볼륨을 줄입니다.
차원 축소에서 이산 웨이블릿 변환(DWT)은 데이터 벡터 X에 사용될 때 웨이블릿 계수의 수치적으로 다른 벡터 X'로 변경하는 선형 신호 처리 기술입니다.
두 벡터의 길이는 같습니다. 이 기술을 데이터 축소에 적용할 때 각 튜플을 n차원 데이터 벡터로 간주할 수 있습니다. 즉, X=(x1 ,x2 ,…xn ) n 데이터베이스 속성에서 튜플에 대해 수행된 n 측정을 나타냅니다.
수량 감소에서 회귀 및 로그 선형 모델을 사용하여 주어진 데이터를 근사화할 수 있습니다. 선형 회귀에서 데이터는 직선에 맞게 모델링됩니다.
예를 들어, 확률 변수 y(응답 변수로 알려짐)는 방정식 y =wx+b를 사용하여 다른 확률 변수 x(예측 변수로 알려짐)의 선형 함수로 모델링할 수 있습니다. 여기서 y의 분산은 일정하다고 가정합니다.
관련성이 없고 중복되는 속성을 제거하는 데 사용할 수 있습니다. 원래 데이터를 더 작은 형태로 표현하는 기술일 뿐입니다.
이 기술에서는 일부 데이터가 손실될 수 있으며 이는 부적절합니다. 이 방법은 데이터의 손실이 없지만 전체 데이터가 더 작은 형태로 표현됩니다.