추세 분석이란 무엇입니까?

<시간/>

경향 분석은 노이즈에 의해 약간 또는 완전히 숨겨질 수 있는 시계열에서 행동 모델을 추출하는 기술을 정의합니다. 추세 분석 방법은 일반적으로 발병 및 질병 출현의 예상치 못한 증가 또는 감소 감지, 질병 추세 모니터링, 질병 관리 프로그램 및 정책의 효율성 평가, 의료 프로그램 및 정책의 성공 평가 등에 사용되었습니다.

다양한 기술을 사용하여 항목 시리즈의 추세를 감지할 수 있습니다. 평활화는 시계열에서 발견되는 비체계적인 동작을 제거하는 데 사용되는 접근 방식입니다. 평활화는 일반적으로 특정 시점 주변의 시간 창에서 속성 값의 이동 평균을 찾는 형태를 취합니다.

이 시점에서 찾은 특정 값 대신 모든 속성 값의 로컬 평균이 사용됩니다. 평균값과 반대로 중간값은 이상치에 덜 민감하기 때문에 일반적으로 사용됩니다. 평활화는 노이즈와 이상값을 필터링할 수 있습니다. 결과 데이터가 알려진 함수(선형, 로그, 지수 등)에 맞추기 쉽기 때문에 미래 값을 예측하는 데 사용할 수 있습니다.

시계열 데이터에서 계절적 패턴을 감지하는 것은 더 어렵습니다. 한 가지 방법은 균등하게 분포된 간격으로 속성 간의 상관 관계를 찾는 것입니다. 예를 들어, 12번째 값(월별 판매 데이터)마다 상관 관계를 찾을 수 있습니다. 관련 항목 간의 시간 차이를 지연이라고 합니다.

서로 다른 지연 간격에서 데이터 값 간의 상관 관계를 결정하기 위해 자기 상관 함수를 생성할 수 있습니다. 상관도는 여러 지연 값에 대한 자기 상관 값을 그래픽으로 표시합니다.

공분산은 두 변수가 함께 어떻게 변하는지 측정합니다. 두 시계열 또는 한 시계열의 계절적 추세 간의 관계를 결정하는 기준으로 사용할 수 있습니다. 자기상관 계수, r_k 시계열 값 사이의 상관 관계를 측정합니다. 시차 k는 일정 거리만큼 떨어져 있습니다.

자기 상관을 위해 여러 접근 방식이 사용되었습니다. 양수 값은 두 변수가 함께 증가함을 나타내고 음수 값은 하나가 증가함에 따라 다른 변수가 감소함을 나타냅니다.

0에 가까운 값은 두 변수 사이에 상관관계가 거의 없음을 나타냅니다. 상관 관계를 계산하는 한 가지 일반적인 공식은 Pearson의 r이라고도 하는 상관 계수 r입니다.

X'와 Y'를 의미하는 두 개의 시계열 X와 Y가 주어지고 각각 n개의 요소가 있는 경우 r에 대한 공식은 다음과 같습니다.

$$\mathrm{\frac{\sum(x_i-X')(y_i-Y')}{\sqrt{\sum(x_i-X)^2(y_i-Y')^2}}}$$

이를 적용하여 시계열 X=(x₁에서 k, rk의 시차를 갖는 상관계수를 구합니다. ,x₂ ,…x_n ) 간단합니다. 첫 번째 시계열은 X′=(x₁ ,x₂ ,…x_n−k ), 두 번째 시계열은 X''=(x_k+1 ,x_k+1 ,…x_n ).