IT용어위키



정상성

정상성이 있는 데이터와 없는 데이터

정상성(Stationarity)은 시계열 데이터의 평균(mean), 분산(variance), 자기상관(autocorrelation) 등 통계적 특성이 시간에 따라 일정하게 유지되는 성질을 의미한다. 이 개념은 경제, 금융, 기상 등 다양한 분야의 시계열 분석 및 예측 모형 구축에 필수적인 전제 조건으로 사용된다.

개요

정상성(Stationarity)은 시계열 데이터가 시간의 흐름에 따라 일정한 통계적 특성을 유지하는 상태를 말한다. 정상 시계열은 데이터의 평균, 분산, 그리고 자기상관 구조가 변하지 않으며, 이러한 성질 덕분에 과거 데이터를 기반으로 미래를 예측하는 데 안정적인 모형을 구성할 수 있다. 반면, 비정상 시계열(non-stationary series)은 추세(trend), 계절성(seasonality) 또는 구조적 변화 등으로 인해 이러한 특성이 일정하지 않아, 예측 모형에 바로 적용하기 어려우므로 전처리 과정을 통해 정상성을 확보해야 한다.

특징

  • 평균 일정성 (Constant Mean)
    • 데이터의 평균이 시간에 걸쳐 일정하게 유지된다. 이는 장기적으로 데이터가 특정 중심값 주위에서 진동함을 의미한다.
  • 분산 일정성 (Constant Variance)
    • 데이터의 분산이 일정하여, 시계열의 변동 폭이 일정한 범위 내에서 유지된다. 예측 오차의 분포가 안정적이라는 점에서 중요하다.
  • 자기상관 일정성 (Stationary Autocorrelation)
    • 시계열 내에서 특정 시점 간의 상관관계가 일정하게 유지되어, 시계열의 패턴이 시간에 따라 크게 변하지 않는다.
  • 계절성과 추세 제거 (Removal of Seasonality and Trend)
    • 정상 시계열은 데이터 내 존재하는 계절적 요인(seasonality)이나 추세(trend)와 같은 구조적 요인이 제거된 상태이다. 이를 위해 차분(differencing)이나 로그 변환 등의 전처리 기법이 사용된다.

활용

정상성은 시계열 예측과 통계적 모형 구축에 있어 매우 중요한 전제 조건이다.

  • 예측 모형 구축
    • ARIMA (AutoRegressive Integrated Moving Average) 및 VAR (Vector AutoRegression) 등과 같은 시계열 예측 모형은 정상성을 전제로 하여 설계된다.
  • 경제 및 금융 분석
    • GDP, 주가, 환율 등 다양한 경제 지표와 금융 데이터는 정상성을 확인한 후 모형에 적용된다. 비정상 시계열의 경우, 차분이나 계절 조정 등의 방법으로 정상화를 거친 후 분석이 이루어진다.
  • 통계적 검정
    • 디키-풀러 검정(Dickey-Fuller Test) 및 확장 디키-풀러 검정(ADF Test; Augmented Dickey-Fuller Test) 등을 통해 시계열 데이터의 정상성을 평가한다.
  • 기상 및 환경 데이터 분석
    • 온도, 강수량, 기압 등의 기상 데이터 역시 정상성을 확보한 후 장기 예측이나 기후 변화 분석에 활용된다.

같이 보기

참고 문헌

  • Hamilton, J. D. (1994). Time Series Analysis. Princeton University Press.
  • Enders, W. (2004). Applied Econometric Time Series. Wiley.
  • Dickey, D. A., & Fuller, W. A. (1979). Distribution of the Estimators for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association.

  출처: IT위키(IT위키에서 최신 문서 보기)
  * 본 페이지는 공대위키에서 미러링된 페이지입니다. 일부 오류나 표현의 누락이 있을 수 있습니다. 원본 문서는 공대위키에서 확인하세요!