시계열 데이터의 정상성

정상성(Stationary)


시간의 흐름에도 평균(mean), 분산(variance), 자기상관(autocorrelation)이 변하지 않는다.

 

평균, 분산, 자기상관을 계산하면 시간에 따라 값이 변하는 함수 형태가 아닌 상수(constant)가 되어야 한다.

 

Autocorrelation

 

두 변수 사이의 관계를 -1 ~ 1의 값으로 표현하는 척도를 Correlation이라 하는데, correlation 개념에 auto를 추가한 것으로 두 개의 변수가 아닌, 자기 자신과 시간의 위치가 바뀐 (time-shifted) 자기 자신과의 Correlation을 말함

 


정상성이 중요한 이유:

예측값이 무한으로 가거나 값이 튀지 않고 예측의 정확성을 높이는 목적

'빅데이터 & 인공지능' 카테고리의 다른 글

정상성 회복방법  (0) 2024.01.09
비정상성 데이터 예시  (0) 2024.01.09
시계열 데이터  (0) 2024.01.09
[작업1유형] 각 구의 초중고 전출입 인원  (0) 2023.11.02
[작업1유형] BMI  (0) 2023.11.02