⏱️ 시계열 데이터 분석 완벽 가이드 💡
“시간의 흐름에 따라 변하는 데이터를 예측하고 이해하는 분석 방법!”
🧭 1️⃣ 시계열 데이터란?
📘 정의
시간 순서대로 관측된 데이터를 말해요!
예를 들어,
🛒 일별 매출액, 🌤️ 월별 기온, 📈 분기별 GDP, 👥 일일 방문자 수 등
💬 쉽게 말해
“시간이 중요한 데이터 = 시계열 데이터”
📊 2️⃣ 시계열의 4대 구성요소
| 구성요소 | 설명 | 예시 |
| 📈 추세(Trend) | 장기적으로 증가 or 감소하는 흐름 | 꾸준히 매출이 오름 |
| 🔄 계절성(Seasonality) | 일정 주기로 반복되는 패턴 | 여름에는 아이스크림 매출 ↑ |
| 💫 주기성(Cyclicity) | 장기적 경기순환 같은 변동 | 경기 호황·불황 주기 |
| 🎲 불규칙성(Random) | 예측 불가능한 우연한 변동 | 갑작스런 폭우로 매출 급감 |
➕ 3️⃣ 가법 vs ✖️ 승법 모델
| 구분 | 형태 | 특징 | 예시 |
| ➕ 가법(Additive) | Y = 추세 + 계절 + 불규칙 | 변동폭 일정 | 월별 매출이 일정폭으로 오름 |
| ✖️ 승법(Multiplicative) | Y = 추세 × 계절 × 불규칙 | 추세가 커질수록 변동폭도 커짐 | 매출이 커질수록 계절 변동도 커짐 |
💡 팁:
그래프 진폭이 점점 커진다면 → 승법 모델
진폭이 일정하다면 → 가법 모델
🧹 4️⃣ 시계열 데이터 분석 전 준비
📌 데이터 전처리 단계
1️⃣ 결측치 보완 (보간법, 평균 대체 등)
2️⃣ 이상치 처리 (이유 기록 or 제거)
3️⃣ 로그변환(log) → 분산 안정화
4️⃣ 차분(differencing) → 추세 제거
⚖️ 5️⃣ 정상성(Stationarity)
시계열 분석의 기본 조건은 정상성!
👉 시간에 따라 평균과 분산이 일정해야 해요.
💬 예를 들어,
매출이 계속 증가하면 비정상(Non-Stationary) 상태!
이를 해결하려면
→ 차분(Differencing) 을 적용해요.
🔍 6️⃣ ACF & PACF 이해하기
| 용어 | 의미 | 분석 포인트 |
| 🔗 ACF (자기상관함수) | 현재값과 과거값의 상관 | 전체적 영향 파악 |
| ✂️ PACF (부분자기상관) | 직접적인 상관 | 모델 차수 추정에 유용 |
💡 ACF/PACF로 AR(자기회귀), MA(이동평균) 모델의 차수를 추정할 수 있어요.
🧮 7️⃣ 주요 시계열 모델 한눈에 보기
| 모델 | 의미 | 특징 |
| 🔹 AR(p) | 자기회귀 | 과거 데이터로 현재 예측 |
| 🔸 MA(q) | 이동평균 | 과거 오차로 현재 보정 |
| 🔹 ARMA(p,q) | AR + MA | 정상 시계열에 적합 |
| 🔸 ARIMA(p,d,q) | 차분 포함 ARMA | 추세 제거 후 예측 가능 |
| ❄️ SARIMA(P,D,Q,s) | 계절성 포함 ARIMA | 계절 패턴 있는 데이터 |
| 🌟 지수평활(ETS) | 과거 데이터를 가중평균 | 단기 예측에 빠름 |
🧪 8️⃣ 지수평활(ETS) 모델
| 모델 | 특징 | 사용 상황 |
| 🧮 SES (단순) | 추세·계절 없음 | 단기 매출 예측 |
| 📈 Holt | 추세 반영 | 꾸준히 증가하는 데이터 |
| 🔄 Holt–Winters | 추세 + 계절 반영 | 월별, 분기별 데이터 |
💡 변동폭이 일정 → 가법형 / 변동폭 커짐 → 승법형
🧭 9️⃣ 시계열 모델링 절차
1️⃣ 시각화 → 추세·계절성 확인 👀
2️⃣ 변환 → 로그·차분으로 정상화
3️⃣ ACF/PACF → 차수 추정
4️⃣ 모델 학습 → ARIMA, SARIMA, ETS
5️⃣ 진단 → 잔차 확인 (패턴 無 = 백색잡음)
6️⃣ 예측 → 미래 값 + 신뢰구간 제시
📉 10️⃣ 평가 지표
| 지표 | 의미 | 해석 |
| 📊 MAE | 절대오차 평균 | 예측이 얼마나 벗어났는지 |
| 📉 RMSE | 제곱오차 평균 | 큰 오차에 민감 |
| 📈 MAPE | 백분율 오차 | % 단위로 직관적 비교 |
💬 “예측 RMSE가 낮을수록 정확한 모델!”
🧰 11️⃣ 실전 팁
🧾 ARIMA는 패턴이 명확하지 않을 때,
❄️ Holt–Winters는 추세·계절이 뚜렷할 때 좋아요.
📅 교차검증 시 주의:
시간 순서를 섞으면 ❌
👉 롤링 윈도우나 확장 윈도우 방식으로 검증해야 합니다!
🧠 12️⃣ ADsP 시험 포인트 정리 ✅
📌 시계열의 4요소 (추세·계절·주기·불규칙)
📌 가법 vs 승법 판단
📌 ARIMA(p,d,q) 의미 (p: AR, d: 차분, q: MA)
📌 Holt–Winters = 추세+계절 반영
📌 정상성 확보 = 차분으로 해결
📌 잔차 = 백색잡음이면 모델 적합 🎯
🌈 한 줄 요약
⏱️ 시계열 분석이란, 시간에 따라 변하는 데이터의 패턴을 읽고 미래를 예측하는 기술!
차분으로 안정화 → 패턴 확인(ACF/PACF) → 모델적합(ARIMA or Holt–Winters) → 예측 완료