데이터 분석은 예측이다
방향성, 대상, 목표, 규모, 패턴, 전략 수립 등 통찰을 원하는 모든 행위가 더 나은 내일을 위한 것이라면 데이터 분석은 모두 예측을 위한 행위라고 할 수 있다.
출처: 한 달 공부 데이터 분석(71p)
시계열 분석은 과거의 데이터를 바탕으로 미래의 상황을 예측하는 데이터 분석 방법이다. 시계열 분석 방법 중 가장 기본이 되는 이동평균법으로 매출 수요를 산출해보고 실제 해당 년도의 매출과 얼마나 일치하는지 비교해보려고 한다.
이동평균에 의한 수요 예측은 다음의 두 가지를 고려한다.
- 이동평균은 장기적인 예측보다 다음 차수의 예측값을 확인하는 데에 적합하다
- 이동평균을 구해 예측할 때는 언제나 예측값에 따른 변화와 실제 매출 추이를 비교하고 점검한다
필요 데이터
2 ~ 3개년의 월별 매출액
2018년도 매출 데이터를 활용하여 2019년도의 매출 수요를 예측해볼 것이다.
STEP 1. 이동 평균 구하기
정해진 기간 내 매출의 총합을 기간으로 나누어주면 이동 평균을 구할 수 있다. 기간을 설정하는 이유는 구간별로 평균의 변화와 추이를 확인하기 위함이다.
STEP 2. 매출 추이 비교하기
구간 내 관측값이 일정하게 유지되거나 지속적으로 성장하거나 혹은 하락할 경우 이동 평균 값이 실제 매출과 큰 차이를 보이지 않는다.(7월, 9월) 즉 2018년 4-5-6월과 6-7-8월의 매출 추이가 안정적이기 때문에 7월과 9월의 예측 결과가 좋게 나타났다.라고 해석할 수 있는데 해당 구간의 관측값이 '일정한지', '안정적인지'를 육안상으로는 판단하기 어려워서 다음 스텝으로 넘어가본다.
+ 추이를 일정하게 하기 위해 구간을 늘리거나 줄일 수 있다.
N(구간)이 커지면 → 미래의 예측치는 우연에 의한 변화를 반영하는 폭이 줄어들어 안정적인 예측치가 되는 장점이 있지만 수요의 변화에 빠르게 반응하지 못하게 된다.
N이 작아지게 되면→ 시장의 변화에 잘 적응하는 대신에 우연요인을 상쇄시키지 못하므로 시장의 변화에 과민하게 반응할 염려가 있다.
출처: 장단기 수요예측-서강대학교(링크)
STEP 3. 가중 이동 평균 구하기
보다 정밀하게 추이를 맞추기 위해 이동 평균 값에 가중치를 부여할 수 있다. 최근 매출이 다음 매출에 가장 많은 영향을 준다고 가정하고 이전 달로 갈수록 가중치 값을 줄여가는 것이다.
추세선을 그려보면 가중 이동평균이 실제 매출과 더욱 유사한 추이를 보이는 것을 알 수 있다. 마지막으로 실제 2019년도 매출 데이터와 가중 이동 평균으로 구한 2019년도 매출 수요 값을 비교해보았다.
백의 단위까지 일치하는 예측값도 확인할 수 있다.(9월) 단 이동 평균으로 예측한 값보다 실제 매출에 더 가깝지 않은 예측 값들도 존재하는데, 결론적으로 가중 이동평균법은 시간의 흐름을 반영한 추이의 평준화, 즉 예측의 안정성을 높이는 데 의의가 있다고 볼 수 있다.
데이터 출처: Online Business Sales 2017-2019
위 내용은 <한 달 공부 데이터 분석>을 참고하여 작성한 내용입니다
'데이터 분석 > 코없분: 코딩없이 분석하기' 카테고리의 다른 글
어떤 데이터를 봐야 할까? - 지표 설정 (0) | 2023.02.20 |
---|---|
왜 내가 한 데이터 분석은 그저 그런 것일까? - 문제 정의 (5) | 2023.01.30 |
지표 개선은 어떻게 하는 거에요? - 가설과 검증 (0) | 2023.01.13 |
댓글