본문 바로가기
데이터 분석/코없분: 코딩없이 분석하기

야 너두 수요 예측 할 수 있어! - 이동 평균

2023. 2. 3.

데이터 분석은 예측이다

방향성, 대상, 목표, 규모, 패턴, 전략 수립 등 통찰을 원하는 모든 행위가 더 나은 내일을 위한 것이라면 데이터 분석은 모두 예측을 위한 행위라고 할 수 있다.

출처: 한 달 공부 데이터 분석(71p)

시계열 분석은 과거의 데이터를 바탕으로 미래의 상황을 예측하는 데이터 분석 방법이다. 시계열 분석 방법 중 가장 기본이 되는 이동평균법으로 매출 수요를 산출해보고 실제 해당 년도의 매출과 얼마나 일치하는지 비교해보려고 한다.

이동평균에 의한 수요 예측은 다음의 두 가지를 고려한다.

  • 이동평균은 장기적인 예측보다 다음 차수의 예측값을 확인하는 데에 적합하다
  • 이동평균을 구해 예측할 때는 언제나 예측값에 따른 변화와 실제 매출 추이를 비교하고 점검한다

필요 데이터

2 ~ 3개년의 월별 매출액

데이터 출처: Online Business Sales 2017-2019(Kaggle)

2018년도 매출 데이터를 활용하여 2019년도의 매출 수요를 예측해볼 것이다.


STEP 1. 이동 평균 구하기

정해진 기간 내 매출의 총합을 기간으로 나누어주면 이동 평균을 구할 수 있다. 기간을 설정하는 이유는 구간별로 평균의 변화와 추이를 확인하기 위함이다.

이동평균 공식
이동 평균

STEP 2. 매출 추이 비교하기

전년도 매출과 이동 평균의 비교 추세

구간 내 관측값이 일정하게 유지되거나 지속적으로 성장하거나 혹은 하락할 경우 이동 평균 값이 실제 매출과 큰 차이를 보이지 않는다.(7월, 9월) 즉 2018년 4-5-6월과 6-7-8월의 매출 추이가 안정적이기 때문에 7월과 9월의 예측 결과가 좋게 나타났다.라고 해석할 수 있는데 해당 구간의 관측값이 '일정한지', '안정적인지'를 육안상으로는 판단하기 어려워서 다음 스텝으로 넘어가본다.

+ 추이를 일정하게 하기 위해 구간을 늘리거나 줄일 수 있다.

N(구간)이 커지면 → 미래의 예측치는 우연에 의한 변화를 반영하는 폭이 줄어들어 안정적인 예측치가 되는 장점이 있지만 수요의 변화에 빠르게 반응하지 못하게 된다.
N이 작아지게 되면→ 시장의 변화에 잘 적응하는 대신에 우연요인을 상쇄시키지 못하므로 시장의 변화에 과민하게 반응할 염려가 있다.

출처: 장단기 수요예측-서강대학교(링크)

STEP 3. 가중 이동 평균 구하기

보다 정밀하게 추이를 맞추기 위해 이동 평균 값에 가중치를 부여할 수 있다. 최근 매출이 다음 매출에 가장 많은 영향을 준다고 가정하고 이전 달로 갈수록 가중치 값을 줄여가는 것이다.

가중 이동평균 공식
가중 이동평균
전년도 매출과 가중 이동 평균의 비교 추세

추세선을 그려보면 가중 이동평균이 실제 매출과 더욱 유사한 추이를 보이는 것을 알 수 있다. 마지막으로 실제 2019년도 매출 데이터와 가중 이동 평균으로 구한 2019년도 매출 수요 값을 비교해보았다.

백의 단위까지 일치하는 예측값도 확인할 수 있다.(9월) 단 이동 평균으로 예측한 값보다 실제 매출에 더 가깝지 않은 예측 값들도 존재하는데, 결론적으로 가중 이동평균법은 시간의 흐름을 반영한 추이의 평준화, 즉 예측의 안정성을 높이는 데 의의가 있다고 볼 수 있다.

 

데이터 출처: Online Business Sales 2017-2019

위 내용은 <한 달 공부 데이터 분석>을 참고하여 작성한 내용입니다

댓글