데이터 분석/지표 분석
사용자 분석 - 고객 세분화 그룹 구하기(RFM)
중급닌자 연습생
2022. 12. 20. 22:25
충성고객에게 혜택을 주는 이벤트를 기획 중입니다
구매금액이 큰 순서로 충성고객 리스트를 뽑아주세요
문제 정의하기
충성고객은 장기적이고 지속적인 관점에서 서비스 온보딩 여부(+사용자의 가치)를 판단해야 하기 때문에 단순히 구매금액이 큰 사용자만을 충성고객으로 정의하기는 어렵다. 따라서 RFM 분석을 통해 언제, 얼마나 자주, 얼마나 많은 금액을 지불했는지 사용자 그룹을 나누어 봐야 한다.
RFM은 다음 3가지의 기준을 의미한다.
✔ Recency(최근 구매일): 최근 구매 이력이 있는 사용자를 충성고객으로 취급 (숫자가 작을수록 충성고객)
✔ Frequency(누적 구매 횟수): 사용자가 구매한 횟수 (숫자가 클수록 충성고객)
✔ Monetary(구매 금액 합계): 사용자의 구매 금액 합계 (숫자가 클수록 충성고객)
필요한 데이터
유저 데이터(유저id), 주문 데이터(주문일자, 주문금액, 주문id)
풀이
with sub as (
select
user_id,
amount,
substr(stamp, 1, 10) as dt
from action_log
where action = 'purchase')
select
user_id,
max(dt) as recent_date,
current_Date,
TIMESTAMPDIFF(day, max(dt), current_Date) as recency,
count(*) as frequency,
sum(amount) as monetary
from sub
group by user_id
DATEDIFF/TIMESTAMPDIFF
-> 결과 값의 반환 단위에 따른 두 날짜 간의 차이를 구하는 함수
DATEDIFF(날짜 1, 날짜 2)
TIMESTAMPDIFF(단위, 날짜 1, 날짜 2)
최근 구매일(recency)의 경우
TIMESTAMPDIFF(day, max(dt), current_Date)
TIMESTAMPDIFF(week, max(dt), current_Date)
TIMESTAMPDIFF(month, max(dt), current_Date)
TIMESTAMPDIFF(quarter, max(dt), current_Date)
-> 최근 n일/n주/n월/n분기 이내 구매 고객으로 그룹을 세분화 할 수 있음
사용자 그룹 정의하기 (예시)
등급 | Recency | Frequency | Monetary |
5 | 14일 이내 | 20회 이상 | 300만원 이상 |
4 | 28일 이내 | 10회 이상 | 100만원 이상 |
3 | 60일 이내 | 5회 이상 | 30만원 이상 |
2 | 90일 이내 | 2회 이상 | 5만원 이상 |
1 | 91일 이내 | 1회 | 5만원 미만 |
✔ 전체 등급을 몇 등급으로 나눌 것인지(3등급, 5등급 등)
✔ 각 등급의 금액과 주기를 어떻게 정할 것인지를 고려하여 사용자 그룹을 정의하고 분류한다.
풀이
-- RFM 사용자 분석 부분 쿼리 생략
, sub3 as (
select
user_id,
recent_date,
current_Date,
recency,
frequency,
monetary,
case
when recency < 14 then '5'
when recency < 28 then '4'
when recency < 60 then '3'
when recency < 90 then '2'
else '1' end as r,
case
when frequency >= 20 then '5'
when frequency >= 10 then '4'
when frequency >= 5 then '3'
when frequency >= 2 then '2'
else '1' end as f,
case
when monetary >= 300000 then '5'
when monetary >= 100000 then '4'
when monetary >= 30000 then '3'
when monetary >= 5000 then '2'
else '1' end as m
from sub2
)
select
user_id,
recent_date,
current_Date,
recency,
frequency,
monetary,
r,
f,
m,
r+f+m as score
from sub3
해석
Recency와 Frequency, Monetary의 각 등급의 합을 구해 충성도(score)를 정의할 수 있다. 그리고 이벤트의 목적과 달성 지표에 따라 대상 사용자 그룹을 선정해야 한다. 가령 위 경우와 같이 구매 합계가 큰 사용자를 대상으로 하는 이벤트라면 구매 합계가 크면서도 최근 구매를 하지 않은 사용자 그룹에 대해 "재방문 유도" 목적의 이벤트를 실시할 수 있다.
데이터 출처: 데이터 분석을 위한 SQL 레시피