왜 내가 한 데이터 분석은 그저 그런 것일까? - 문제 정의
“데이터 분석을 통해 상황을 파악하고 문제를 정의한다”는 말의 의미
갖고 있는 데이터를 적당히 만지다 보면 어떤 추세나 특징을 파악할 수는 있겠지만 이를 통해 알 수 있는 사실은 제한적이다. 그래서 이미 알고 있는 내용의 그저 그런 분석에 그치게 되는데 이 때 선행되어야 하는 것이 ‘문제 의식’이다.
문제 의식은 무엇을 알고 싶은지, 이를 확인할 수 있는 지표를 어떻게 정의할지, 확인한 사실로 무엇을 하고 싶은지
객관적인 주장을 합리적인 결론으로 도달하게 하는 문제 해결 중심의 사고방식이다.
특히 내가 가장 어려움을 느낀 부분은 현상과 문제, 원인을 구분해서 정의하는 것인데 이것도 앞서 연습한 가설-검증 방법 수립처럼 훈련이 필요하다. (사실 문제 정의 단계가 선행되어야 한다)
따라서 겉으로 드러난 현상을 관찰하는 것에서 나아가
- 문제가 무엇인지
- 그 문제를 일으키는 원인은 무엇인지
- 그 원인에 대한 해결 방안은 무엇인지
구분하여 문제를 정의함으로써 궁극적인 데이터 분석의 목적(“데이터 분석을 통해 상황을 파악하고 문제를 정의한다”)을 달성할 수 있다.
잘못된 문제 정의 사례
1. 문제와 원인이 혼재된 경우
답을 정해놓고 시작하지 말 것. 문제 정의 단계에서 원인은 가설에 불과하다.
ex) 인재 파견 회사의 경우
문제: 사무직 관련 제안이 많은 회사라는 이미지가 생겨서 제조업종 관련 인재 확보가 어렵다 ❌
→ “~ 이미지가 생겨서” 라는 잠정적인 원인이 섞여 있음
→ 문제: 제조업종 관련 채용 정보를 많이 올리고 있는데 그 수요를 충족시킬 인재가 충분하지 않아서 기회 손실이 막대하다 ⭕️
2. 현상 묘사에 그치는 경우
문제가 문제인 이유에 대해 설득이 필요하다.
ex) 인재 파견 회사의 경우
문제: 양질의 파견직이 직접 고용으로 전환되어 인재 풀이 점점 줄어들고 있다 ❌
→ “인재 풀이 줄어들고 있다” 인재 풀이 줄어들면 어떤 문제가 있는지 구체적으로 알 수 없음
→ 문제: 파견직의 수요는 많은데 공급이 이를 충족시키지 못하고 있다 ⭕️
3. 문제와 해결방안이 혼재된 경우
문제 정의 단계에서 원인은 단지 가설일 뿐이므로 섣불리 해결방안을 제시하는 것 역시 지양되어야 한다.
ex) IT 기업의 경우
문제: 인재 부족 때문에 효율적이고 효과적인 영업 활동을 못하고 있다 ❌
→ “효과적인 영업 활동을 못하고 있다” 효과적인 영업 활동을 못하면 어떤 문제가 있는지 구체적으로 알 수 없음
→ 문제: 수주 수가 급감하고 있다 / 원인(가설): 고객 상담 및 대응 부실 / 해결방안: 효율적이고 효과적인 영업 활동하기 ⭕️
ex) IT 기업의 경우
문제: 작업 효율화를 통해 구조 조정을 진행하고자 한다 ❌
→ “작업 효율화” 는 해결방안 중 하나로 문제와 원인에 따라 다른 방안이 있을 수 있음
→ 문제: 구조 조정이 예정대로 진행되지 않고 있다 / 해결방안: 작업 효율화하기 등 ⭕️
실전 사례
반년 전부터 시설 전체의 이용자 수가 급감하고 있습니다. 인터넷에서 이용을 촉진하기 위한 프로모션을 적극적으로 하고 있습니다만, 아무래도 효과가 없는 것 같습니다. 그리고 우리 지역인 북부 시설이 남부 시설보다도 상황이 좋지 않습니다. 이용자가 줄어들어서 수입도 감소하고 있습니다.
문제: 수입이 감소하고 있다 (* 수입의 기준 정의 필요)
원인(가설): 이용자 수의 급감
해결 방안: 인터넷 프로모션 개선하기, 북부 시설과 남부 시설의 차이점 분석을 통해 개선점 도출하기 등
+) 번외로 같은 현상을 두고 문제로 정의할 수도, 문제의 원인으로 추측할 수도 있다. 궁극적으로 무엇을 말하고 싶은지, 해결하고자 하는 것이 무엇인지에 따라 문제 정의가 달라질 수 있는데
가령 인구 감소 현황 데이터를 보고 인구 감소 자체를 문제로 볼 수도, 인구 감소로 인한 인력 부족을 문제로 삼을 수도 있다. (후자 쪽이 좀 더 정확한 문제 정의에 가까운 듯 하지만 요지는 문제의 포커싱을 어디에 두고 논리를 전개해 나가는지이다.)
ex) 인구가 감소되는 것을 문제로 본다면
문제: 한국의 “인구가 감소”하고 있다
원인: 인구 유출이 크고 유입이 적음
ex) 인력이 부족해지는 것을 문제로 본다면
문제: 한국의 “인력이 부족”하다
원인: 인구 감소
비즈니스 상황이 복잡해지고 빠르게 고도화되다 보니 없는 문제를 만들어서 해결해내야 한다는 게 틀린 말이 아니다. (개인적으로 점점 더 뭔가를 해먹기 어려워지는 판이 되어가고 있다고 느껴진다)
위 내용은 <빅데이터 시대, 성과를 이끌어 내는 데이터 문해력>을 참고하여 작성한 내용입니다