본문 바로가기
유데미 스타터스 데이터 분석

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 3주차 학습 일지

2023. 2. 26.

2022.02.20 ~ 2022.02.24

3주차에는 R을 중심으로 실습이 진행되었는데 2주차 말미부터 파이썬을 거의 다루지 않아 다시 어색해진 듯 하다. 그래서 이번 학습 일지에서는 지난 주 학습일지 마지막에 문제 제기했던 내용을 추가로 진행해보려 한다.

가령 지역구별 한식 상품가격을 알아보는 취지가 어떤 지역구가 가장 저렴한지, 가장 비싼지 알아보기 위함이라면 서울시 전체 평균과 지역구별 평균, 최소, 최대, 중간값을 4개의 꺾은선 그래프로 비교하는 것도 좋을 것 같다.

유데미 스타터스 취업 부트캠프 4기 - 데이터 분석 2주차 학습 일지


사용 데이터

서울시 가격안정 모범업소 상품목록 현황
가격이 저렴하고 서비스가 좋은 가격안정모범업소(착한가게)들의 상품목록 정보에 대한 OpenAPI 서비스입니다. 지방물가안정을 위해 해당 업소를 발굴·이용토록 하여 지방물가 안정에 기여하고자 합니다.

출처: 서울 열린데이터 광장

지역구별 한식 상품가격의 최대, 평균, 중간, 최소 값 비교하기

구하고자 하는 것: 지역구별 한식의 평균, 최대, 최소, 중간 상품가격과 서울 평균 상품가격 비교

  • X축: 지역구
  • Y축: 상품가격
plt.figure(figsize=(15,7))

plt.plot(df_hansik_mean, 'g.-', label='평균')
plt.plot(df_hansik_min, 'b.-', label='최소')
plt.plot(df_hansik_max, 'r.-', label='최고')
plt.plot(df_hansik_median, 'y.-', label='중간')

plt.legend(loc=(0,1.01), ncol=3, fontsize=12, edgecolor='k')
plt.title('지역구별 한식 상품가격 비교', size=20, pad=30)

plt.yticks(range(0, 70000,10000))
plt.grid(ls=':')

plt.axhline(df_hansik_total_mean, color='gray', ls='--')
plt.text('중구', 8000, '서울 평균('+str(round(df_hansik_total_mean,1))+')'
         , ha='center', fontsize=15)

plt.show()

 처음에는 평균, 최소, 최고, 중간 값 선그래프를 모두 표시했다. x축은 지역구로 범위를 지정할 필요가 없으므로 y축에 대해서만 0에서 70000까지의 범위를 지정해주었는데 최고값과 나머지 값들의 편차가 심해 아래와 같이 그래프의 가독성이 좋지 않았다.

 그래서 최고값에 대해서는 일단 주석 처리 해두고 y축 범위와 간격도 더 작게 수정했다.

plt.figure(figsize=(15,7))

# 선그래프 그리기
plt.plot(df_hansik_mean, 'g.-', label='평균')
plt.plot(df_hansik_min, 'b.-', label='최소')
#plt.plot(df_hansik_max, 'r.-', label='최고')
plt.plot(df_hansik_median, 'y.-', label='중간')

# 범례, 타이틀, 그리드 표시
plt.legend(loc=(0,1.01), ncol=3, fontsize=12, edgecolor='k')
plt.title('지역구별 한식 상품가격 비교', size=20, pad=30)
plt.grid(ls=':')

# y축 범위 지정
plt.yticks(range(0, 15000,1000))

# 서울 평균 표시
plt.axhline(df_hansik_total_mean, color='gray', ls='--')
plt.text('중구', 8000, '서울 평균('+str(round(df_hansik_total_mean,1))+')'
         , ha='center', fontsize=15)

plt.show()

관악구, 서대문구, 성북구의 경우 최소값이 낮은 지역들인데 아마 해당 지역에 대학가가 형성되어 있어서 그 영향이 있지 않을까 추측되었다.
앞서 언급했듯이 최고값과 나머지 값들의 편차가 심해 어디까지 이상치로 정의하고 제외시켜야 할지 애매했다.
얼마 전 뉴스에서는 서울 직장인 평균 점심값이 12,000원을 돌파했다고 했는데 그 수치보다는 낮은 평균 가격이어서 가격안정 모범업소 외에 좀 더 범위를 확장해볼 필요가 있을 것 같다. 

 

밥 먹기 무섭다…서울 직장인 평균 점심값 1.2만원 - 머니투데이

1년새 33.8% 상승서울에서 점심 한끼를 먹기 위해 1만원도 부족한 시대가 됐다. 지난해 4분기 서울 직장인 평균 점심값은 1만2285원으로 전년 동기 대비 33.8% 오른 것으로...

news.mt.co.kr


이번주는 R과 데이터 드리븐 디자인 씽킹 등 여러 과정을 진행하느라, 그리고 멘탈을 부여잡느라 제법 힘든 주였다. 일련의 과정을 거치면서 나는 긍정적인 피드백이 있어야 가장 크게 동기부여 된다는 것을 알게 되었다. 그래서 회고를 할 때 보완할 점 외에 스스로 잘한 점에 대해서도 꼭 짚고 넘어가라고 하는거구나. 앞으로는 TIL에도 반영해보아야겠다.

그리고 뭔가 잘 안 될 때..결국 내가 당장 할 수 있는 걸 하는 수 밖에 없다. 

네네 알겠어요...그렇게 해볼게요... 😂


>> 유데미 바로가기
>> 
STARTERS 취업 부트캠프 공식 블로그 보러가기

본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터 분석 과정 학습 일지 리뷰로 작성되었습니다.

 

#유데미 #유데미코리아 #유데미큐레이션 #유데미부트캠프 #취업부트캠프 #스타터스부트캠프 #데이터시각화 #데이터분석 #데이터드리븐 #태블로

댓글