본문 바로가기

분류 전체보기178

262. Trips and Users (LeetCode) Trips and Users - LeetCode Can you solve this real interview question? Trips and Users - Table: Trips +-------------+----------+ | Column Name | Type | +-------------+----------+ | id | int | | client_id | int | | driver_id | int | | city_id | int | | status | enum | | request_at | leetcode.com Write a SQL query to find the cancellation rate of requests with unbanned users (both client and drive.. 2023. 3. 27.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 2022.03.20 ~ 2022.03.24 7주차는 다양한 집계를 할 수 있는 Primary 함수와 LOD를 중심으로 태블로 프로젝트를 진행했다. 매개변수를 설정하는 것은 조금 익숙해졌지만 datediff와 대상날짜, 날짜 매개변수를 함께 사용하여 조건을 부여하는 것, 시작일과 종료일을 각각 조정하여 조회기간을 설정할 수 있도록 매개변수를 설정하는 것은 어려웠던 부분이었다. 그리고 역시 메인은 LOD로, 개념을 이해하기 위해서 백단에서 어떤 연산이 이루어지는지 순차적으로 접근해야 했고 그나마 쉽다고 여겼던 LOD fixed 연산도 실제 사용 시에는 헷갈리는 부분이 있었다.(가령 VLOD에 존재하는 차원도 fixed 해야 하는지? 결론은 안전하게 접근한다면 이미 존재하는 차원도 fixed 할 수 있다!) .. 2023. 3. 26.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 6주차 학습 일지 2022.03.13 ~ 2022.03.17 6주차부터 우당탕탕 태블로 실습이 시작되었다. (벌써 반이나 지났다니!) 태블로 실습 첫 주 강의는 대시보드 기획과 기본 차트 생성을 중심으로 진행되었지만 실제 프로젝트 과제를 수행할 때는 훨씬 다양한 기능들을 복합적으로 사용했고, 그 결과 아래 이미지와 같은 상황이 자주 발생했다. 그래서 사용했던 기능들과 개념들을 하나씩 되짚어보고 만들었던 대시보드를 복습, 수정해보려 한다. 목차 태블로 그룹, 집합, 필터 뽀개기 프로젝트: 에어비앤비 객실&호스트 현황 분석 및 실적 개선 제안 태블로 그룹, 집합, 필터 뽀개기 먼저 이 3개의 개념을 확실하게 짚고 넘어간다. 그룹: group by의 그 group이다. 즉 하나의 그룹으로 묶이면 병합 집계된다는 뜻. 집합: I.. 2023. 3. 19.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 5주차 학습 일지 2022.03.06 ~ 2022.03.10 5주차는 유데미 태블로 고수되기 과정이 끝나고 시계열 데이터 분석 과정을 진행했다. 그렇지만 지난 주에 중간 평가를 대비하느라 태블로 내용을 복습하지 않았고 6주차에는 오프라인 태블로 강의가 진행되기 때문에 이번 학습일지에서는 태블로 기본 개념을 정리하려 한다. 목차 블렌딩과 조인 클러스터링 그룹과 집합 LOD(Level Of Detail) 블렌딩과 조인 조인: 결합 후 집계 블렌딩: 집계 후 결합 조인은 일반적인 데이터베이스 구조에서 사용되는 개념과 동일하다. row 단위로 보조 테이블의 데이터가 붙는 방식이고 데이터를 불러오자마자 진행하게 된다. 반면 블렌딩은 집계의 단위가 먼저 정의된 후 보조 테이블의 데이터가 해당 집계 기준으로 붙는 방식이다. 블렌딩을 .. 2023. 3. 12.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(4) DDL(데이터 정의) CREATE (스키마, 테이블 구조 생성) CREATE TABLE 테이블명{ ID INTEGER PRIMARY KEY, NAME VARCHAR(20) NOT NULL, PRICE INTEGER }; ALTER (테이블 구조 변경) # 컬럼 추가 ALTER TABLE 테이블명 ADD 컬럼명 VACHAR(30); # 컬럼 타입 변경 ALTER TABLE 테이블명 MODIFY 컬럼명 INTEGER; # 컬럼 삭제 ALTER TABLE 테이블명 DROP COLUMN 컬럼명; DROP (테이블 구조 삭제) DROP TABLE 테이블명; RENAME (테이블명 변경) TRUNCATE (데이터 모두 삭제) DML(데이터 조작) SELECT(조회) SELECT 컬럼명 FROM 테이블명 WHERE .. 2023. 3. 10.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(3) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(1) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(2) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(3) 데이터 분석을 위한 파이썬 로드맵(내가 보려고 만듦) 시각화 1) Matplotlib 라이브러리 준비 import pandas as pd import matplotlib.pyplot as plt # 그래프에 한글 설정 plt.rc('font',family='Malgun Gothic') # 그래프에 마이너스 기호 깨지는 문제 해결 plt.rcParams['axes.unicode_minus'] = False 막대 그래프 df1 = pd.Data.. 2023. 3. 10.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(2) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(1) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(2) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(3) 데이터 분석을 위한 파이썬 로드맵(내가 보려고 만듦) 데이터 전처리, 탐색 1) 데이터 추출 필요한 속성만 추출 Q. 'math' 컬럼 추출하기 # 시리즈 형태로 추출 s_math = df['math'] # 데이터프레임 형태로 추출 df_math = df[['math']] 조건에 따라 추출 Q. kor의 값이 60~90인 학생의 name, kor 추출하기 df[(df['kor']>=60)&(df['kor']> >> >> 100.0 .iloc.. 2023. 3. 9.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(1) 2022.02.27 ~ 2022.03.03 4주차는 드디어 태블로 기초 과정이 시작되었는데 데이터 드리븐 디자인 씽킹과 공휴일이 각각 하루씩 차지하여 실질적으로 태블로를 학습한 일자는 3일 남짓이었다. 그래서 태블로에 대한 내용은 차주 학습일지에 한 번에 정리하는 것이 좋을 것 같고 이번 학습일지에서는 파이썬 로드맵에 따른 총정리를 진행하려 한다. 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(1) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(2) 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지(3) 데이터 분석을 위한 파이썬 로드맵(내가 보려고 만듦) >> 데이터 분석 역량은 여기 참고 분석.. 2023. 3. 5.
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 3주차 학습 일지 2022.02.20 ~ 2022.02.24 3주차에는 R을 중심으로 실습이 진행되었는데 2주차 말미부터 파이썬을 거의 다루지 않아 다시 어색해진 듯 하다. 그래서 이번 학습 일지에서는 지난 주 학습일지 마지막에 문제 제기했던 내용을 추가로 진행해보려 한다. 가령 지역구별 한식 상품가격을 알아보는 취지가 어떤 지역구가 가장 저렴한지, 가장 비싼지 알아보기 위함이라면 서울시 전체 평균과 지역구별 평균, 최소, 최대, 중간값을 4개의 꺾은선 그래프로 비교하는 것도 좋을 것 같다. 유데미 스타터스 취업 부트캠프 4기 - 데이터 분석 2주차 학습 일지 사용 데이터 서울시 가격안정 모범업소 상품목록 현황 가격이 저렴하고 서비스가 좋은 가격안정모범업소(착한가게)들의 상품목록 정보에 대한 OpenAPI 서비스입니다. .. 2023. 2. 26.
어떤 데이터를 봐야 할까? - 지표 설정 오늘 처음 만난 사람에게 데이터를 보여주면서 '이것이 문제입니다'라고 말할 때 어떤 데이터를 활용해야 할까? 문제라고 정의한 것과 이를 설명하기 위한 데이터(지표)가 논리적으로 일치하지 않는 경우가 많다. '어딘가에서 그래프와 표를 수집해서 그로부터 내릴 수 있는 결론을 내리'는 접근법을 취하기 때문인데 이처럼 '데이터 중심'으로 분석하다 보면 단순히 데이터를 통해 알 수 있는 사실을 열거하게 될 뿐이다. 따라서 '목적 중심'으로 말하고자 하는 결론에 부합하는 데이터를 제시하기 위해서는 용어의 정의가 명확하고 설득력 있는지 목적과 문제, 결론과 활용된 데이터가 일치하는지 검토하여 적합한 지표를 설정해야 한다. 잘못된 지표 설정 사례 1. 문제 정의가 명확하지 않은 경우 문제: 고객 불편사항에 대한 개선이.. 2023. 2. 20.