[Python] 그룹별 구간 나누기 이 정도 수치면 그룹 내에서 높은걸까? 낮은걸까? → 각 데이터 값의 그룹 내 위치, 중요도, 우선순위 등을 알아보자 [Step 1] 수치형 데이터의 구간 나누기 pd.qcut(data['close_price'], 3).value_counts() pd.cut(data['close_price'], 3).value_counts() qcut()과 cut() 함수 -> cut은 절대평가, qcut은 상대평가 출처: [Python Pandas] 동일 길이로 나누어서 범주 만들기 pd.cut(), 동일 개수로 나누어서 범주 만들기 pd.qcut() [Step 2] 나누어진 구간에 라벨링하기 pd.qcut(data['close_price'], 3, labels = ['L', 'M', 'H']) pd.cut(data[.. 2022. 12. 7.
Weather Observation Station 20 (HackerRank) Weather Observation Station 20 | HackerRank Query the median of Northern Latitudes in STATION and round to 4 decimal places. www.hackerrank.com A median is defined as a number separating the higher half of a data set from the lower half. Query the median of the Northern Latitudes (LAT_N) from STATION and round your answer to decimal places. 풀이 제출한 답 with sub as ( select *, row_number() over (ord.. 2022. 11. 7.
블로그로 데이터 분석하기를 마치며.. 계기 이 프로젝트를 시작하게 된 결정적인 계기는 데이터리안의 8월 세미나 중 이보민님의 발표였다. 보민님은 oopy로 이력서 웹서비스를 만들고 GA로 사용자 행동 데이터 수집 및 개선점을 도출하셨다. 마침 나도 블로그를 시작할 때 GA를 연동하고 방치해둔 참이라 그동안 쌓인 데이터를 활용하기에 좋은 기회라는 생각이 들었다. 좋았던 것 목표에 걸맞게 퍼널과 퍼널별 핵심 이벤트를 정의한 것이다. 데이터를 해석하고 인사이트를 도출하는 것 자체는 쉽지 않지만 최초에 가이드라인을 잘 정의했기 때문에 중간에 뭘 해야할지 길을 잃지는 않았다. 이 부분이 확실히 나의 강점인 것 같다. 02. 퍼널 정의하기 / 퍼널별 핵심 이벤트 정의하기 뭐든 기준을 세우는 게 중요하다는 것은 나의 기획 원칙이 (되어가고 있)다. 그래.. 2022. 11. 7.
Weather Observation Station 11 (HackerRank) Weather Observation Station 11 | HackerRank Query a list of CITY names not starting or ending with vowels. www.hackerrank.com Query the list of CITY names from STATION that either do not start with vowels or do not end with vowels. Your result cannot contain duplicates. 풀이 제출한 답 select distinct city from station where city not regexp '^[aeiou].*[aeiou]$' -> .은 어떤 문자든 일치, *은 문자를 여러 번 반복 2022. 11. 6.
Ollivander's Inventory (HackerRank) Ollivander's Inventory | HackerRank Help pick out Ron's new wand. www.hackerrank.com Hermione decides the best way to choose is by determining the minimum number of gold galleons needed to buy each non-evil wand of high power and age. Write a query to print the id, age, coins_needed, and power of the wands that Ron's interested in, sorted in order of descending power. If more than one wand has s.. 2022. 11. 5.
SQL Project Planning (HackerRank) SQL Project Planning | HackerRank Write a query to output the start and end dates of projects listed by the number of days it took to complete the project in ascending order. www.hackerrank.com Write a query to output the start and end dates of projects listed by the number of days it took to complete the project in ascending order. If there is more than one project that have the same number of .. 2022. 11. 4.
Binary Tree Nodes (HackerRank) Binary Tree Nodes | HackerRank Write a query to find the node type of BST ordered by the value of the node. www.hackerrank.com Write a query to find the node type of Binary Tree ordered by the value of the node. Output one of the following for each node: 풀이 제출한 답 select N, (case when p is null then 'Root' when N in (select p from bst) then 'Inner' else 'Leaf' end) from bst order by N -> P에 있는 값이.. 2022. 11. 3.
[VOD] PAP 현업 데이터 실무자 5인과 함께 시작하는 프로덕트 데이터 분석 현업 데이터 실무자 5인과 함께 시작하는 프로덕트 데이터 분석 | PAP 우리가 데이터를 분석하는 목적은 명확합니다. ‘어떤 기술을 활용하여 어떤 결론을 도출해야 우리 비즈니스의 가치를 더 높일 수 있을까?’에 대한 답을 찾아내기 위함이죠. 끊임없이 변화하 class101.net PAP 블로그에서 링크를 가져왔더니 UTM 파라미터가 적용되어 있다! utm_source=creator& utm_medium=social& utm_campaign=self_marketing& utm_term=creator_follower& utm_content=btvXcGdJwG1B1JZC0LkR 기간 2022년 9월 ~ 10월 수강 계기 PAP 블로그 데이터 관련 흥미로운 콘텐츠가 자주 발행되어서 PAP 블로그를 주기적으로 살.. 2022. 10. 29.
[VOD] 데이터리안 개념부터 실습까지 추천 시스템 입문편 수강후기 [개념부터 실습까지] 추천 시스템 입문편 - 인프런 | 강의 인프런 누적 수강생 10,000명 이상, 풍부한 온/오프라인 강의 경험을 가진 데이터리안의 추천 시스템 입문 강의. 추천 시스템의 기초 이론을 배우고, 영화 데이터 분석을 함께 실습해 봅니다., - 강 www.inflearn.com 기간 2022년 7월 13일 ~ 2022년 10월 15일 수강 계기 개념과 구현 추천 시스템이라는 과제를 중심으로 적재적소에 필요한 개념을 가져다 구현하는 사고의 흐름을 참고하고 싶었다. 추천 시스템 입문 vs 파이썬 입문 데이터리안에서 제공하는 파이썬 강의는 추천 시스템, 파이썬, 판다스 총 3개이다. 바로 추천 시스템을 듣기 부담스럽다면 데이터리안 유튜브에 올라와있는 추천 시스템 무료 강의나 파이썬 무료 강의를 .. 2022. 10. 22.
05. 탐색 → 도달 퍼널 개선하기: 도달 늘리기 이전 글에서 탐색 → 도달 퍼널의 핵심 이벤트인 프로필 링크 클릭과 외부 콘텐츠 링크 클릭 데이터를 수집하고 분석했다. 주목할만한 이슈로는 유입 → 탐색 퍼널에서의 스킨 변경에 따라 프로필 링크 클릭 진입점이 사라졌고 GTM 코드도 누락되어 있었던 점이다. 또한 트리거 조건 역시 어째서인지 발동되지 않아 새롭게 설정한 트리거들까지 일괄로 조건을 수정하였다. GA 기본 이벤트들이 잘 집계되고 있어서 내가 설정한 태그들도 상태가 괜찮은 줄 알았다. 이로써 배포 전에 확실한 테스트와 검증이 필요하다는 교훈을 얻었다.. 도달을 늘리기 위한 액션 아이템을 생각하다 보니 '커리어리에 블로그 글을 바이럴하는데 왜 블로그에서 다시 커리어리 프로필을 클릭하도록 유도해야 하는지...' 도달 이벤트에 대한 본질적인 의문이 .. 2022. 10. 20.