분류 전체보기 (320) 썸네일형 리스트형 미니 프로젝트 OT 미니 프로젝트는 데이터분석 기획부터 시각화까지 분석프로세스 중 일부를 수행합니다. 관심있는 분야의 주제를 선정하여 데이터수집(필요하다면 크롤링까지) 및 EDA, 시각화를 통해 데이터의 인사이트를 얻기위한 목적으로 수행합니다. 지원하고자 하는 필드의 유사 데이터를 선택한다면 취업에 필요한 좋은 포트폴리오가 됨. 분석 프로젝트의 목적은 현재까지 수강한 수업내용을 바탕으로 사용 가능 한 모든 분석 방법을 동원하여 데이터 내 인사이트를 도출, 더 나아가서는 분석 내용을 바탕으로 서비스 제안 내지 시각화 대시 보드를 제작하는 것이 목표 1. 데이터 분석 프로젝트란? 문제정의에 따라 데이터를 수집, 분석, 모델링을 거쳐 결과물을 만들어내는 전 과정 데이터 과학자의 관점에서 데이터를 연구 데이터를 연구하기에 다양한 .. Git, Github 01 https://github.com/JINJUN941003/TIL/blob/main/git/220816-commands.md GitHub - JINJUN941003/TIL: Today I learned Today I learned. Contribute to JINJUN941003/TIL development by creating an account on GitHub. github.com git shell commmand What is shell? : Software that connect kernel and users. CLI: Command Line Interface pwd : print working directory ls : list segment cd : change doucments ls -a :.. SQL_Intermediate 05. 프로덕트 분석 심화 05. 프로덕트 분석 심화 Q19. 2020년 7월에 우리 신규 유저가 하루 안에 결재로 넘어가는 비율이 어떻게 되나요? 그 비율이 어떤지 알고 싶고, 결제까지 보통 몇 분 정도가 소요되는지 알고 싶어요. Paying Conversion within 1 day 이해 최초 구매일 찾기 LEFT JOIN 사용 이유 TIMEDIFF 사용 TIME_TO_SEC() - 시간을 초로 변환해주는 함수 SELECT A.customer_id , A.created_at , B.customer_id AS paying_user , B.purchased_at , TIME_TO_SEC(TIMEDIFF(B.purchased_at,A.created_at)) / 3600 AS diff_hour FROM tbl_customer AS A.. SQL_Intermediate 04. 매출 관련 추가 분석 04. 매출 관련 추가 분석 Q17. 2020년 7월 일별 매출의 전일 대비 증감폭, 증감률을 구해주세요. WITH문 : 서브 쿼리를 사용해서 임시 테이블 처럼 사용할 수 있는 구문, 옵티마이저가 인라인 뷰나 임시 테이블로 판단. Window 함수(행 순서 함수) 이해 LAG : 이전 행을 가져옴 LEAD : 특정 위치의 행을 가져옴(defult는 1 : 다음행을 가져옴) WITH tbl_revenue AS ( SELECT DATE_FORMAT(purchased_at - interval 9 hour, '%Y-%m-%d') AS d_date , SUM(price) AS revenue FROM tbl_purchase WHERE purchased_at >= '2020-07-01' AND purchased_at.. SQL_Intermediate 03. 유저 세그먼트별 분석 03. 유저 세그먼트별 분석 Q13. 전체 유저의 Demographic을 알고 싶어요. 성, 연령별 유저 숫자를 알려주세요. 어느 세그먼트가 가장 숫자가 많나요? 참고로 기타 성별은 하나로, 연령은 5세단위로 적당히 묶어주시고 숫자가 높은 순서대로 보여주세요. CASE WHEN 사용NULL 값 오류 대처GROUP BY, ORDERBY 사용 SELECT CASE WHEN LENGTH(gender) < 1 THEN 'Others' ELSE gender END AS gender ,CASE WHEN age IS NULL THEN '무응답' WHEN age SQL_Intermediate 02. 날짜 시간별 분석 2. 날짜 시간별 분석 Q6. 2020년 7월의 평균 DAU를 구해주세요, Active User 수가 추세 증가하는 추세인가요? DAU(Daily Active Users)는 일별 활동 사용자 수를 의미합니다 DAU의 이해,Date Format 함수사용, 시간대 바뀌지 않는지 체크추세확인 SELECT DATE_FORMAT(visited_at, "%Y-%m-%d") AS date_at , count(DISTINCT customer_id) FROM tbl_visit WHERE visited_at >= '2020-07-01' AND visited_at < '2020-08-01' GROUP BY 1; - 7/1 수가 이상하게 적음이 확인된다. SELECT DATE_FORMAT(visited_at - interva.. SQL_Intermediate 01. 서비스 이해 문제 모음 01. 서비스 이해 문제 모음 기초 데이터 인풋 Q1. 2020년 7월의 총 Revenue를 구해주세요 집계함수 사용WHERE절에 DATE 필터SQL문 실행 순서: 구분 분석 > FROM > WHERE > SELECT 순WHERE 절에 사용하는 것이 속도 향상 SELECT SUM(price) FROM tbl_purchase WHERE purchased_at >= '2020-07-01' AND purchased_at < '2020-08-01'; Q2. 2020년 7월의 MAU를 구해주세요 ACTIVE USER의 이해 COUNT 함수 이해 - COUNT(*) : 모든 rows 카운팅 - COUNT(customer_id) : customer_id의 null 값 제외 카운팅 - COUNT(DISTINCT cus.. SQL_Basic_09_Day 10. 조건에 조건 더하기 Day 10. 조건에 조건 더하기 1. 조건에 조건 더하기 서브쿼리 서브쿼리 특징 하나의 쿼리 내 포함된 또 하나의 쿼리를 의미. 서브쿼리는 반드시 괄호 안에 있어야 한다. SELECT, FROM, WHERE, HAVING, ORDER BY 절에 사용가능. INSERT, UPDATE, DELETE 문에도 사용가능. 서브쿼리에는 ; (세미콜론)을 붙이지 않아도 된다. 2. SELECT절의 서브쿼리 스칼라 서브쿼리라고도 한다. SELECT절의 서브쿼리는 반드시 결과값이 하나의 값이어야 한다. SELECT절의 서브쿼리 문법 SELECT [컬럼이름], ( SELECT [컬럼이름] FROM[테이블이름] WHERE조건식) FROM[테이블이름] WHERE조건식; SELECT절의 서브쿼리 예제 3. FROM절의 서브쿼.. 이전 1 ··· 30 31 32 33 34 35 36 ··· 40 다음