본문 바로가기

Tableau/Tableau Exercize

Tableau Exercise 03

#01 Revenue Development

 

넷플릭스의 수익 대해 지역별 / 분기별로 하이라이트 표를 아래와 같이 만들어보자.

 

연속형 분기 표시를 누르고 불연속형으로 지정하면 아래와 같은 표가 생성된다.

 

지역 테이블을 열칸, 수익 테이블을 마크카드의 레이블과 색상에 넣고,

마크카드의 사각형을 선택 하면 아래와 같은 하이라이트 표가 생성된다.

 

 

 

 

#02 Subscribers Changes

이것도 마찬가지로 #1과 같은 방식으로 만들면 된다. 

 

 

 

 

블랜딩

 

조인, 유니온 말고도 데이터 테이블을 손쉽게 가져오는 방법은 블랜딩이다. 데이터 -  혼합 관계 편집을 누르고 

혼합관계에 추가를 누르고, 블랜딩의 기준이 되는 열을 추가한다.

 

아래 사진에서는 NeflixRevenue 와 NeflixSubscribe에서 공통된 열인 Area와 Date를 사용하여 블랜딩을 하는 모습이다.

 

블랜딩 된 테이블의 왼쪽 끝에 주황색 줄이 있는 것을 볼 수 있다. 이는 블랜딩된 데이터의 필드를 표시해 준다. 

 

 

 

connected scatter plot

 

블랜딩으로 연결된  NeflixRevenue 와 NeflixSubscribe 사용해, 수익과 구독자의 연관 관계를 지역별, 분기별로 나타낸 그래프는 아래와 같다.

 

처음 수익을 행에 놓고 연속형 분기, 그리고 지역 테이블을 마크라인에 넣으면 아래와 같다.

여기에 블랜딩으로 연결된 Subscribe(구독자수)를 열에 넣으면 그래프가 완성된다.

 

 

 

필터

 

필터에는 차원필터와 측정값 필터가 있다. 

차원을 필터에 올리면 차원필터,

측정값을 필터에 올리면 측정값 필터 인 것이다.

superstore KR파일에서 시도별 매출을 나타낸 그래프를 만들어 보았다.

 

여기서 Product Category를 필터로 사용하여 보면 아래와 같은 필터가 표시된다.

이를 통해 제품 카테고리별 시도별 매출을 확인할 수 있다.

 

 

또한 필터에 마우스 오른쪽 버튼을 누르면 단일값과 다중값의 선택지가 나오는데, 단일값은 필터를 단일 값으로만 설정할 수 있고, 다중값은 필터를 여러 값으로 지정할 수 있다.

또 Order Date에 필터를 적용해보자.

 

 

위와 같이 차원 필터 두개를 이용하여, 전체 그래프중 일부만 나타낸 모습을 확인 할 수 있다.

 

 

이번엔 측정값 필터를 보자. 

우선 제품별 할인률과 수익에 대한 산점도 차트를 가지고 필터를 적용해보자.

 

 

Sales를 마우스 오른쪽으로 필터카드에 드래그하면 필터 필드의 값을 선택하라고 나온다.

이때 합계를 선택하고 값범위를 3,000,000으로 제한하면 아래와 같이 된다.

 

 

이때 합계(Sales)의 의미는 제품별 매출의 합계를 의미한다. 따라서 위의 산점도는 제품별  sale의 합계가 300만보다 작은 제품들의 수익과 할인률의 산점도라고 할 수 있다.

 

 

반면 필터 필드의 모든값으로 적용하면, 필터를 300만으로 적용했을 때, 제품별 매출의 합계가 아닌 각 주문별 매출이 300만보다 작은 값이 표시된다.

즉,  엑셀에서 행 자체의 sales 값을 3,000,000만이하 인 값만 표시한다는 것이다.

 

 

 

 

데이터 원본 필터

 

데이터 원본에서, 실제 시트로 넘어가기 전에 필터를 적용할 수 있다.

이는 데이터 원본을 건드리지는 않지만, 시트에서 적용되는 데이터에 적용할 수 있다.

 

 

 

 

 

문제풀이

 

Orders from Superstore KR - VizLab 2022.xlsx

 

데이터 원본 필터를 활용하여 고객 세그먼트(Customer Segment) 필드에서 기업 고객만

화면으로 불러와봅시다. 수도권 지역(서울특별시, 인천광역시, 경기도)의 수익(Profit)을 모두 합한 값은 얼마인가요?

 

 

역시 기업 고객 데이터를 계속해서 사용합니다. 매출(Sales)과 수익(Profit)을 활용하여 스캐터 플랏을 만든 후 시도와 시군구로 화면을 분기해봅시다. 측정값 필터를 활용하여 매출이 1,500만원보다 적고, 수익이 -50만원에서 50만원 사이에 있는 시군구만 화면에 남겨봅시다. 총 몇 개의 시군구가 화면에 남아있나요?

 

 

 

World Indicators.csv

 

• 연도(Year), 국가/지역(Country/Region), 유아 사망률(Infant Mortality Rate) 필드를 활용하여 하이라이트 테이블을 만들어봅시다. 중동 지역 국가 중에 2000년대 중반까지 압도적으로 높은 유아 사망률을 기록한 나라는 어디인가요

 

 

 

 

NHIS OPEN SIMPLE.csv

 

• 20~30대 남녀 검진자의 평균 신장과 평균 체중은 각각 얼마인가요? 테이블 형태로 확인해봅시다

 

 

 

TOP N 필터 / 태블로의 작동순서

 

매출 상위 10명 뽑기

 

 

아래 필드는 두 필드가 독립적으로 작용

 

 

 

 

아래 필드는 순차적으로 Customer Name 상위 필터 , 그다음 지역 필터로 적용됨 

따라서 지역 선택하면 기존에 해당하는 상위 10명만 계속 나오게 된다.

 

 

상위 10명이 되는 이유 -> Top N 필터가 작동 순서에 위에 있음

Top N의 필터가 Dimension 필터보다 먼저 작동함

해결방법은 Dimension 필터를 -> Context 필터로 만들어 주면 된다.

 

 

 

 

현황판 만들기

 

 

Dimension 필터에 2021년 12월 달만 필터

Table Calculation 이전 달이 없어서 나오지 않음

이를 해결하기 위해 LAST()라는 함수를 사용하자.

LAST( ) 라는 함수는 현재 행에서 파티션에 있는 마지막 행까지의 행 수를 반환하는 함수이다.

Dimension 필터 --> Table Caculation 필터 적용! 

 

 

 

 

전월 12월 , 21년 11월, 12월 순으로 Sales(매출)을 바차트로 나열하려면 아래와 같이 해야한다.

 

 

 

 

 

문제풀이

 

• 수축기 혈압 (구간 차원)과 이완기 혈압 (구간 차원)을 활용하여 검진자의 분포를 보여주는 하이라이트 테이블을 구성해보세요. 어떤 구간에 여성 검진자가 가장 많이 집중되어 있나요?

수축기 혈압 140 이상, 이완기 혈압 90 이상을 고혈압으로 정의할 때 몇 명의 여성 검진자가 고혈압으로 분류되나요? 이는 여성 검진자 전체 대비 몇 % 수준인가요?

 

 

 

 

이중축

 

 

 

 

 

결합축

 

 

 

 

이중축 - 마크카드가 따로따로 나옴 => 개별 설정 가능

결합축 - 마크카드가 하나이다 => 개별 설정 불가능

이중축은 2개가 최대, 결합축은 측정값 카드 안속에 여러개의 값을 삽입할 수 있다.

또한 결합축은 규모가 비슷해야 설정할 수 있다. 

 

 

 

 

도넛차트

 

 

 

 

 

 

 

 

'Tableau > Tableau Exercize' 카테고리의 다른 글

Tableau Exercise 05  (2) 2022.09.14
Tableau Exercise 04  (1) 2022.09.13
Tableau Exercise 02  (0) 2022.09.06
Tableu Exercise 01  (0) 2022.09.05