데이터 엔지니어

[Tableau] (Day 1) 스타벅스 데이터 시각화 본문

데이터 엔지니어링(Data Engineering)/대시보드(Dashboard)

[Tableau] (Day 1) 스타벅스 데이터 시각화

kingsmo 2020. 8. 24. 23:50

2주동안의 태블로 교육과정이 시작되었습니다.

교육과정은 개별 강의 및 과제 형식으로 강의 요약 및 과제 해결 과정에 대해 포스팅 하겠습니다.


강의

오늘 강의는 태블로 소개와 컴포넌트들 명칭들에 대해 배웠습니다.

기본 UI

1번이 테이블에 대한 정보들 즉, 데이터 입니다. 기본적으로 태블로는 필드를 차원과 측정값으로 나누어 봅니다.

 

차원: 측정값을 쪼개어 보는 관점
측정값: 숫자 형태로 집계가 되는 데이터

 

측정값은 집계 되어 표현되기 때문에 2번에 평균칼로리 평균카페인처럼 단일 값이 아닌 집계 값이 표현됩니다. (기본은 합계(sum) 입니다).

집계: 합계, 평균, 중앙값, 카운트, 카운트 (고유), 최소값, 최대값, 백분위수, 표준편차, 분산을 의미

2번에서 열이 x축 행이 y축에 나타날 데이터들을 의미합니다. 2번에서 측정값(칼로리)를 여러가지 집계로 표현할 수 있습니다. 여기 예제에선 나오지 않았지만 날짜 데이터를 분기별 월별로 볼 수도 있고, 카테고리를 대분류 중분류 소분류로도 나누어 볼 수 있습니다. 오른쪽 클릭해서 조정하시면 됩니다!

 

3번 같은 경우는 서식을 담당하는 부분입니다. 마크의 형태나 생상 크기, 레이블 표현 등 다양한 설정을 할 수 있습니다.

위의 사진의 경우에는 평균카페인에만 색상을 설정한 화면입니다.

 

3번 위의 필터 기능도 있는데요. 이 부분은 카테고리를 추가하면 특정 카테고리 ex) 에스프레소 의 데이터만 필터되어 집계됩니다. 예제에서는 설명이 안되어 있지만 자주 쓰는 컴포넌트이기 때문에 설명드렸습니다.


과제

1. 카테고리 별 평균 칼로리와 평균 카페인

1. 카테고리를 행에 칼로리, 카페인을 열에 드래그 앤 드랍합니다.

2. 칼로리와 카페인을 평균값으로 변경해 줍니다.

3. 평균 카페인을 색상에 드래그 하여 평균 카페인만 색상을 변경해 줍니다.

 

마우스 조작 몇번으로 완성! 역시 프라푸치노가 칼로리의 대마왕이군요 ㄷㄷ

 

2. 당분 함유량과 칼로리 상관관계

1. 당류를 열에 칼로리를 행에 위치시킨다. (점 하나만 등장)

2. 세부 정보들을 보기위해 메뉴명을 세부 정보에 위치 시킵니다. (점 여러개 등장)

3. 각 점이 카페인에 대한 정보를 담고 있게 하기 위해 카페인 필드를 색상과 크기에 위치시킵니다.

4. 카페인을 평균으로 바꾸고 마크를 원으로 바꾸어 크기와 색상을 적절히 조절해줍니다.

5. 왼쪽 상단의 분석탭으로 들어가 평균선과 추세선을 추가해줍니다.

 

추세선이나 데이터의 분포를 보면 당류가 높을 수록 칼로리가 높은 것을 확인할 수 있습니다. (당 = 칼로리!!!)

 

3. 시군구 별 매장 분포 현황

1. 시도, 시군구 필드를 메인화면에 위치하면 저절로 지도가 생깁니다.

2. 매장코드를 색상과 크기에 위치시킵니다.

3. 매장분포를 보기위해 매장코드를 카운트로 변경합니다. (매장 개수 = 매장 코드 카운트)

4. 나머진 색상이나 크기 속성 설정하시면 됩니다.

 

확실히 수도권에 급격하게 밀집되어있고 광역시나 중심으로 데이터의 분포를 볼 수 있네요!

 

4. 대시보드

여태까지 한 작업들을 하나의 대시보드안에 표현해 봅니다!

이 부분은 왼쪽에 만들어논 시트를 가져다가 범례 조정하는 정도라 설명은 생략하겠습니다!


오늘 과제 완료 하였습니다!

추가과제도 있는데 진도가 하루 밀려서 다음에는 추가과제까지 해서 포스팅 하도록 하겠습니다. 

2주동안 재밌게 봐주세요~

Comments