데이터 엔지니어

[Tableau] (1) 온라인 기초 실습 본문

데이터 엔지니어링(Data Engineering)/대시보드(Dashboard)

[Tableau] (1) 온라인 기초 실습

kingsmo 2020. 8. 24. 10:33

태블로 온라인 기초 실습 교육 진행 과정에 대해 포스팅 해보겠습니다.

태블로는 다양한 학습자료를 제공하는데요.(생각보다 잘되어있어서 놀랐음 ㅇ0ㅇ) 무료 동영상도 자세하게 되어있고 백서도 지원하고 있어 필요하시면 참고하시면 될 것 같습니다.

 

저는 따로 강의를 들을 예정이라 태블로 컨설턴트 분들이 웹세미나로 진행했던 기초 실습 교육 자료를 볼 예정입니다.

https://www.tableau.com/ko-kr/learn/webinars 여기서 여러 세미나 녹화본들을 볼 수 있습니다.

 

웹 세미나

학습 온디맨드 웹 세미나 사전 녹화된 웹 세미나의 전체 라이브러리에 액세스할 수 있습니다. 이벤트 페이지에서 예정된 실시간 웹 세미나에 대해 알아보십시오.

www.tableau.com

저 같은 경우는 온라인 기초 실습 교육 영상으로 진행하였습니다. (약 1시간 50분입니다.)

만약 영상을 처음 보시면 인증이 필요할 겁니다. 사용자 정보 입력해 주고 진행해 주시면 됩니다.

교육 시작 화면


강의

태블로의 세부 조작 방법에 대해선 강의에 있으니 설명하지 않을 예정입니다. 주요 기능이나 개념, 강의에 개괄적인 내용만 포함할 계획입니다. 따라하실 분은 위의 링크의 영상을 참고해주세요!

1. WHY Tableau?

데이터 기반 사회에 도달함에 따라 데이터 시각화에 대한 니즈가 많이 늘었다고 생각합니다.

그에 따라 대시보드의 활용이 늘어나고 있고, 태블로는 그 중에서도 점유율이 높은 대시보드 툴로 알고 있었습니다.

해당 강의에서도 대시보드를 사용하는 이유를 제가 생각한 이유와 비슷하게 들고 있었는데요.

1. 개인 - 시간 절약
2. 팀 - 신속한 의사 결정
3. 기업 - 데이터 기업 기반 문화 정착

이러한 이유 때문에 대시보드를 사용한다고 말했습니다.

또한, 태블로는 분석과정 => 원하는 질문에 대한 대답을 찾아과는 과정 이라는 명언을 하며 단순한 시각화 툴이 아닌 의사결정에 꼭 필요한 요소로 설명을 하였습니다. 대시보드를 사용하는 목적에 대해 설명하였습니다.

 

그 이후 태블로에 대한 설명이 있었습니다.

 

주요 기능

  • Tableau Prep 데이터 결합/정리/변형
  • Tableau Desktop 분석/시각화
  • Tableuau Online/Server 데이터 공유

사용자 그룹

  • Creator - 데이터 전처리 / 시각화 분석
  • Explorer - 웹 상에서 편집 / ad hoc 분석
  • Viewer - 데이터 조회 / 열람

아래 사진은 위에 말한 기능과 그룹을 도식화한 자료입니다.

태블로 기능 및 사용자 그룹

 

 

2. 데이터 업로드 및 조작

태블로 다운로드는 이전 블로그를 참고해 주세요.

 

데이터: 가구 사무기기 사무용품 판매 리테일 업체의 매출 및 반품 데이터

데이터 예시

데이터 연결

  • 태블로 연결 - 태블로 내부 데이터 사용
  • 파일에 연결 - Excel / Jsoin / PDF 등등 
  • 서버 연결 - Coludera hadoop / google bigquery / Amazon EMR / mongoDB 등등

이번 실습은 파일로 진행하지만 서버 연결에서 다양한 클라우드 자원들을 지원해주는 것 보고 놀랐습니다. (안되는게 없을 정도...)

 

엑셀 파일 업로드 후 컬럼 조정

  • 데이터 분할 ex) IN-2018-27828 => IN / 2018 / 27828 각각의 컬럼으로 분할하고 삭제 또는 조정 가능
  • 데이터 타입 변경 ex) 날짜 , 지리적 역할(국가, 시도, 시군구) 변경

매출 데이터 반품 데이터 조인

데이터 조인

JOIN 설명은 생략하겠습니다.

제가 조인 관련하여 참고했던 블로그 중에 제일 잘 정리했던 블로그는https://futurists.tistory.com/17 여기였습니다.

 

태블로 동작

  • 라이브방식: VizQL 생성 Driver를 통해 DB에서 SQL 실행 (아래 사진의 플로우)

  • 추출:  데이터를 가져와서 빠르게 분석할 수 있는 hyper라는 파일을 만듬(100 메가 200메가) 메모리에 올려놓고 좀더 빠르게 분석

 

여기까지 데이터를 업로드 하여 조작하고 데이터를 보여주는 것 까지 하였습니다.

 

3. 데이터 분석 및 시각화

3-1. 제품별 매출 수익

제품별 매출 수익

계층화된 제품 컬럼을 가지고 각 제품의 합계를 표시한 시트 입니다. 간단하게 드래그 앤 드랍으로 할 수 있었습니다.

추가적으로 수익에 대한 정보도 확인하고 싶어 색깔로 삽입한 시트입니다.

해당 데이터 같은 경우는 탁자 제품에서 수익이 마이너스에 해당하는 정보를 얻을 수 있었습니다.

 

3-2. 매출/수익의 트렌드

매출/수익 트렌드

주문일자에 따라 매출과 수익이 어떻게 변하는지 확인한 시트입니다. 연도별 / 분기별 / 월별로 확인할 수 있고 제품이나 도시별로 필터를 걸어 데이터를 확인할 수도 있습니다.

해당 데이터 같은 경우 탁자에 대한 정보만 보니 수익이 계속 떨어져 감을 확인할 수 있었습니다.

3-3. 지역별 수익성

이전에 컬럼 타입을 지리적 위치로 지정해 놓아서 할 수 있던 작업입니다. 지역에 따라 마크나 색깔을 주어 표시할 수 있습니다. 이것 또한 필터를 걸어 탁자의 정보만 확인할 수 있었습니다.

여기 까지는 탁자가 수익이 악화되고 있고 전체적인 지역에서 악화되고 있는 사실을 깨달았습니다. 하지만 Why?에 대한 해답을 얻을 수 없었습니다.

 

3-4. 할인률 문제

할인률 문제

그래서 각 고객의 데이터를 가져와 할인율과 수익의 상관관계를 분석하니 할인률이 높아질수록 수익이 급격히 감소함을 볼 수 있었습니다. 단순한 시각화만이 아닌 분석의 이유를 찾은 케이스입니다.

 

3-5 대시보드

대시보드

여태까지 만든 시트들을 하나의 대시보드 창에다 포함하여 만들 수 있습니다. 그리고 첫번째 창에서 필터를 적용하면 해당 데이터 클릭으로 탁자의 데이터만 자동으로 확인할 수 있습니다.

 

4. 태블로 온라인에 개시

위에서 만든 대시보드를 태블로 온라인에 개시해보겠습니다. 잘 만들어서 혼자만 가지고 있으면 안되니까요....

전체 화면

상단 바 - 서버 - 통합 문서 개시를 누르면 해당 창이 뜹니다. 내용 적어주고 게시 버튼을 누르면 사이트에 자동으로 올라갑니다!

태블로 온라인이 설치 안되어 있으면 설치 진행하시면 본인만의 사이트가 개설될 겁니다 ㅎㅎㅎ

개시된 화면

태블루 온라인에서는 알림(수익률이 10% 하락하면)이나 댓글기능 멘션기능들을 사용할 수 있습니다. 또한, 원본데이터를 따로 올림으로써 다른 사용자들도 기존에 desktop에서 하던 작업들을 웹에서 같이 진행할 수 있습니다.

 

저는 아래 사이트에 게시 해놓았습니다. 조회할려면 태블로 아이디가 필요합니다.

https://prod-apnortheast-a.online.tableau.com/#/site/kingsmo/views/_0/1?:iid=11

 

잘 되어 있는 시각화 자료들은 여기에서 볼 수 있습니다.


후기

처음으로 태블로를 사용해 보았습니다.

집계쿼리를 자동으로 안짜도 되는 점이 너무 매력적으로 다가왔습니다.

드래그 앤 드랍이나 버튼만으로도 그룹별 분석이 가능하다는 점이 정말 편리했습니다.

그리고 실시간으로 데이터를 대시보드에 보여주는 점도 좋았고, 필터 조건도 자동으로 거는 점도 좋았습니다.

단점은 UI/UX적인 부분을 기존에 사용해보지 못했다면 어색할 것으로 생각이 됩니다.

익숙만 해지면 강력한 도구로서 사용할 수 있을 거라고 기대가 됩니다.

이번에 2주간 태블로 교육을 받게 되는데 태블로의 다양한 활용방법들에 대해 포스팅할 예정입니다. 긴 글 읽어주셔서 감사합니다.

 

 

 

 

 

 

 

Comments