목록데이터 엔지니어링(Data Engineering)/대시보드(Dashboard) (12)
데이터 엔지니어
강의 오늘은 태블로 교육의 마지막입니다! 마지막 강의는 시각화나 분석이 아닌 tableau prep builder를 통한 데이터 정리를 하는 시간이였습니다. 흔히 말하는 데이터 전처리 과정입니다. 제가 데이터 엔지니어링을 하고 싶고 좋아하는 이유가 여기에 있는데 분석의 스킬이나 기술도 중요하지만, 저는 분석의 데이터 인프라를 서포트하고 기본적인 전처리는 하여 분석에 용이한 데이터를 제공하는 부분도 중요하다고 생각했기 때문입니다. tableua prep같은 경우도 인프라적인 요소는 포함은 못하지만 여러 곳에 산재된 데이터를 하나의 데이터로 'JOIN' 이나 'UNION'을 통해 통합 시켜주고 잘못된 Column이나 데이터의 차이들을 쉽게 볼 수 있는 도구입니다. 자세한 내용은 아래링크 참조해주시고 과제를 ..
강의 오늘 강의는 여태까지 배운 것들을 총망라하는 시간이였습니다. 좋은 시각화가 무엇인지 태블로에서 요구하는 베스트 프랙티스(Best Practice)가 어떤 것인지 배웠습니다. 과제도 기존 대시보드를 더 보기 좋은 대시보드로 변경시키는 과제였습니다. 좋은 시각화를 위한 5가지 원칙을 소개해 드리겠습니다. 5가지 원칙 질문으로 시작하기 (Start with questions) 적합한 차트 유형 선택 (Choose the right chart type) 효과적인 뷰 만들기 (Create effective views) 총체적인 대시보드 디자인 (Create holistic dashboards) 작업을 완벽하게 (Perfect your views) 이 외에 좋은 시각화를 위해 어떤 작업들을 할 수 있는지는 아..
강의 오늘은 집합에 대해서 배웠습니다. 집합 뷰에서 마크들을 선택해서 집합을 만들 수 있습니다. (상수 집합) 차원을 우클릭 해서 정해진 값들로만 집합을 만들 수도 있습니다. 집합은 필터랑 비슷한데 차이점을 살펴보면 필터 같은 경우는 고정되어 있고 차원내의 값들로만 필터를 걸 수 있습니다. 하지만, 집합은 '김'으로 시작하는 고객들, 10만원 이상인 품목들 등 조건을 걸거나 명시적으로 집합을 지정할 수 있습니다. 자세한건 역시 과제에서 보여드리겠습니다! 1. 선택한 집합(지역)에 따른 대시보드 활성화 아래와 같이 강원도를 클릭하면 강원도 집합에 따른 매출을 파란색 으로 표시해주는 대시보드를 만드는 것입니다~ 1. '지역별 매출 현황' 시트로 가서 '시도' 필드를 우클릭 -> 만들기 -> 집합 으로 해서 ..
강의 오늘은 다양한 차트와 알약모양과 필터에 대해 배웠습니다 다양한 차트 범프 차트: 라인 차트의 일종으로 순위 변화를 쉽게 보여줌 / 퀵 테이블 계산에서 순위로 변경하면 됨 워터폴 차트: 하나의 차원을 따라가며 누적되는 값을 보여줌 / 각 멤버가 총계값에 얼마나 기여하는지 양수 음수로 보여줌 퍼널 차트: 몇명의 고객이 어느 그룹에 있는지를 보여줌 각 차트에 대해 간략히 설명해 보았습니다. 자세한건 과제에서 보여드리겠습니다. 알약 모양유형 차원 측정값을 행이나 열 등에 가져다 놓으면 알약모양으로 생깁니다. 차원: 자체적으로 뷰에 표시 = 불연속형 = 기본 파란색 측정값: 집계되어 뷰에 표시 = 연속형 = 기본 녹색 대부분 측정값은 연속형, 차원은 불연속형 이지만 100퍼센트는 아닙니다. 그리고 서로 변경..
강의 오늘은 테이블 계산 / LOD표현식(세부수준 계산식) 에 대해 배웠습니다. 오늘 내용은 조금 깁니다..... 테이블 계산 테이블 계산은 기본적으로 뷰의 반환 결과후에 수행 됩니다. 아래 그림처럼 테이블 계산식은 “Raw Data”를 “집계한 값 (Aggregation)”을 가지고 “테이블 계산 (Table Calculation)”을 실행합니다. 기본적으로 태블로는 집계 값을 통해 시각화를 합니다. 이 때의 집계의 기준은 "시각화의 세부 수준"에 따라 결정됩니다. 시각화에 추가되는 차원에 따라 집계의 기준이 변경됩니다. 용어들이 너무 어려운데 결론은 아래 그림에 빨간 부분들에 해당하는 부분들이 차원에 해당합니다. 그리고 그 추가되는 차원에 따라 "집계의 기준"이자 "시각화의 세부 수준"이 변경 되는 ..
강의 오늘은 태블로에서의 맵 이미지, 매핑 기능 등을 배웠습니다. 지리적 데이터를 쓸 때 주로 쓰는 기능들인데요. 태블로는 좌표(위도, 경도)를 10진수로 표현해 사용합니다. 기호로 표시할 수도 있고, 영역으로 표시할 수도 있고 사용자 정의로 다각형 맵으로 표현도 가능합니다. 또한, 사용자의 이미지 ex) 지하철 노선도 를 가져와 맵으로 사용할 수도 있습니다. 과제에서 직접 보여드리겠습니다! 과제 1. 2호선 역별 승하차인원수 1. 상단 메뉴 - 맵 - 배경이미지 - 데이터 - 이미지 추가에서 노선도 이미지를 맵으로 사용해 줍니다. 아래와 같이 설정해 줍니다. X, Y는 이미지이 넓이와 높이입니다. 커스텀 이미지를 넣기 때문에 픽셀단위로 위도 경도처럼 사용하기 위함입니다. X, Y는 데이터 내에 이미 존..
강의 오늘 강의에서는 테이블 계산 / 측정값 이름 및 측정값에 대해 배웠습니다. 1. 테이블 계산 테이블 계산은 뷰에 보여주는 방식을 결정하는 것 입니다. 예를 들면 그래프를 합계로 표현할지 평균으로 표현할지 전년도와 비율차이로 표현할지, 년도별로 보여줄지 월별로 보여줄지 등을 전부 테이블 계산에서 설정할 수 있습니다! 자세한 그림은 과제에서 보여드리도록 하겠습니다. 2. 측정값 이름 및 측정값 한 뷰 내에서 여러가지 측정값(그래프)를 보고 싶을 때 필요한 기능입니다. 측정값이라는 기본필드가 주어지는데 해당 필드에서 원하지 않는 필드를 제거하고 사용하면 된다. 이것도 과제에서 보여드리도록 하겠습니다! 과제 1. 월별 미세먼지 평균 지수 1. 행에 PM10(미세먼지 지수) 열에 기준년월을 위치시킵니다. 2..
강의 오늘은 매개변수 / 대시보드 상호작용 / 데이터 설명에 대해서 배웠습니다. 1. 매개변수 매개변수: 최종 사용자가 값을 제어할 수 있는 변수를 나타냄 이전 과제에서 비슷한 시각화를 한 적이 있습니다. 하지만 차이점이 보이시나요?? 오른쪽에서 측정값 선택이나 카페인 함유량 기준 변경을 통한 동적인 시각화를 표현할 수 있습니다. 매개변수로 인한 상호작용성 증가를 도모할 수 있습니다. 만드는 과정 1. 매개 변수 만들기 2. 계산된 필드 만들어 매개변수 사용하기 3. 뷰에서 계산된 필드를 사용 4. 매개 변수 컨트롤 보여주기 이러한 식으로 진행되는데 자세한건 과제에서 보여드리겠습니다. 2. 대시보드 상호작용 매개변수 처럼 직접적으로 필터 거는 것이 아닌 마우스 오버나 필터 url등으로 상호작용 할 수 있..