목록2020/09 (24)
데이터 엔지니어
문제링크: www.acmicpc.net/problem/1744 1744번: 수 묶기 길이가 N인 수열이 주어졌을 때, 그 수열의 합을 구하려고 한다. 하지만, 그냥 그 수열의 합을 모두 더해서 구하는 것이 아니라, 수열의 두 수를 묶으려고 한다. 어떤 수를 묶으려고 할 때, 위치에 www.acmicpc.net 골드 4여서 두려웠지만, 경우의 수만 잘 따져주면 되는 문제였습니다. 문제 설명 - N: 숫자의 개수 - N개의 숫자가 주어진다. - 숫자를 2개씩 묶을 수 있다. 묶은 수는 곱하기로 계산된다. - 숫자는 단 한번만 묶거나 안 묶인다. - ex) -1, 2, 3, 1 이 주어졌을 때 최대의 값은 (-1)+1+(2*3)=6 이다. 풀이 처음에는 단순하게 정렬하여 양수의 큰 수 끼리 곱 음수의 작은 수..
강의 오늘은 태블로 교육의 마지막입니다! 마지막 강의는 시각화나 분석이 아닌 tableau prep builder를 통한 데이터 정리를 하는 시간이였습니다. 흔히 말하는 데이터 전처리 과정입니다. 제가 데이터 엔지니어링을 하고 싶고 좋아하는 이유가 여기에 있는데 분석의 스킬이나 기술도 중요하지만, 저는 분석의 데이터 인프라를 서포트하고 기본적인 전처리는 하여 분석에 용이한 데이터를 제공하는 부분도 중요하다고 생각했기 때문입니다. tableua prep같은 경우도 인프라적인 요소는 포함은 못하지만 여러 곳에 산재된 데이터를 하나의 데이터로 'JOIN' 이나 'UNION'을 통해 통합 시켜주고 잘못된 Column이나 데이터의 차이들을 쉽게 볼 수 있는 도구입니다. 자세한 내용은 아래링크 참조해주시고 과제를 ..
강의 오늘 강의는 여태까지 배운 것들을 총망라하는 시간이였습니다. 좋은 시각화가 무엇인지 태블로에서 요구하는 베스트 프랙티스(Best Practice)가 어떤 것인지 배웠습니다. 과제도 기존 대시보드를 더 보기 좋은 대시보드로 변경시키는 과제였습니다. 좋은 시각화를 위한 5가지 원칙을 소개해 드리겠습니다. 5가지 원칙 질문으로 시작하기 (Start with questions) 적합한 차트 유형 선택 (Choose the right chart type) 효과적인 뷰 만들기 (Create effective views) 총체적인 대시보드 디자인 (Create holistic dashboards) 작업을 완벽하게 (Perfect your views) 이 외에 좋은 시각화를 위해 어떤 작업들을 할 수 있는지는 아..
문제링크: https://www.acmicpc.net/problem/16236 16236번: 아기 상어 N×N 크기의 공간에 물고기 M마리와 아기 상어 1마리가 있다. 공간은 1×1 크기의 정사각형 칸으로 나누어져 있다. 한 칸에는 물고기가 최대 1마리 존재한다. 아기 상어와 물고기는 모두 크기를 가�� www.acmicpc.net 삼성 기출로 나왔던 문제입니다. 삼성 기출은 조건 확인을 확실히 해주셔야 합니다. 문제 설명 - N: 맵의 크기 - 아기 상어 초기 크기 = 2 / 크기 만큼 물고기를 먹어야 => 크기 + 1 / 상어 위치 = 9 - 지나갈 수 있는 경우: 아기 상어 크기 >= 물고기 크기 - 먹을 수 있는 경우: 아기 상어 크기 > 물고기 크기 - 먹을 수 있는 경우가 여러가지인 경우 1...
강의 오늘은 집합에 대해서 배웠습니다. 집합 뷰에서 마크들을 선택해서 집합을 만들 수 있습니다. (상수 집합) 차원을 우클릭 해서 정해진 값들로만 집합을 만들 수도 있습니다. 집합은 필터랑 비슷한데 차이점을 살펴보면 필터 같은 경우는 고정되어 있고 차원내의 값들로만 필터를 걸 수 있습니다. 하지만, 집합은 '김'으로 시작하는 고객들, 10만원 이상인 품목들 등 조건을 걸거나 명시적으로 집합을 지정할 수 있습니다. 자세한건 역시 과제에서 보여드리겠습니다! 1. 선택한 집합(지역)에 따른 대시보드 활성화 아래와 같이 강원도를 클릭하면 강원도 집합에 따른 매출을 파란색 으로 표시해주는 대시보드를 만드는 것입니다~ 1. '지역별 매출 현황' 시트로 가서 '시도' 필드를 우클릭 -> 만들기 -> 집합 으로 해서 ..
문제링크: https://programmers.co.kr/learn/courses/30/lessons/12952 코딩테스트 연습 - N-Queen 가로, 세로 길이가 n인 정사각형으로된 체스판이 있습니다. 체스판 위의 n개의 퀸이 서로를 공격할 수 없도록 배치하고 싶습니다. 예를 들어서 n이 4인경우 다음과 같이 퀸을 배치하면 n개의 퀸은 programmers.co.kr 문제 설명 - 가로 세로가 n인 크기의 체스판에 n개의 queen을 놓을 수 있는 경우의 수 - queen은 가로 세로 대각선 이동이 가능 - n = 4 인경우 아래 이미지 처럼 2가지 경우의 수가 나옵니다. 풀이 - DFS / 백트래깅 (백트래킹은 지난 https://data-engineer.tistory.com/19에서 설명한 것 처..
강의 오늘은 다양한 차트와 알약모양과 필터에 대해 배웠습니다 다양한 차트 범프 차트: 라인 차트의 일종으로 순위 변화를 쉽게 보여줌 / 퀵 테이블 계산에서 순위로 변경하면 됨 워터폴 차트: 하나의 차원을 따라가며 누적되는 값을 보여줌 / 각 멤버가 총계값에 얼마나 기여하는지 양수 음수로 보여줌 퍼널 차트: 몇명의 고객이 어느 그룹에 있는지를 보여줌 각 차트에 대해 간략히 설명해 보았습니다. 자세한건 과제에서 보여드리겠습니다. 알약 모양유형 차원 측정값을 행이나 열 등에 가져다 놓으면 알약모양으로 생깁니다. 차원: 자체적으로 뷰에 표시 = 불연속형 = 기본 파란색 측정값: 집계되어 뷰에 표시 = 연속형 = 기본 녹색 대부분 측정값은 연속형, 차원은 불연속형 이지만 100퍼센트는 아닙니다. 그리고 서로 변경..
강의 오늘은 테이블 계산 / LOD표현식(세부수준 계산식) 에 대해 배웠습니다. 오늘 내용은 조금 깁니다..... 테이블 계산 테이블 계산은 기본적으로 뷰의 반환 결과후에 수행 됩니다. 아래 그림처럼 테이블 계산식은 “Raw Data”를 “집계한 값 (Aggregation)”을 가지고 “테이블 계산 (Table Calculation)”을 실행합니다. 기본적으로 태블로는 집계 값을 통해 시각화를 합니다. 이 때의 집계의 기준은 "시각화의 세부 수준"에 따라 결정됩니다. 시각화에 추가되는 차원에 따라 집계의 기준이 변경됩니다. 용어들이 너무 어려운데 결론은 아래 그림에 빨간 부분들에 해당하는 부분들이 차원에 해당합니다. 그리고 그 추가되는 차원에 따라 "집계의 기준"이자 "시각화의 세부 수준"이 변경 되는 ..