로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

『파워 BI와 엑셀 파워 피봇을 사용한 데이터 분석 : 예제를 통해 배우는 데이터 모델링』

   
지은이 알베르토 페라리, 마르코 루쏘   |   출판사 에이콘  |   발행일 2018년 06월 29일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 30,000원27,000원 10%
마일리지 5% 1,500원
발행일 2018-06-29
ISBN 1161751696 | 9791161751696
기타정보 번역서 | 324쪽 | 일반
예상출고일 1일 (근무일기준)
배송비 무료배송
   
일반
   
이 책의 원서
  Analyzing Data with Power Bi and Power Pivot for Excel
Microsoft Press | Marco Russo
 

★ 요약 ★



정보가 넘쳐나는 시대에 이 정보들을 어떻게 얻고 또 어떻게 활용할 수 있을까? 많은 데이터를 분석하여 데이터가 갖고 있는 정보를 얻고 활용해야 한다. 이 책은 파워 BI와 엑셀의 파워 피봇이라는 데이터 분석 도구를 사용해 데이터를 모델링에 관해 설명한다. 일상적인 업무에서 접하기 쉬운 예제를 통해 데이터 모델링의 기본 개념을 소개하고 있어서 초보자도 쉽게 활용할 수 있으며 데이터 모델링에 대한 감각을 얻을 수 있을 것이다.





★ 이 책에서 다루는 내용 ★



■ 테이블, 관계, 키 등의 데이터 모델링의 기본

■ 스타 스키마와 스노우플레이크, 일반적인 모델링 기술

■ 그래뉼래러티의 중요성

■ 복잡한 데이터 모델에서 판매와 구매 같은 다중 팩트 테이블 사용

■ date 테이블을 사용한 달력과 관계된 계산 관리

■ 고객의 이전 주소나 지정된 매니저와 같은 과거 속성 추적

■ 스냅샷을 사용해 편리하게 수량 계산

■ 가장 효율적인 방법으로 여러 통화 사용

■ 중첩 될 수 있는 기간을 포함하는 이벤트 분석

■ 특정 비즈니스 요구에 필요한 데이터 모델





★ 이 책의 대상 독자 ★



파워 피벗을 사용하는 엑셀 사용자나 파워 BI를 사용하는 데이터 분석가에게 도움되는 책이다. 또는 BI 전문가 경력을 쌓기 시작하는 사람이나 데이터 모델링의 주제를 살펴보고 싶은 사람에게 추천한다.

실제로 데이터 모델링이 필요하다는 사실을 전혀 모르는 독자를 생각하며 이 책을 썼다. 데이터 모델링을 배워야 할 필요가 있다는 사실을 이해시키고 통찰력을 제공하는 것이 목표다. 따라서 데이터 모델링이 무엇이고 왜 유용한 스킬인지 궁금하다면 이 책이 필요하다.





★ 이 책의 구성 ★



1장, '데이터 모델링 소개'에서는 데이터 모델링의 개념을 간단히 소개하고 그래뉼래러티에 대해 살펴본다. 데이터 웨어하우스의 기본적인 모델, 즉 스타 스키마, 스노우 플레이크, 정규화, 비정규화를 정의한다.

2장, '헤더/디테일 테이블 사용'에서는 헤더/디테일 테이블을 사용하는 일반적인 시나리오를 다룬다. 여기서 별도의 두 팩트 테이블에 주문과 주문의 종류를 저장하는 예제를 사용하는 시나리오를 살펴보고 해결 방법을 찾는다.

3장, '다중 팩트 테이블 사용'에서는 여러 팩트 테이블이 있고 이를 종합해 보고서를 만드는 시나리오를 설명한다. 데이터를 적절한 방법으로 살펴보기 위해 올바른 디멘션의 모델을 만들어야 한다는 사실을 강조한다.

4장, '날짜와 시간 처리'에서는 이 책의 가장 긴 장으로 타임 인텔리전스 계산을 다룬다. 적절한 date 테이블을 만드는 방법과 기본적인 타임 인텔리전스(YTD, QTA, PARALLELPERIOD 등)를 계산하는 방법을 설명한다. 그 후 날짜 계산 작업, 연내 특정 기간 처리, 일반적인 date를 사용하는 작업에 대한 몇 가지 예제를 제시한다.

5장, '과거 속성 추적'에서는 서서히 변하는 디멘션을 사용하는 모델을 설명한다. 5장에서 바뀌는 속성을 추적해야 할 때 필요한 변환 단계와 서서히 변하는 디멘션을 사용할 때 현재 시점에서 DAX 코드를 작성하는 올바른 방법을 상세히 설명한다.

6장, '스냅샷 사용'에서는 스냅샷의 매력적인 면을 다룬다. 스냅샷이 무엇인지, 스냅샷을 사용해야 할 때와 사용 이유, 스냅샷을 기반으로 값을 계산하는 방법을 소개하고 강력한 변환 매트릭스 모델을 설명한다.

7장, '날짜와 시간 간격 분석'에서는 5장에서 한발 더 나아가 시간 계산을 다루지만, 이번에는 팩트 테이블에 저장된 이벤트가 기간을 갖고 이로 인해 정확한 결과를 얻기 위해 특별한 조치가 필요한 모델을 분석한다.

8장, '다대다 관계'에서는 다대다 관계를 사용하는 방법을 설명한다. 다대다 관계는 모든 데이터 모델에서 아주 중요한 역할을 한다. 일반적인 다대다 관계와 캐스케이딩 관계, 그리고 인자 재할당과 필터 사용에 대해 다루고 성능과 이를 향상시키는 방법에 대해 알아본다.

9장, '서로 다른 그래뉼래러티 사용'에서는 서로 다른 그래뉼래러티로 저장된 팩트 테이블을 사용하는 작업에 대해 더 알아본다. 팩트 테이블의 그래뉼래러티가 서로 다른 예산 예제를 살펴보고, DAX와 데이터 모델에서 제공하는 몇 가지 대안을 관찰한다.

10장, '데이터 모델 세그멘테이션'에서는 세그멘테이션 모델에 대해 설명한다. 가격에 의한 단순한 세그멘테이션에서 시작해 가상 관계를 사용하는 동적 세그멘테이션 분석까지 다루고, DAX에서 수행된 ABC 분석에 대해 설명한다.

11장, '다중 통화 작업'에서는 환전에 대해 다룬다. 환율을 사용할 때 요구 사항을 이해하고 적절한 모델을 설계해야 한다. 요구 사항이 서로 다른 몇 개의 시나리오를 분석하고 각 시나리오에 가장 좋은 해결 방법을 찾아본다.

부록 A, '데이터 모델링 101'에서는 이것은 참조용이다. 예제를 사용해 이 책에서 다룰 기본 개념을 간략하게 설명한다. 어떤 측면이 확실하지 않을 때 여기로 건너뛰어 새로 이해하고 다시 주요 장으로 돌아가도록 한다.





★ 지은이의 말 ★



파워 BI는 2015년 배포됐다. 최근 숫자를 좋아하는 사람들은 엑셀의 파워 피벗과 파워 BI를 모두 좋아한다고 말할 수 있다. 이 두 도구는 VentiPaq 데이터베이스 엔진과 DAX 언어 등 SQL Server Analysis Services에서 이어받은 많은 기능을 공유한다.

엑셀의 이전 버전에서 숫자에 대해 분석하는 것은 데이터 세트를 로드하고 칼럼을 계산하고 차트를 설계하는 계산식을 작성하는 일이었다. 워크북의 크기와 엑셀의 계산식 언어라는 제약 사항으로 인해 대량의 고속 처리를 위한 최선의 선택이 아니었다. 파워 BI와 파워 피벗의 새로운 엔진은 빠르게 발전했다. 이제 데이터베이스의 모든 기능과 멋진 언어(DAX)를 사용할 수 있다. 하지만 더 나은 기능에는 더 많은 책임이 뒤따른다. 새로운 도구를 제대로 활용하고 싶다면 더 많이 배워야 한다. 즉, 데이터 모델링의 기초를 배워야 한다.

데이터 모델링은 로켓 과학이 아니다. 데이터를 통한 분석에 관심이 있는 사람이라면 익혀야 하는 기본적인 스킬이다. 게다가 숫자를 좋아한다면 데이터 모델링도 좋아할 것이다. 그러므로 익혀야 하는 쉬운 스킬일 뿐만 아니라 믿을 수 없을 정도로 재미있다.

이 책은 일상에서 맞닥뜨릴 가능성이 높은 실용적인 예제를 통해 데이터 모델링의 기본 개념을 가르쳐준다. 복잡한 솔루션 설계를 위한 많은 어려운 결정을 상세히 설명하는 모델링 관련 복잡한 책을 쓰고 싶은 것이 아니다. 대신 컨설턴트로서 일상적인 업무에서 보게 되는 예제에 초점을 맞춘다. 고객이 요청하는 문제들 중에 일반적인 문제라고 생각되는 것들을 모았다. 그리고 이 문제들에 대해 각 예제 관련 솔루션을 제공하고 이를 어느 정도 정리해 데이터 모델링 훈련용으로 사용했다.

이 책을 끝까지 보면 데이터 모델링의 전문가가 되지 못하더라도 주제에 대한 감각을 얻을 것이다. 데이터베이스를 보고 필요한 값을 계산하는 방법을 알아내려 하고, 도움이 되는 모델로 변경하는 것에 대해 고민하기 시작한다면 이 책의 목표를 이룬 것이나 다름 없다. 또한 성공적인 데이터 모델러가 되기 위한 첫걸음을 한 것이다. 경험과 많은 실패 이후에야 훌륭한 데이터 모델러가 될 수 있을 것이다.



Chapter 1. 데이터 모델링 소개

__단일 테이블 작업

__데이터 모델 소개

__스타 스키마 소개

__객체 이름 정의의 중요성 이해

__결론





Chapter 2. 헤더/디테일 테이블 사용

__헤더/디테일 소개

__헤더 값 집계

__헤더/디테일 평면화

__결론





Chapter 3. 다중 팩트 테이블 사용

__비정규화 팩트 테이블 사용

__디멘션 간의 필터링

__모델 모호성의 이해

__주문과 청구서

____고객별 전체 청구 금액 계산

____고객별 해당 주문을 포함하는 청구 금액 계산

____청구됐을 때 주문 금액 계산

__결론





Chapter 4. 날짜와 시간 처리

__date 디멘션 생성

__자동 time 디멘션 이해

____엑셀의 자동 시간 그룹화

____파워 BI 데스크톱의 자동 시간 그룹화

__다중 date 디멘션 사용

__날짜와 시간 처리

__타임 인텔리전스 계산

__회계 달력 처리

__근무일 계산

____한 국가 또는 지역의 근무일

____여러 국가 또는 지역을 고려한 작업

__연내 특정 기간 처리

____중첩되지 않는 기간 사용

____today와 관련된 기간

____중첩 기간 사용

__주간 캘린더 작업

__결론





Chapter 5. 과거 속성 추적

__서서히 변하는 디멘션 소개

__서서히 변하는 디멘션 사용

__서서히 변하는 디멘션 로딩

____디멘션의 그래뉼래러티 수정

____팩트 테이블의 그래뉼래러티 수정

__빠르게 변하는 디멘션

__올바른 모델링 기술 선택

__결론





Chapter 6. 스냅샷 사용

__시간에 따라 집계할 수 없는 데이터 사용

__스냅샷 집계

__파생 스냅샷 이해

__전이 행렬 이해

__결론





Chapter 7. 날짜와 시간 간격 분석

__시간 데이터 소개

__단순 간격 집계

__날짜를 넘기는 간격

__교대 근무와 시간 근무 모델링

__진행 중인 이벤트 분석

__서로 다른 기간의 혼합

__결론





Chapter 8. 다대다 관계

__다대다 관계 소개

____양방향 패턴의 이해

____비가산 이해

__다대다 캐스캐이딩

__일시적인 다대다

____인자와 퍼센트 재할당

____다대다 구체화

__팩트 테이블을 브리지로 사용

__성능 고려 사항

__결론





Chapter 9. 서로 다른 그래뉼래러티 사용

__그래뉼래러티 소개

__서로 다른 그래뉼래러티의 관계

____예산 데이터 분석

____필터 이동을 위한 DAX 코드 사용

____관계를 통한 필터링

____잘못된 그래뉼래러티로 값 숨기기

____높은 그래뉼래러티 값 할당

__결론





Chapter 10. 데이터 모델 세그멘테이션

__다중 칼럼 관계 계산

__정적 세그멘테이션 계산

__동적 세그멘테이션 사용

__계산된 칼럼의 힘: ABC 분석

__결론





Chapter 11. 다중 통화 작업

__다양한 시나리오 이해

__여러 종류의 소스 통화, 보고를 위한 하나의 통화

__하나의 소스 통화, 보고서를 위한 여러 통화

__여러 종류의 소스 통화, 여러 종류의 보고서 통화

__결론





Appendix A. 데이터 모델링 101

__테이블

__데이터 타입

__관계

__필터링과 크로스필터링

__다양한 종류의 모델

__스타 스키마

__스노우플레이크 스키마

__브리지 테이블을 사용하는 모델

__측정식과 가산성

____가산 측정식

____비가산 측정식

____반가산 측정식
알베르토 페라리(Alberto Ferrari)

마이크로소프트 파워 피봇, 파워 BI, DAX, SQL Server Analysis Services에 대한 기사를 정기적으로 게재하는 SQLBI 설립자다. 비즈니스 인텔리전스(BI)에 대한 컨설턴트이자 멘토며, 종종 Microsoft Ignite, PASS Summit, SQLBits와 같은 주요 국제 콘퍼런스에서 연설한다.



마르코 루쏘(Marco Russo)

마이크로소프트 파워 피봇, 파워 BI, DAX, SQL Server Analysis Services에 대한 기사를 정기적으로 게재하는 SQLBI 설립자다. 비즈니스 인텔리전스(BI)에 대한 컨설턴트이자 멘토며, 종종 Microsoft Ignite, PASS Summit, SQLBits와 같은 주요 국제 콘퍼런스에서 연설한다.





★ 옮긴이의 말 ★



몇 년 전부터 빅데이터란 단어를 많이 들어봤을 것이다. 빅데이터란 단어가 익숙해지기 전에도 데이터란 방대한 양의 정보였으며, 지금은 그 크기가 훨씬 더 커졌다. 데이터 자체만으로는 아무 의미가 없다. 이 데이터를 잘 분석해야 의미 있는 정보가 되는 것이다. 여러분도 어떤 데이터를 보면서 이 데이터가 무엇을 의미하는지 알아채지 못한 경험이 있을 수 있다. 데이터가 주는 정보를 알기 위해 데이터 분석이 필요하고, 이를 위해 데이터 모델링 기술을 아는 것이 좋다.

데이터 분석을 하고자 데이터베이스를 사용해본 사람이라면 가끔 필요한 데이터를 가져오는 방법이 이상하다거나 혹은 제대로 요청한 것 같은데 결과가 잘못됐던 적이 있을 것이다. 데이터 모델링이 잘못됐을 수 있고, 혹은 사용자가 데이터 모델을 잘 이해하지 못한 채 사용하기 때문일 수 있다. 이 책은 우리가 쉽게 접할 수 있는 데이터 분석 툴인 파워 BI와 파워 피봇을 사용하여 데이터 모델링에 대해 소개하고 있다. 더불어 데이터 모델링의 예시와 잘못된 모델이나 모델을 잘못 사용하는 예시도 함께 소개한다. 모델링의 기본 요소와 기술들을 살펴보고 더 훌륭한 데이터 모델을 만드는 기초로 활용할 수 있을 것이다.





★ 옮긴이 소개 ★



이지은

컴퓨터공학을 전공하고 피처폰용 모바일 브라우저 개발을 시작으로 개발 업무를 맡았다. 이후 안드로이드앱 개발 프로젝트에 참여했으며 최근 통신사 과금 검증, 플랫폼 운영 등의 업무를 했다. 현재는 기술 번역에 집중하고 있다. 기술 전문가 그룹 GoDev의 멤버로 활동하고 있다.

등록된 서평이 없습니다.
좋은 사진을 만드는 박승근의 드론 사진 강의...
박승근
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
이것이 우리에게 딱 맞는 딥러닝 with 텐서플로...
박재용
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
 
전체평균(0)
회원평점   회원서평수 0
에이콘 출판사의 신간
『유니티 3D RPG 게임은 이렇게 만든다: RPG 게임 개발의 시작』
바헤 카라미언 저
27,000원
(10%↓+5%)
 
『텐서플로1.x로 배우는 머신 러닝 : 실용적인 사례로 만들어보는 머신 러닝 시스템』
콴 후아, 샴스 울 아짐, 사이프 아메드 저
27,000원
(10%↓+5%)
 
『금융공학으로 R 마스터하기 : R로 거래전략을 최적화하고 내 손으로 위기 관리 시스템 구축하기』
에디나 벨린게르, 페렌츠 일레, 밀란 바딕스, 아담 바나이, 게르게이 더로치, 바바라 도모토르, 게르게리 개블러, 대니엘 허브런, 페테르 주하즈, 이스트반 마르기타이, 발라츠 마커스, 피테르 메드베예프, 줄리아 몰나, 발라츠 아르패드 슈스, 아그네스 투짜, 타마스 바다스, 커터 바러디, 어그네시 비도비츠던치 저
27,000원
(10%↓+5%)
 
『손안의 자바: 초보자를 위한 자바 프로그래밍의 핵심 + 알파』
김지훈, 이현우 저
27,000원
(10%↓+5%)
 
『대용량 머신 러닝과 스파크 : 빅데이터 기반의 머신 러닝 애플리케이션 구축』
레자울 카림, 마헤디 카이저 저
31,500원
(10%↓+5%)
 
이메일주소수집거부