로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

스파크 완벽 가이드

   
지은이 빌 체임버스, 마테이 자하리아   |   출판사 한빛미디어  |   발행일 2018년 12월 10일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 48,000원43,200원 10%
마일리지 0% 0원
발행일 2018-12-10
ISBN 1162241284 | 9791162241288
기타정보 번역서 | 796쪽
예상출고일 1~2일 이내 (근무일기준)
배송비 무료배송
   
일반
   
 

스파크 창시자가 알려주는 스파크 활용과 배포, 유지 보수의 모든 것. 오픈소스 클러스터 컴퓨팅 프레임워크인 스파크의 창시자가 쓴 스파크에 대한 종합 안내서다. 스파크 사용법부터 배포, 유지 보수하는 방법까지 포괄적으로 익힐 수 있다. 스파크 2의 개선점과 새로운 기능을 자세히 설명합니다. 구조화된 스파크 API의 특징과 공통 기능은 물론이고, 엔드 투 엔드 스트리밍 애플리케이션을 구축하는 새로운 고수준 API인 구조적 스트리밍을 함께 살펴본다. 스파크를 모니터링, 튜닝, 디버깅하는 데 필요한 기본 지식을 습득할 수 있다. 나아가 스파크의 확장 머신러닝 라이브러리인 MLlib을 사용하는 방법과 시나리오를 익힐 수 있다.
Part 1 빅데이터와 스파크 간단히 살펴보기 CHAPTER 1 아파치 스파크란 1.1 아파치 스파크의 철학 1.2 스파크의 등장 배경 1.3 스파크의 역사 1.4 스파크의 현재와 미래 1.5 스파크 실행하기 1.6 정리 CHAPTER 2 스파크 간단히 살펴보기 2.1 스파크의 기본 아키텍처 2.2 스파크의 다양한 언어 API 2.3 스파크 API 2.4 스파크 시작하기 2.5 SparkSession 2.6 DataFrame 2.7 트랜스포메이션 2.8 액션 2.9 스파크 UI
지은이_ 빌 체임버스(Bill Chambers)

2014년에 몇몇 연구 프로젝트에 스파크를 도입했습니다. 데이터브릭스에서 제품 관리를 맡고 있으며 사용자들이 다양한 아파치 스파크 애플리케이션을 개발할 수 있는 환경을 만들기 위해 노력하고 있습니다. 또한 정기적으로 스파크와 관련된 블로그를 작성하고 콘퍼런스 발표와 밋업에 참여하고 있습니다. UC버클리 대학교 정보대학원에서 정보 관리와 시스템 분야의 석사학위를 취득했습니다.

지은이_ 마테이 자하리아(Mate Zaharia)

2009년에 아파치 스파크 프로젝트를 시작했고 UC버클리 대학교 박사 과정 동안 스파크와 함께 했습니다. 버클리의 여러 연구원 및 외부 공동 작업자와 함께 스파크의 핵심 API를 설계하고 스파크 커뮤니티를 성장시키고 있으며 구조적 API와 구조적 스트리밍 같은 새로운 개념을 만드는 데 참여하고 있습니다. 2013년 마테이와 버클리 스파크 팀은 오픈소스 프로젝트의 성장을 도우려 데이터브릭스를 설립하고 상업용 제품을 제공하기 시작했습니다. 현재 데이터브릭스의 최고 기술 전문가로 일하고 있으며 스탠퍼드 대학교의 컴퓨터 과학 분야 조교수를 맡아 대규모 시스템과 인공지능 분야를 연구하고 있습니다. 2013년에 UC버클리 대학교에서 컴퓨터 과학 박사학위를 취득했습니다. 마테이는 아파치 메소스 프로젝트의 초기 멤버이자 아파치 하둡의 커미터입니다. 마테이의 연구 내용은 2014 ACM Doctoral Dissertation Award 및 VMware Systems Research Award를 수상하며 인정받았습니다.

옮긴이_ 우성한

현재 빅데이터 솔루션 전문 업체인 kt NexR의 책임 연구원으로 재직 중입니다. 모바일 게임, SNS 서비스, 결제 시스템 등 다양한 SW 분야에서 개발한 경험이 있으며, 2011년 빅데이터의 매력에 빠져 이 분야의 오픈소스를 다루기 시작했습니다. kt NexR의 대표적인 빅데이터 분석 솔루션인 NDAP 개발에 참여했으며, 지금은 아키텍처 설계부터 프론트엔드/백엔드 개발까지 수행하는 풀 스택 엔지니어로서 실시간 빅데이터 처리/분석 솔루션을 개발하고 있습니다.

옮긴이_ 이영호

현재 kt NexR에서 R&D2 팀장을 맡고 있습니다. 시스템 통합과 빅데이터 솔루션 개발을 수행하던 멤브로스 대표를 역임했습니다. kt NexR에 빅데이터 엔지니어로 입사한 후 살아 있는 빅데이터를 경험했습니다. 다수의 배치/실시간 빅데이터 프로젝트에 참여했으며, 기술서적 번역과 빅데이터 강의를 즐깁니다. 현재 팀원들과 함께 아파치 스파크 기반의 빅데이터 처리 솔루션을 개발하고 있으며 빅데이터의 대중화에 큰 관심을 가지고 있습니다.

옮긴이_ 강재원

현재 kt NexR에서 Data Science 팀장을 맡고 있습니다. SPSS Korea에서 분석 솔루션을 기반으로 다양한 도메인에서 분석 컨설턴트로 활동했습니다. kt NexR에 데이터 사이언티스트로 합류한 후 국내 최초 금융권 빅데이터 분석 프로젝트를 성공적으로 수행하면서 지금까지 다양한 기업을 대상으로 데이터 분석의 가치와 최적 방법론을 전파하려 노력하고 있습니다. 최근에는 스파크를 기반으로 텐서플로 등과 같은 다양한 프레임워크를 활용한 분석 방법론을 연구하고 있습니다.



출판사 서평/리뷰
스파크 활용과 배포, 유지 보수까지 전체적 흐름을 포괄적으로 안내하는 바이블

이 책은 쉽게 실행할 수 있는 스파크 예제와 모든 유형의 기본 사용 사례를 다루는 스파크 종합 안내서입니다. 스파크의 기초적인 내용부터 처리, 운용, 관리, 모니터링 그리고 그래프와 머신러닝에 이르기까지 다양한 내용을 종합적으로 설명합니다. 특히 스파크 2.0 기반의 고수준 신규 API인 DataFrame, Dataset, 스파크 SQL, 구조적 스트리밍(Structured Streaming)을 집중적으로 소개합니다. 스파크를 사용하려는 데이터 과학자와 데이터 엔지니어에게 많은 도움이 될 내용으로 구성했습니다.



이 책의 번역 품질을 최고로 높이기 위해 동분서주했던 역자들의 뼈를 깎는 노고를 언급하지 않을 수 없습니다. 매일 밤을 새우다시피 하며 방대한 분량의 원서를 수십 차례에 걸쳐 다듬고 소스 코드를 수정했으며, 열 명도 넘는 업계 실무자들을 치킨으로 유혹(!)하여 수 차례에 걸친 가혹한 베타 리딩 과정을 거쳤습니다. 원서에는 없는 ‘실행 환경 구축’에 필요한 구체적인 내용과 ‘스파크 서밋 2017 더블린 참관기’도 따로 집필하여 부록으로 실었습니다. 한편으로는 독자가 조금이라도 더 친근하고 편안한 느낌으로 읽을 수 있는 문장을 만들고자 노력했습니다. 이러한 담금질을 거쳐 탄생한 이 번역서가 여러분을 경이로운 스파크의 세계로 편안하게 인도해줄 것입니다.

--

등록된 서평이 없습니다.
디지털 논리회로...
임석구
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
Cocoa Internals...
김정
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
커니의 코틀린...
김태호
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
 
전체평균(0)
회원평점   회원서평수 0
한빛미디어 출판사의 신간
파이썬 라이브러리를 활용한 머신러닝(번역개정판)
안드레아스 뮐러, 세라 가이도 저
28,800원
(10%↓+5%)
 
이모티콘으로돈벌기

16,200원
(10%↓+5%)
 
실습과 그림으로 배우는 리눅스 구조
다케우치 사토루 저
21,600원
(10%↓+0%)
 
PHP & MySQL 닌자 비법서
톰 버틀러, 케빈 양크 저
31,500원
(10%↓+0%)
 
맛있는 디자인 프리미어 프로 & 애프터 이펙트 CC 2019
김덕영, 심수진, 윤성우, 이수정 저
20,700원
(10%↓+0%)
 
이메일주소수집거부