로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

『추천 엔진을 구축하기 위한 기본서: R, 파이썬, 스파크, 머하웃, Neo4j를 이용해 추천 엔진 구축 시작하기』

   
지은이 수레시 고라칼라   |   출판사 에이콘  |   발행일 2017년 09월 06일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 33,000원29,700원 10%
마일리지 5% 1,650원
발행일 2017-09-06
ISBN 1161750460 | 9791161750460
기타정보 번역서 | 424쪽
예상출고일 1일 (근무일기준)
배송비 무료배송
   
일반
   
 

★ 요약 ★

R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용하여 협업 필터링, 컨텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다루기 때문에 실무에 있어서 기본 내용들을 한눈에 파악할 수 있다. 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 파악할 수 있으며, 추천 엔진의 미래에 대해서 설명하기 때문에 추천 엔진에 대해서 많은 인사이트를 얻을 수 있도록 돕는다.


★ 이 책에서 다루는 내용 ★

■ 첫 번째 추천 엔진 구축 방법
■ 추천 엔진을 구축하는 데 필요한 도구
■ 공동 작업, 콘텐츠 기반 및 교차 추천과 같은 추천 시스템의 다양한 기법
■ 업무를 쉽게 할 수 있는 효율적인 의사 결정 시스템
■ 다양한 프레임워크에서의 머신 러닝 알고리즘
■ 실제 코드 예제를 사용한 다양한 버전의 추천 엔진 마스터링
■ 다양한 추천 시스템의 탐색과 R, 파이썬, 스파크 등의 기술을 이용하는 구현 방법


★ 이 책의 대상 독자 ★

이 책은 R, 파이썬, 스파크, Neo4j, 하둡을 사용한 추천 엔진과 복잡한 예측 의사 결정 시스템을 이해하고 구축하려는 초보자나 관련 경험이 있는 데이터 과학자를 대상으로 한다.


★ 이 책의 구성 ★

1장. '추천 엔진 소개'에서는 데이터 과학자들에게 추천 기능에 대해 다시 설명하고, 초보자들을 위해 추천 엔진을 다룬다. 그리고 사람들이 일상생활에서 사용하는 인기 있는 추천 엔진을 소개하고 인기 있는 추천 엔진의 장점과 단점을 살펴본다.
2장. '첫 번째 추천 엔진 구축하기'에서는 추천 엔진의 세계로 떠나기 전에 영화 추천 엔진을 어떻게 만드는지 간단히 살펴본다.
3장. '추천 엔진 이해'에서는 사용자 기반 협업 필터링 추천 엔진, 항목 기반 협업 필터링, 콘텐츠 기반 추천 엔진, 컨텍스트 기반 추천인(recommender), 하이브리드 추천인, 머신 러닝 모델 및 수학 모델과 같은 모델 기반 추천인 시스템 등 널리 사용되는 다양한 권장 엔진 기술을 설명한다.
4장. '추천 엔진에서 사용되는 데이터 마이닝 기법'에서는 유사성 측정, 분류, 회귀, 차원 축소 기술과 같은 추천 엔진 구축에서 사용되는 다양한 머신 러닝 기술을 다룬다. 추천 엔진의 예측 성능을 테스트하는 평가 측정 항목도 설명한다.
5장. '협업 필터링 추천 엔진 구축하기'에서는 R과 파이썬에서 사용자 기반 협업 필터링과 항목 기반 협업 필터링을 작성하는 방법을 다룬다. 또한 R과 파이썬에서 사용할 수 있는 다양한 라이브러리도 살펴본다. 이 라이브러리는 추천 엔진 구축 시에 광범위하게 사용된다.
6장. '개인화 추천 엔진 구축하기'에서는 R과 파이썬, 그리고 콘텐츠 기반 추천 시스템 및 상황 인식 권장 엔진을 작성하는 데 사용되는 다양한 라이브러리를 사용해 개인화 추천 엔진을 만드는 방법을 설명한다.
7장. '스파크를 사용해 실시간 추천 엔진 구축하기'에서는 실시간 추천 시스템을 구축하는 데 필요한 스파크 및 MLlib의 기본에 대해 설명한다.
8장. 'Neo4j로 실시간 추천 엔진 구축하기'에서는 graphDB와 Neo4j의 기본 개념을 살펴보고 Neo4j를 사용해 실시간 추천 시스템을 구축하는 방법을 설명한다.
9장. '머하웃을 이용한 추천 엔진 구축하기'에서는 확장 가능한 추천 시스템을 구축하는 데 필요한 하둡과 머하웃의 기본 빌딩 블록에 대한 내용을 다룬다. 또한 머하웃과 SVD를 사용해 확장 가능한 시스템을 구축하고, 단계별로 구현하는 데 필요한 아키텍처 관련 내용도 다룬다.
10장. '추천 엔진의 미래: 다음은 무엇일까?'에서는 이전까지 배운 내용을 요약해 설명한다. 그리고 의사 결정 시스템 구축에 사용되는 사례와 추천 시스템의 미래 모습도 살펴본다.


★ 지은이의 말 ★

R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용해 협업 필터링, 콘텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 이 책에서는 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다룬다. 4장에서는 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 다루며, 마지막 장에서는 추천 엔진의 미래에 대해 간략히 논의하는 시간을 가진다.
1장. 추천 엔진 소개
__추천 엔진 정의
__추천 시스템의 필요성
__추천 시스템을 운영하는 빅데이터
__추천 시스템 종류
____협업 필터링 추천 시스템
____콘텐츠 기반 추천 시스템
____하이브리드 추천 시스템
____상황 인식 추천 시스템
__기술 발전에 따른 추천 시스템의 발전
____확장 가능한 추천 시스템을 위한 머하웃
____실시간 확장 가능 추천 시스템을 위한 아파치 스파크
____실시간 그래프 기반 추천 시스템을 위한 Neo4j
__요약


2장. 첫 번째 추천 엔진 구축하기
__기본 추천 엔진 구축하기
____데이터 로드 및 형식 변환
____사용자 사이의 유사도 계산
____사용자의 등급 예측
__요약


3장. 추천 엔진 이해
__추천 엔진의 진화
__최근접 이웃 기반 추천 엔진
____사용자 기반 협업 필터링
____아이템 기반 협업 필터링
____장점
____단점
__콘텐츠 기반 추천 시스템
____아이템 프로필 생성
____사용자 프로필 생성
____장점
____단점
__상황 인식 추천 시스템
____상황의 정의
____사전 필터링 방식
____사후 필터링 방식
____장점
____단점
__하이브리드 추천 시스템
____가중 방식
____혼합 방식
____캐스케이드 방식
____특징 조합 방식
____장점
__모델 기반 추천 시스템
____확률적 접근법
____머신 러닝 접근법
____수학적 접근법
____장점
__요약


4장. 추천 엔진에서 사용되는 데이터 마이닝 기법
__이웃 기반 기법
____유클리드 거리
____코사인 유사도
____자카드 유사도
____피어슨 상관계수
__수학적 모델 기법
____행렬 인수 분해
____교대 최소 제곱
____특이값 분해
__머신 러닝 기법
____선형 회귀
____분류 모델
______선형 분류
______KNN 분류
______서포트 벡터 머신
______결정 트리
______앙상블 방법
__클러스터링 기법
____K-평균 클러스터링
__차원 축소
____주성분 분석
__벡터 공간 모델
____단어 빈도
____단어 빈도-역문서 빈도
__평가 기법
____교차 검증
____정규화
______평균 제곱근 오차
______평균 절대 오차
______정확도와 재현율
__요약


5장. 협업 필터링 추천 엔진 구축하기
__RStudio에 recommenderlab 패키지 설치하기
__recommenderlab 패키지에서 사용 가능한 데이터 세트
____Jester5K 데이터 세트 탐색
______설명
______사용법
______형식
______상세 설명
__데이터 세트 탐색하기
____평가 값 탐색하기
__recommenderlab으로 사용자 기반의 협업 필터링 구축하기
____훈련 데이터와 테스트 데이터 준비하기
____사용자 기반 협업 모델 생성하기
____테스트 세트에서의 예측
____데이터 세트 분석하기
____k-교차 검증을 통한 추천 모델 평가하기
____사용자 기반 협업 필터링 평가하기
__아이템 기반 추천인 모델 구축하기
____IBCF 추천인 모델 구축하기
____모델 평가
____메트릭을 사용한 모델 정확도
____플롯을 사용한 모델 정확도
____IBCF의 매개변수 튜닝하기
__파이썬을 사용한 협업 필터링
____필요한 패키지 설치하기
____데이터 소스
__데이터 탐사
____평가 행렬 표현
____훈련과 테스트 세트 생성하기
____UBCF를 구축하는 단계
____사용자 기반 유사도 계산
____활성 사용자의 알려지지 않은 평가 예측하기
__k-최접 이웃과의 사용자 기반 협업 필터링
____최접 N 이웃 찾기
__아이템 기반 추천
____모델 평가하기
____k-최접 이웃에 대한 훈련 모델
____모델 평가하기
__요약


6장. 개인화 추천 엔진 구축하기
__개인화 추천인 시스템
__콘텐츠 기반 추천인 시스템
____콘텐츠 기반 추천 시스템 구축하기
____R을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
____파이썬을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
______사용자 활동
______아이템 프로필 생성
______사용자 프로필 생성
__상황 인식 추천인 시스템
____상황 인식 추천인 시스템 구축하기
____R을 사용한 상황 인식 추천
______상황 정의하기
______상황 프로필 생성하기
______상황 인식 추천 생성하기
__요약


7장. 스파크를 사용해 실시간 추천 엔진 구축하기
__스파크 2.0
____스파크 아키텍처
____스파크 구성 요소
____스파크 코어
______스파크 SQL을 이용한 구조화된 데이터
______스파크 스트리밍을 사용하는 스트리밍 분석
______MLlib를 사용하는 머신 러닝
______GraphX를 사용한 그래픽 계산
____스파크의 장점
____스파크 셋업하기
____SparkSession에 대해
____RDD
____ML 파이프라인에 대해
__교대 최소 제곱을 이용한 협업 필터링
__pyspark를 사용한 모델 기반 추천 시스템
__MLlib 추천 엔진 모듈
__추천 엔진 접근 방식
____구현 방법
______데이터 로딩
______데이터 탐색
______기본 추천 엔진 만들기
______예측하기
____사용자 기반 협업 필터링
____모델 평가
____모델 선택 및 하이퍼 매개변수 튜닝
______교차 유효성 검사
______CrossValidator
______학습 유효성 검사 분할
______ParamMaps/매개변수 설정하기
______평가자 객체 설정하기
__요약


8장. Neo4j로 실시간 추천 엔진 구축하기
__서로 다른 그래프 데이터베이스 식별
____레이블이 지정된 프로퍼티 그래프
______GraphDB 핵심 개념 이해하기
__Neo4j
____Cypher 쿼리 언어
______Cypher 쿼리 기본
____노드 문법
____관계 문법
____첫 번째 그래프 만들기
______노드 만들기
______관계 만들기
______관계에 프로퍼티 설정하기
______csv에서 데이터 불러오기
__Neo4j 윈도우 버전 설치하기
__리눅스에서 Neo4j 설치하기
____Neo4j 다운로드하기
____Neo4j 설정하기
____명령행에서 Neo4j 시작하기
__추천 엔진 만들기
____데이터를 Neo4j로 보내기
____Neo4j를 사용해 추천 정보 만들기
____유클리드 거리를 이용한 협업 필터링
____코사인 유사성을 사용한 협업 필터링
__요약


9장. 머하웃을 이용한 추천 엔진 구축하기
__머하웃: 개요
__머하웃 설정하기
____독립 모드: 라이브러리로서 머하웃 사용하기
____분산 모드용 머하웃 설정하기
__머하웃의 코어 빌딩 블록
____사용자 기반 협업 추천 엔진의 컴포넌트
____머하웃을 사용해 추천 엔진 만들기
____데이터 세트 내용
____사용자 기반의 협업 필터링
__아이템 기반의 협업 필터링
__협업 필터링 평가하기
__사용자 기반 추천인 평가
__아이템 기반 추천인 평가
__SVD 추천
__머하웃을 이용한 분산 추천
____하둡에서의 ALS 추천 방법
__확장 가능한 시스템 아키텍처
__요약


10장. 추천 엔진의 미래: 다음은 무엇일까?
__추천 엔진의 미래
__추천 엔진의 단계
____단계 1: 일반적인 추천 엔진
____단계 2: 개인화된 추천인 시스템
____단계 3: 미래 지향적 추천 시스템
______검색의 종료
______웹 검색의 종말
______웹에서의 새로운 등장
____차선책
____유스케이스 고려
______스마트 홈
______헬스케어 추천인 시스템
______추천 뉴스
__인기 있는 방법론
____세렌디피티
__추천 엔진의 시간적 측면
____A/B 테스트
____피드백 메커니즘
__요약
수레시 고라칼라(Suresh K. Gorakala)
인공지능에 주력하는 데이터 과학자다. 여러 도메인의 다양한 글로벌 고객과 협력하며, 향상된 빅데이터 분석 기법을 사용해 비즈니스 문제를 해결하는 데 기여하고 있다. 추천 엔진, 자연어 처리, 고급 머신 러닝, 그래프 데이터베이스와 관련된 폭넓은 작업을 했으며, 『R로 만드는 추천 시스템』(에이콘, 2017)을 공동 저술했다. 열정적인 여행자며, 취미 생활로 사진 작가를 겸하기도 한다.


★ 옮긴이의 말★

최근 들어 책이나 영화와 같은 매체를 선택하는 데 도움이 되는 다양한 추천 서비스가 제공되고 있다. 이뿐만 아니라 쇼핑하는 동안에도 구매 욕구를 불러일으키는 다양한 상품들을 추천받기도 한다. 이렇게도 추천 서비스는 머신 러닝의 진화와 함께 기술적으로 눈부시게 발전하고 있다.
1990년대에 연구가 시작됐을 무렵, 추천 시스템은 다소 조잡하고 그다지 정확하지 못했지만 웹 기술이 발전하고 웹사이트 이용자들이 증가함에 따라 그들에 대한 다양한 데이터를 활용하면서 시스템이 빠르게 개선됐다. 또한 딥러닝과 인공지능의 발전으로 추천 시스템은 더욱 정교해져 현재 훨씬 더 개인화된 추천 서비스를 제공한다 .
구글, 아마존, 페이스북, 유튜브, 넷플릭스 등의 미국 기업뿐만 아니라 국내 기업에서도 사용자의 활동, 습관 등의 데이터를 수집하고, 딥러닝 기술을 이용해 그 데이터를 분석한 결과를 기반으로 개인 취향에 맞는 콘텐츠를 추천한다. 그리고 이러한 추천 시스템의 효과는 어마어마하다.
아마존의 경우 판매의 35%가 추천 엔진으로부터 비롯됐으며, 넷플릭스의 경우 구독자의 80%가 추천 시스템을 통해 영화를 선택한다고 추정할 뿐 아니라 추천 엔진 덕분에 연간 10억 달러를 절약할 수 있다고 밝혔다. 네이버 역시 인공지능 기반 추천 시스템을 적용해 뉴스 소비량은 약 17%, 동영상 소비량은 약 18% 증가했으며, 이런 성과를 바탕으로 점차 적용 범위를 확대하고 있다.
추천 엔진을 구축하는 데 바탕이 되는 이론을 이해하는 것은 성능이 좋은 추천 엔진을 구축하는 중요한 기반이 된다. 이 책에서는 R 언어를 사용해 콘텐츠 기반의 추천 엔진과 협업 필터링 방식의 추천 엔진을 실제로 구현해볼 뿐만 아니라, 각 추천 엔진의 기반이 되는 이론도 충실하게 다룬다.
이 책이 모든 독자들이 추천 엔진에 대한 기본 이론을 이해하고 정확도가 높은 추천 엔진을 실제로 구현하는 데 많은 도움이 되길 바란다.


★ 옮긴이 소개 ★

테크 트랜스 그룹 T4
최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용해 프레임워크를 구축하는 데 관심이 많으며, 최근에는 모바일을 접목한 하이브리드 환경에서의 HTML5, 스프링(Spring), NoSQL, React.js, Node.js 등의 기술과 빅데이터/데이터 분석 기술에 주목하고 있다. 또한 오픈소스 기반의 다양한 데이터베이스를 플랫폼 개발에 활용하는 데도 관심이 많다. 에이콘출판사가 펴낸 『구글 애널리틱스로 하는 데이터 분석 3/e』(2017), 『웹 개발자 레퍼런스 가이드』(2017) 등을 번역했다.
등록된 서평이 없습니다.
R로 배우는 코딩...
장용식·강희구 지음
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
무한상상 DIY 드론 A to Z...
이승경 저
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
시작하세요! 도커...
용찬호
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
매튜 마티아...
닉 맥클루어...
티모시 마스...
 
전체평균(0)
회원평점   회원서평수 0
에이콘 출판사의 신간
『하루 만에 혼자서 배우는 언리얼 엔진 4: 한 시간씩 단계별로 배우는 언리얼 엔진 4 마스터 과정』
아람 쿡슨, 라이언 도울링소카, 클린턴 크럼플러 저
31,500원
(10%↓+5%)
 
『KVM 가상화 완전 가이드: 클라우드 컴퓨팅을 위한 리눅스 가상화 시스템』
험블 데바시 치라멀, 프라사드 머크헤드카, 아닐 베타투 저
36,000원
(10%↓+5%)
 
『일래스틱서치 고급 기능의 개념과 활용: 일래스틱서치 5를 활용한 유연하고 확장 가능한 검색 솔루션 개발』
바디 딕시트 저
31,500원
(10%↓+5%)
 
『안드로이드 웨어 애플리케이션 개발: 안드로이드 웨어 앱 개발 기초부터 테스트, 배포까지』
시디크 하메드, 자비드 치다 저
21,600원
(10%↓+5%)
 
『나를 지키는 셀프 보안: 초보 이대리의 보안 성장기』
이창현 저
18,000원
(10%↓+5%)
 
이메일주소수집거부