로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

R 예제로 배우는 머신 러닝

 [머신 러닝의 기본 이해와 실생활 문제 해결에의 적용]
   
지은이 라가프 발리, 디판잔 사카   |   출판사 에이콘  |   발행일 2016년 12월 30일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 33,000원29,700원 10%
마일리지 5% 1,650원
발행일 2016-12-30
ISBN 8960779490 | 9788960779495
기타정보 번역서 | 380쪽 | 일반
예상출고일 1일 (근무일기준)
배송비 무료배송
   
일반
   
이 책의 원서
  R Machine Learning by Example
Packt Publishing | Raghav Bali
 

[ 요약 ]

머신 러닝을 사용한 실제 응용 사례를 R로 작성된 예제 코드 중심으로 소개한다. 제품 추천을 위한 장바구니 분석, 금융기관에서의 리스크 관리를 위한 신용 위험도 예측, 감정 분석을 위한 소셜 미디어 분석과 같은 실생활 예제를 R 코드로 설명한다. R 언어와 머신 러닝에 대한 기본 지식을 가지고 있는 독자라면, 이 책을 통해 기존에 알고 있던 이론들을 어떻게 응용할 수 있을지 한 단계 더 나아갈 수 있을 것이다.


[ 이 책에서 다루는 내용]

■ R의 강력한 데이터 추출, 처리와 탐색 기법 활용
■ R을 이용한 다차원에 걸친 데이터 시각화 및 유용한 특징 추출
■ 수학적, 논리적 개념을 이용한 머신 러닝 알고리즘 탐색
■ 정확한 상황 분석을 위한 분석 분야 심층 탐구
■ 알고리즘 동작을 볼 수 있도록 처음부터 R 머신 러닝 알고리즘 구축
■ 기본부터 시작하여 재사용 가능한 코드 작성 및 완전한 머신 러닝 시스템 구축
■ 머신 러닝과 R을 사용한 흥미로운 실제 문제 해결
■ 머신 러닝 및 데이터 과학의 실제 문제 해결


[ 이 책의 대상 독자 ]

데이터로부터 의사결정을 하는 최신 기술을 사용해 데이터로부터 유용한 정보를 채굴(mining)하는 데 관심이 많은 이들을 위한 책이다. R에 관한 기본 지식은 요구되지만, 데이터 과학에 관한 선행 경험은 필요하지 않다. 머신 러닝에 관한 사전 지식은 이 책의 내용을 학습하는 데 유용하지만, 반드시 필요하지는 않다.


[ 이 책의 구성 ]

1장, ‘머신 러닝 R로 시작하기’에서는 독자에게 R과 그 기초에 대해 소개하고, 머신 러닝의 개요에 대해 설명한다.
2장, ‘기계를 학습시키자’에서는 머신 러닝의 기본을 이루는 개념에 대해 본격적으로 설명한 다. 실제 예제로 이뤄진 다양한 러닝 알고리즘을 설명한다.
3장, ‘장바구니 분석을 통한 쇼핑 트렌드 예측’에서는 첫 번째 프로젝트로서 여러 가지 머신 러닝 기법을 사용해 전자상거래상 상품 추천, 예측, 패턴 분석을 수행한다. 특히 장바구니 분석과 연관 규칙 마이닝을 통해 고객의 쇼핑 패턴 및 트렌드, 상품 제작 및 예측에 대해 다룬다. 이런 기법들은 타깃, 메이시스, 플립카트, 아마존과 같은 소매 기업, 전자상거래 상점의 상품 추천 등에 널리 사용된다.
4장, ‘제품 추천 시스템 만들기’에서는 첫 번째 실습 프로젝트인 전자상거래상 상품 추천, 예측, 패턴 분석의 두 번째 부분을 다룬다. 특히 상용화 단계의 추천 시스템에 쓰인 전자상거래의 다양한 고객 제품 리뷰와 별점 분석을 통한 협력적 사용자 필터링과 같은 알고리즘 기법을 다룬다.
5장, ‘신용 위험의 감지 및 예측: 기술적 분석’에서는 두 번째 실습 프로젝트로 신용 위험 감지 및 예측에 관한 복합 금융 시나리오에 머신 러닝 기법을 적용해 본다. 특히 주요 목표에 대해 소개하고, 은행 자금 대출을 신청한 1,000명의 자산 신용 데이터 세트를 살펴본다. 머신 러닝 기법을 통해 누가 잠재적 신용 위험이 있는지, 누가 대출 받은 자금을 갚지 못할 것인지, 미래에 대해 예측해 본다. 또한 우리가 가진 데이터 세트에 대해 좀 더 자세히 살펴볼 텐데, 데이터를 다룰 때의 주요 문제점, 데이터 세트의 주요 기능, 데이터에 대한 탐사 및 묘사적인 분석 등을 설명한다. 끝으로, 위의 문제를 해결하는 데 적합한 머신 러닝 기법을 살펴보며 마무리 짓는다.
6장, ‘신용 위험의 감지 및 예측: 예측적 분석’에서는 앞장의 묘사적 분석에서 미뤄뒀던 것을 예측적 분석을 통해 살펴본다. 특히 잠재적 신용 위험과 대출 후 상환하지 못할 것 같은 고객에 대해 감지하고 분석하는 몇 가지 머신 러닝 알고리즘을 다룬다. 이는 은행이 대출을 승인할 것인지 말 것인지 데이터를 통해 분석함으로써 결정에 도움을 준다. 또한 몇 가지 지도 학습 알고리즘들을 살펴보고 성능 분석을 해본다. 여러 가지 머신 러닝 알고리즘들의 효율 및 정확도를 측정하는 데 쓰이는 수치에 대해서도 알아본다.
7장, ‘소셜 미디어 분석: 트위터’에서는 데이터 분석 소셜 미디어 분석의 세계로 안내한다. 소셜 미디어 세계로의 안내로 시작해 트위터 API를 통해 데이터를 모으는 방식을 살펴본다. 트위터로부터 유용한 데이터를 끌어오는 방식을 설명하고 실제 예제를 통해 트위터 데이터를 시각화하고, 트윗들을 클러스터링하고, 주제를 모델링하며 문제점 및 복잡성을 이끌어낸 뒤 이 문제들을 해결할 전략에 대해 소개한다. 예제를 통해 몇 가지 강력한 측정법으로 트위터 데이터를 연산할 수 있는지 살펴본다
8장, ‘트위터 데이터의 감정 분석’에서는 트위터 API를 사용해 트윗들의 감정을 분석하는 프로젝트를 다룬다. 이 프로젝트는 감정 표현의 트윗들을 분석하기 위한 복합 머신 러닝 알고리즘에 관한 것으로, 그 결과 값들의 비교를 통해 이해를 돕고 각 알고리즘이 내는 결과의 차이점에 대해 다룬다

[지은이의 말]

요즘 기술 분야에서 가장 핫한 유행어는 데이터 과학(data science)과 머신 러닝(machine learning)이다. 작은 소매점에서부터 포춘 500대 기업에 이르기까지 많은 조직들이 데이터에 근거한 통찰이 자신들의 비즈니스를 확장시킬 수 있도록 머신 러닝에 힘을 쏟고 있다. 강력한 데이터 처리 기능, 머신 러닝 패키지, 활발한 개발자 커뮤니티 등 R을 통해 실제 데이터 문제를 해결할 수 있는 세련된 머신 러닝 시스템을 구축할 수 있다.
이 책을 통해 아주 기본적인 R과 머신 러닝에 대해 알아보고 실제 문제를 다루는 프로젝트를 단계적으로 함께 구현해보자.


1장 머신 러닝 R로 시작하기
__R의 기본 탐구
____R을 공학용 계산기로 사용하기
____벡터로 연산하기
____특별한 값들
__R의 데이터 구조체
____벡터
____배열과 행렬
____리스트
____데이터 프레임
__함수 다루기
____기본 내장된 함수
____사용자 정의 함수
____함수를 인자로 전달하기
__코드의 흐름 제어
____If, if-else, ifelse 사용
____switch문 사용
____반복문
__고급 구조체
____lapply and sapply.
____apply
____tapply
____mapply
__R과 함께 한 발짝 나아가기
____도움 받기
____패키지 다루기
__머신 러닝의 기초
____머신 러닝: 실제로 무엇을 의미하는가
____머신 러닝: 실제로 어떻게 사용되고 있는가
____머신 러닝 알고리즘의 종류
__요약

2장 기계를 학습시키자
__머신 러닝 이해하기
__머신 러닝 알고리즘
____퍼셉트론
__알고리즘의 종류
____지도 학습 알고리즘
____비지도 학습 알고리즘들
__요약

3장 장바구니 분석을 통한 소비자 쇼핑 트렌드 예측
__트렌드 탐지와 예측
__장바구니 분석
____장바구니 분석이 실제로 의미하는 것은
____중요 개념과 정의
____분석에 사용되는 기법들
____데이터 기반 의사결정 만들기
__상품의 분할 행렬 평가
____데이터 수집
____데이터 분석과 시각화
____포괄 추천
____발전된 분할 행렬
__빈발 아이템 세트 생성
____시작하기
____데이터 검색과 변환
____아이템 세트 연관 행렬 만들기
____빈발 아이템 세트 생성 과정 만들기
____쇼핑 트렌트 찾기
__연관 규칙 마이닝
____의존성과 데이터 로딩
____탐색적 분석
____쇼핑 트렌드를 발견하고 예측하기
____연관 규칙 시각화
__요약

4장 제품 추천 시스템 만들기
__추천 시스템의 이해
__추천 시스템의 주요 이슈들
__협력 필터
____주요 콘셉트와 정의들
____협력 필터 알고리즘
__추천 엔진 만들기
____행렬 분해
____구현
____결과 해석
__출시 수준의 추천 시스템
____추출, 변환, 분석
____모델 개발 및 예측
____모델 평가
__요약

5장 신용 위험의 감지 및 예측: 기술적 분석
__분석의 종류.
__다음 도전
__신용 위험이란?
__데이터 수집
__데이터 전처리
____유실 값 처리
____데이터형 변환
____데이터 분석 및 변환
____분석 유틸리티 구축
____데이터 세트 분석
____변환된 데이터 세트 저장
__다음 단계
____특징 집합들
____머신 러닝 알고리즘들
__요약

6장 신용 위험 탐지 및 예측: 예측적 분석
__예측적 분석
__어떻게 신용 위험을 예측할까
__예측 모델링의 중요한 개념
____데이터 준비
____예측 모델 만들기
____예측 모델 평가
__데이터 수집
__데이터 전처리
__피처 선택
__로지스틱 회귀를 이용한 모델링
__서포트 벡터 머신을 이용한 모델링
__의사결정 나무를 사용한 모델링
__랜덤 포레스트를 이용한 모델링
__신경망을 이용한 모델링
__모델 비교 및 선택
__요약

7장 소셜 미디어 분석: 트위터 데이터 분석
__소셜 네트워크(트위터)
__데이터 마이닝 @소셜 네트워크
____소셜 네트워크 데이터 마이닝하기
____데이터와 시각화
__트위터 API 시작
____개요
____앱 등록
____연결/인증
____샘플 트윗 추출
__트위터 데이터 마이닝
____빈출 어휘 및 연관성
____많이 사용되는 디바이스들
____계층적 군집화
____주제 모델링
__소셜 네트워크 데이터 마이닝의 도전
__참고 자료
__요약

8장 트위터 데이터의 감정 분석
__감정 분석에 대한 이해
____감정 분석의 주요 개념
____접근 방법
____애플리케이션
____도전 과제
__트위터를 이용한 감정 분석
____극성 분석
____분류 기반 알고리즘
__요약

라가프 발리(Raghav Bali)
인도 방갈로르의 국제정보기술공학대학교(International Institute of Information Technology, Bangalore) IT 학과에서 최우수자(gold medalist)로 석사 학위를 받았다. 세계 최대의 반도체 회사인 인텔에서 애널리틱스(Analytics), 비즈니스 인텔리전스(BI, Business Intelligence), 애플리케이션 개발(Application Development) 업무를 담당하는 IT 엔지니어며, 현재 세계 최고 회사들의 ERP, 금융, 비즈니스 인텔리전스 분야에서 애널리스트와 개발자로 일하고 있다. 여가 시간에는 순간을 포착하는 사진광이다.

디판잔 사카(Dipanjan Sarkar)
세계 최대의 반도체 회사인 인텔에서 애널리틱스, 비즈니스 인텔리전스, 애플리케이션 개발 업무를 수행하는 IT 엔지니어다. 인도 방갈로르의 국제정보기술공대 IT 학과에서 석사 학위를 받았으며, 소프트웨어 엔지니어링, 데이터 과학, 머신 러닝, 텍스트 애널리틱스가 전문 영역이다.
새로운 기술을 배우는 것을 포함해, 혁신적인 스타트업들과 데이터 과학에 관심을 가지고 있다. 책을 읽고, 게임을 하고, 유명한 시트콤을 보는 것을 좋아한다. 팩트출판사가 펴낸 『Data Analysis with R』, 『Learning R for Geospatial Analysis』, 『R Data Analysis Cookbook』의 감수자이기도 하다.

등록된 서평이 없습니다.
나는 프로그래머다...
김용준
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
프로그래머로 산다는 것...
유석문, 황상철, 하호진, 이상민, 김성박
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
개발자, 나를 말하다...
용영환
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
최준승, 이...
찰스 비히스...
타리크 라시...
 
전체평균(0)
회원평점   회원서평수 0
에이콘 출판사의 신간
실전 네트워크와 네트워크 보안 실무
현정훈 저
36,000원
(10%↓+5%)
 
pfSense 마스터
데이빗 지엔타라 저
31,500원
(10%↓+5%)
 
핵심을 정리한 스위프트 3
존 호프만 저
27,000원
(10%↓+5%)
 
제4차 변혁
로버트 스코블, 셸 이스라엘 저
16,200원
(10%↓+5%)
 
손에 잡히는 실전 비즈니스 인텔리전스
아메드 셰리프 저
27,000원
(10%↓+5%)
 
이메일주소수집거부