로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

『컴퓨터 비전과 딥러닝: 텐서플로와 케라스를 사용한 전문 가이드』

   
지은이 라쟈링가파 샨무갸마니   |   출판사 에이콘  |   발행일 2018년 08월 31일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 30,000원27,000원 10%
마일리지 5% 1,500원
발행일 2018-08-31
ISBN 1161752005 | 9791161752006
기타정보 번역서 | 344쪽
예상출고일 1일 (근무일기준)
배송비 무료배송
   
일반
   
이 책의 원서
  Deep Learning for Computer Vision: Expert techniques to train advanced neural networks using TensorFlow and Keras
Packt Publishing
 

★ 요약 ★



딥러닝은 인공 지능에 혁명을 일으키고 있으며 앞으로 수십 년 동안 강렬하게 세상을 바꿀 기술이다. 심층 학습을 기반으로 한 인공 지능은 산업혁명과 비슷한 수준의 영향을 미칠 수 있다. 딥러닝은 현실상에서는 산업 혁명과 기계와 마찬가지로 산업 생산성을 향상시키고 많은 인류의 생활 수준을 높여줄 것이다. 컴퓨터 비전을 위해 활용될 수 있는 딥러닝에 대한 기본 지식들을 파악하게 되고, 딥러닝의 강력한 힘과 많은 애플리케이션을 지원하기 위한 내용에 대해서 알게 될 것이다.





★ 추천의 글 ★



딥러닝은 인공지능에 혁명을 일으키고 있으며, 앞으로 수십 년 동안 강렬하게 세상을 바꿀 기술이다. 심층 학습을 기반으로 한 인공지능은 산업혁명과 비슷한 수준의 영향을 미칠 수 있다.

딥러닝은 미래에 대한 흥분과 더불어 두려움을 만들어냈다. 그렇지만 딥러닝은 현실상에서는 산업혁명과 기계와 마찬가지로 산업 생산성을 향상시키고 많은 인류의 생활 수준을 높여줄 것이다.

물론, 직업을 대체하기보다는 더 양질의 일자리를 더 많이 만들어낼 것이다. 이것이야말로 이 책이 중요하고 시기적절한 이유이기도 하다. 이 책의 독자들은 컴퓨터 비전을 위한 딥러닝에 대해 파악하게 되고, 딥러닝의 강력한 힘과 많은 애플리케이션에 대해 알게 될 것이다. 이 책은 독자들에게 앞으로 수십 년 동안 급속도로 성장할 거대 산업에 대한 기초 내용을 제공할 것이다.

저자 라쟈링가파는 컴퓨터 비전과 관련된 여러 프로젝트에서 나와 함께 작업했던 훌륭한 연구원이다. 그는 의류 검색을 위한 복잡한 컴퓨터 비전 및 딥러닝 시스템을 설계하고 제공한 수석 엔지니어였으며, 해당 프로젝트는 실제로도 크게 성공을 거뒀다. 그의 강점 중 하나는 복잡한 문제에 대한 최첨단 연구 내용을 실제 상황에 적용할 수 있다는 것이며, 복잡한 아이디어를 분해하고 간단하게 설명할 수 있다. 라쟈링가파는 훌륭한 직업윤리를 가지고 있으며 매우 야침 차다. 딥러닝을 사용하는 컴퓨터 비전의 최신 기술들에 대한 내용을 정리했으며, 이러한 정리 내용은 많은 사람이 쉽게 할 수 있는 것이 아니다. 이 책은 라쟈링가파의 큰 결과물들을 정리한 것이며, 독자들은 앞으로 수년 동안 이 결과물을 잘 사용함으로써 많은 혜택을 얻을 수 있을 것이다.

ㅡ 스티븐 무어 박사/ 싱가포르 이모션리더 최고 기술 책임자(CTO)





★ 이 책에서 다루는 내용 ★



■ 케라스와 텐서플로에 대한 환경 설정

■ 애완동물 분류 제약 사항을 고려한 이미지 분류와 딥러닝 모델 훈련 방법 학습

■ 모델의 심층 레이어 이해

■ 이미지 추출 문제를 해결하기 위한 사전 훈련된 모델의 사용 방법

■ 검출 방법 이해와 보행자 검출 적용

■ 이미지 캡션 방법의 학습 및 구현

■ GAN을 사용해 이미지를 생성할 수 있는 모델 훈련

■ 동영상 분류 방법의 확인 및 실제 구현

■ 다양한 플랫폼에 실제 훈련된 모델 적용





★ 이 책의 대상 독자 ★



분류, 검출, 검색, 분할, 생성, 자막 및 동영상 분류와 같은 컴퓨터 비전 문제에 대한 심층적 학습 방법을 알고 싶은 독자나 적은 데이터, 불균형 클래스, 소음과 같은 다양한 제약 조건에서도 높은 정확도를 달성하는 방법을 이해하길 원하는 독자에게 적합한 책이다.

이와 더불어 훈련된 모델을 다양한 플랫폼(AWS, 구글 클라우드, 라즈베리 파이, 휴대전화)에서 사용하는 방법을 알고 싶은 독자에게도 추천한다. 이 책을 모두 읽고 나면, 독자는 인물 검출, 얼굴 인식, 제품 검색, 의료 이미지 분할, 이미지 생성, 이미지 캡션, 동영상 분류 등의 문제에 대한 코드를 개발할 수 있게 될 것이다.





★ 이 책의 구성 ★



1장. ‘시작하기’에서는 딥러닝의 기초를 소개하며, 초보자는 어휘에 익숙해질 시간을 갖게 된다. 이후 장을 수행하는 데 필요한 소프트웨어 패키지 설치에 대한 내용도 다룬다 .

2장. ‘이미지 분류’에서는 이미지 전체에 레이블을 붙이는 이미지 분류 문제를 설명한다. 이미지 분류 기술에 대해 배우고 애완동물 분류에 대한 딥러닝 모델을 훈련할 수 있다. 또한 정확도를 높이고 다양한 고급 아키텍처에 대한 심도 있는 내용을 배우게 된다.

3장. ‘이미지 검색’에서는 심층 특징(deep feature)과 이미지 검색을 다룬다. 모델 시각화, 시각적 기능, 텐서플로(TensorFlow)를 사용한 추론, 제품 검색을 위한 시각적 기능 제공 및 사용에 대한 다양한 방법을 학습할 수 있다.

4장. ‘객체 검출’에서는 이미지의 객체 검출을 설명한다. 다양한 객체 검출 기술을 배우고 이를 보행자 검출(pedestrian detection)에 적용할 수 있다. 객체 검출을 위한 텐서플로 API가 이 장에서 활용된다.

5장. ‘시맨틱 분할’에서는 픽셀 단위로 이미지를 분할하는 것을 다룬다. 분할 기법에 대한 지식을 얻고 의료 이미지의 분할 모델을 훈련할 수 있다.

6장. ‘유사도 학습’에서는 유사도 학습에 대해 이야기한다. 유사도 매칭(similarity matching)과 얼굴 인식을 위한 모델을 훈련시키는 방법을 배우게 된다. 얼굴 표식(face landmark)을 훈련시키는 모델이 설명된다.

7장. ‘이미지 캡션’에서는 이미지의 캡션을 생성하거나 선택하는 것을 다룬다. 자연어 처리 기술과 이 기술을 사용해 이미지 캡션을 생성하는 방법을 배운다.

8장. ‘생성 모델’에서는 다양한 목적으로 합성 이미지를 생성하는 방법을 설명한다. 독자는 이 장을 통해 생성 모델이 무엇인지 배우고, 스타일 전송과 훈련 데이터 등의 이미지 생성 애플리케이션 프로그램에 적용할 수 있다.

9장. ‘동영상 분류’에서는 동영상 데이터에 대한 컴퓨터 비전 기술을 다룬다. 동영상 문제와 이미지 문제의 주요 차이점을 이해하고 동영상 분류 기술을 구현해본다.

10장. ‘배포’에서는 심화 학습 모델의 배포 단계를 설명한다. 훈련된 모델을 배치하고 다양한 속도에 맞게 최적화하는 방법을 배울 수 있다.





★ 지은이의 말 ★



다양한 애플리케이션 프로그램을 위한 컴퓨터 비전 기술을 배우고 싶어 하는 독자를 대상으로 하며, 독자에게 컴퓨터 비전 기반 제품을 개발할 수 있는 도구와 기술을 제공한다. 실용적인 예제들을 통해 비전 관련 이론을 확인할 수 있다.

1장. 시작하기

__딥러닝 이해하기

____퍼셉트론

____활성화 함수

____인공 신경망

____원-핫 인코딩

____신경망 학습

____텐서플로 플레이그라운드 살펴보기

____컨볼루션 신경망

____순환 신경망

____LSTM

__컴퓨터 비전을 위한 딥러닝

____분류

____검출 또는 로컬라이제이션 및 분할

____유사도 학습

____이미지 캡셔닝

____생성 모델

____동영상 분석

__개발 환경 설정하기

____하드웨어 및 운영체제

____소프트웨어 패키지 설치하기

__요약





2장. 이미지 분류

__텐서플로에서 MNIST 모델 훈련하기

____MNIST 데이터셋

____MNIST 데이터 로드하기

____퍼셉트론 구축하기

____다중 레이어 컨볼루션 신경망 구축하기

__케라스에서 MNIST 모델 훈련시키기

____데이터셋 준비하기

____모델 구축하기

__그 외 일반적으로 사용되는 이미지 테스트 데이터셋

____CIFAR 데이터셋

____패션-MNIST 데이터셋

____ImageNet 데이터셋 및 대회

__더 깊은 딥러닝 모델

____AlexNet 모델

____VGG-16 모델

____구글 인셉션-V3 모델

____마이크로소프트 ResNet-50 모델

____SqueezeNet 모델

____공간 변환 네트워크

____DenseNet 모델

__개와 고양이를 예측하는 모델 훈련시키기

____데이터 준비하기

____간단한 CNN으로 벤치마킹하기

____데이터셋 확장하기

____모델의 전이 학습 또는 미세 조정

____딥러닝의 여러 레이어 파인 튜닝하기

__실제 애플리케이션 개발하기

____올바른 모델 선택하기

____언더피팅 및 오버피팅 시나리오 해결하기

____얼굴에서 성별과 나이 검출하기

____의류 모델 미세 조정하기

____브랜드 안정성

__요약





3장. 이미지 검색

__시각적 특징의 이해

__딥러닝 모델 활성화의 시각화

__임베딩 시각화

____DeepDream

____적대적인 사례

__모델 추론

____모델 내보내기

____훈련된 모델 사용

__콘텐츠 기반 이미지 검색

____검색 파이프라인 구축

____효율적 검색

____ANNOY를 사용한 매칭 가속화

____Raw 이미지 자동 인코더

____자동 인코더를 사용한 노이즈 제거

__요약





4장. 객체 검출

__이미지에서의 객체 검출

__데이터셋 탐색하기

____ImageNet 데이터셋

____파스칼 VOC 챌린지

____COCO 객체 검출 챌린지

____측정 항목을 사용해 데이터 집합 평가하기

__알고리즘 로컬라이제이션하기

____슬라이딩 윈도우를 사용해 객체 로컬라이제이션하기

____로컬라이제이션을 회귀 문제로 생각해보기

__객체 검출

____R-CNN

____Fast R-CNN

____Faster R-CNN

____싱글 샷 다중 박스 검출기

__객체 검출 API

____설치 및 설정

____사전 훈련된 모델

____객체 검출 모델 재훈련

__자율주행용 보행자 검출 훈련

__YOLO 객체 검출 알고리즘

__요약





5장. 시맨틱 분할

__픽셀 예측

____의료 이미지 진단

____위성 이미지를 사용해 지구를 살펴보기

____로봇이 볼 수 있도록 허용하기

__데이터셋

__시맨틱 분할을 위한 알고리즘

____완전 컨볼루션 네트워크

____SegNet 아키텍처

____확장 컨볼루션

____DeepLab

____RefiNet

____PSPnet

____대형 커널의 문제

____DeepLab v3

__울트라-신경 분할

__위성 이미지 분할

____분할을 위한 FCN 모델링

__인스턴스 분할

__요약





6장. 유사도 학습

__유사도 학습을 위한 알고리즘

____샴 네트워크

____FaceNet

____DeepNet 모델

____DeepRank

____시각적 추천 시스템

__인간 얼굴 분석

____얼굴 검출

____얼굴 표식 및 속성(attribute)

____캐글 키포인트 데이터셋

____얼굴 인식

____얼굴 클러스터링

__요약





7장. 이미지 캡션 처리

__문제 및 데이터셋 이해하기

__이미지 캡션을 위한 자연어 처리 이해

____벡터 형태로 단어 표현하기

____단어를 벡터로 변환

____임베딩 훈련

__이미지 캡션 및 관련 문제에 대한 접근 방법

____조건부 랜덤 필드를 사용해 이미지와 텍스트 연결하기

____CNN 기능에서 RNN을 사용해 자막 생성

____이미지 순위를 사용해 자막 만들기

____이미지와 이미지에서 캡션 가져오기

____밀집 캡션

____캡션에 RNN 사용하기

____다중 모달 측정 항목 공간 사용하기

____캡션 작성 시 관심 네트워크 사용하기

____언제 살펴봐야 할지 파악하기

__관심 기반 이미지 캡션 방법 구현하기

__요약





8장. 생성 모델

__생성 모델의 애플리케이션

____예술적 스타일 이전 방법

____동영상의 다음 프레임 예측 방법

____슈퍼 해상도 이미지

____대화형 이미지 생성하기

____이미지를 이미지로 변환하기

____텍스트로 이미지 생성하기

____불필요 제거

____블렌딩

____속성 변환하기

____훈련 데이터 생성

____새 애니메이션 캐릭터 만들기

____사진으로부터 3D 모델 생성

__신경 예술 스타일 전송

____콘텐츠 손실

____그램 매트릭스를 사용한 스타일 손실

____스타일 전송

__GAN

____바닐라 GAN

____조건부 GAN

____적대적 손실

____이미지 변환

____InfoGAN

____GAN의 단점

__VDM

____VDM 알고리즘

__요약





9장. 동영상 분류

__동영상의 이해 및 분류

____동영상 분류 데이터셋 탐색

____동영상을 프레임으로 분할하기

____동영상 분류 접근법

__동영상에 대한 이미지 기반 접근법 확장

____사람의 포즈도 적용하기

____동영상 분할

____동영상 캡션

____동영상 생성

__요약





10장. 배포

__모델 성능

____모델 양자화

____MobileNets

__클라우드에서 배포하기

____AWS

____구글 클라우드 플랫폼

__장치에 모델 배포하기

____Jetson TX2

____안드로이드

____아이폰

__요약

라쟈링가파 샨무갸마니(Rajalingappaa Shanmugamani)

현재 SAP 싱가포르에서 딥러닝 분야의 리더로 일하고 있다. 이전에는 컴퓨터 비전 제품 개발을 위해 여러 신생 기업에서 근무하고 컨설팅해왔다. 인도 공과 대학(Indian Institute of Technology, Madras)에서 석사 학위를 받았으며, 제조 분야의 컴퓨터 비전 애플리케이션 산업에 관한 논문을 저술했다. 저널 및 콘퍼런스에서 동료 논문 검토를 했으며, 머신 러닝 분야에서 몇몇 특허를 보유했다. 여가에는 프로그래밍과 머신 러닝을 학생과 엔지니어에게 가르친다.





★ 옮긴이의 말 ★



컴퓨터 비전은 컴퓨터에 시각을 부여해 이미지를 분석함으로써 유용한 정보를 생성하는 기술이다. 비전 기술은 컴퓨터나 로봇 등을 통해 얼굴, 건물 등의 다양한 객체를 인식하는 데 응용되며, 인공지능 기술이 발전하면서 객체 인식 기술의 진화 속도는 빨라지고 있다.

컴퓨터가 사물을 정확하게 인식해 유용한 정보를 제공할 수 있게 되면서 컴퓨터 인터페이스에 변혁이 일어나고 있다. 아이폰 X에는 얼굴을 인식하는 기능인 페이스 ID가 탑재됐고, 스마트폰의 카메라를 이용한 신용카드 스캔 등의 기술이 실제로 적용되고 있다.

컴퓨터 비전을 구현하기 위한 사용자의 프로젝트에서 컴퓨터 비전 알고리즘을 시작하길 원하더라도, 어디서부터 시작해야 할지 다소 막막할 수 있다. 컴퓨터 비전 엔지니어라 해도, 심도 있게 접근하거나 더 많은 내용을 배우려면 많은 기술을 알아야 한다. 이와 같은 목적을 달성하려면 실전 경험이 가장 중요하다. 실제 문제를 해결하는 방법을 통해 현존하는 방법들을 사용자의 요구 사항에 맞춰 수행해야 하며, 샘플 코드들을 통해 컴퓨터 비전 알고리즘의 가능성과 한계를 충분히 이해해 나가야 한다.

이 책은 실제 컴퓨터 비전 작업을 할 때 직접적으로 큰 도움이 될 수 있도록 구성됐다. 텐서플로(TensorFlow)를 사용해 추론, 제품 검색을 위한 시각적 기능의 제공 및 다양한 사용 방법을 학습할 수 있고, 유사도 매칭(similarity matching)과 얼굴 인식을 위한 모델을 훈련시키는 방법도 배울 수 있다. 이러한 내용들을 다룬 이 책은 딥러닝 학습을 위한 많은 내용들을 담고 있으며 이해하기 쉽게 예제 코드와 그 결과물까지 한꺼번에 보여준다. 컴퓨터 비전 학습을 위한 시맨틱 분할(semantic segmentation), 유사도 학습(similarity learning), 이미지 캡션(image caption), 생성 모델(generative model), 동영상 분류(video classification)에 대해 알기 쉽게 설명해주므로 데이터 기반 컴퓨터 비전 기술에 대한 지식을 한 번에 쉽게 습득할 수 있다.

모든 독자들이 텐서플로/케라스(Keras)와 딥러닝 등에 대한 기본 이론을 이해하고 실제로 구현하는 데 많은 도움이 되길 진심으로 바란다. 각각의 심오한 주제와 관련된 내용 전체를 하나씩 천천히 끄집어낸 후 설명하고 있으므로 순서대로 읽다 보면 전반적인 내용을 충분히 파악할 수 있을 것이다.





★ 옮긴이 소개 ★



테크 트랜스 그룹 T4

최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용해 프레임워크를 구축하는 데 관심이 많으며, 스프링(Spring), React.js, Node.js, OpenCV, ML 등의 기술에 주목하고 있다. 오픈소스 기반의 플랫폼 개발 및 활용도 주요 관심 분야다. 에이콘출판사에서 펴낸 『OpenCV를 위한 머신 러닝』(2017), 『추천 엔진을 구축하기 위한 기본서』(2017) 등을 번역했다.



등록된 서평이 없습니다.
Solidworks Basic(솔리드웍스 베이직)(2017)...
원동현
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
허팝과 함께하는 유튜브 크리에이터 되기(YouTube 채널 운영부터 동영상 촬영 및 편집, 라이브 방송, 수익 창출까지!)...
허팝, 강전희, 안정기
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
SNS와 유튜브 1인 미디어를 위한 스마트폰 활용법...
김경수, 정인걸, 황세웅
선택된 상품을 찜하실 수 있습니다. 선택된 상품을 바로구매 하실 수 있습니다.
체탄 기리다...
오쿠무라 하...
조슈아 블로...
 
전체평균(0)
회원평점   회원서평수 0
에이콘 출판사의 신간
『실전 금융 머신 러닝 완벽 분석』
마르코스 로페즈 데 프라도 저
36,000원
(10%↓+5%)
 
『Windows Debugging 2/e: WinDbg로 배우는 윈도우 디버깅』
최바울, 이태화, 김희준, 김성현 저
49,500원
(10%↓+5%)
 
『스칼라와 머신 러닝 2/e : 풍부한 설명으로 배우는 스칼라 머신 러닝 구현』
패트릭 R. 니콜라스 저
40,500원
(10%↓+5%)
 
『클라우드 네이티브 스프링: 클라우드 플랫폼을 위한 자바 마이크로서비스』
아제이 마하잔, 무니쉬 쿠마르 굽타, 시암 순다르 저
31,500원
(10%↓+5%)
 
『C++ 멀티스레딩 정복하기: 견고하면서도 병렬성과 병행성을 가지는 애플리케이션 작성법』
마야 포쉬 저
22,500원
(10%↓+5%)
 
이메일주소수집거부