로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

텐서플로로 시작하는 딥러닝

 [합성곱 신경망 중심의 딥러닝 알고리즘]
   
지은이 나카이 에츠지   |   출판사 제이펍  |   발행일 2017년 07월 12일
 
판매가 24,000원21,600원 10%
마일리지 5% 1,200원
발행일 2017-07-12
ISBN 1185890874 | 9791185890876
기타정보 번역서 | 256쪽 | 일반
예상출고일 1~2일 이내 (근무일기준)
배송비 무료배송
   
컴퓨터공학
   
 

1. 출판사 서평
텐서플로를 이용하여 ‘합성곱 신경망(CNN)’의 구조를 완벽히 이해한다!

이 책은 머신러닝과 데이터 분석을 제대로 배운 적이 없는 개발자를 대상으로 한다. 딥러닝의 대표적 예인 ‘합성곱 신경망(CNN)’의 구조를 근본부터 이해하고, 텐서플로를 이용해 실제로 동작하는 코드를 작성하는 것이 이 책의 목표다. 그리고 다수의 뉴런이 여러 층 결합된 ‘다층 신경망’ 내에서 대체 무슨 일이 일어나는지, 딥러닝 알고리즘은 어떤 원리로 학습하는지를 알려 준다.

딥러닝의 밑바닥에는 머신러닝의 원리가 있는데, 간단한 행렬 계산과 기초적인 미분을 알면 그 구조를 이해하기가 그리 어렵지 않다. 이 책은 필기 문자를 인식하도록 처리하는 합성곱 신경망에 대해, 그리고 이를 구성하는 각 요소의 역할을 신중하게 설명한다. 또한, 딥러닝의 대표 라이브러리인 텐서플로를 이용해 실제로 동작하는 코드를 보여줌으로써 각 요소의 동작 원리를 확인할 수 있도록 구성되어 있다. 레고 블록을 끼워 맞추듯이 네트워크 구성 요소를 늘려 감으로써 인식 정확도가 향상되는 모습을 관찰할 수 있을 것이다.

부디 이 책을 통해 딥러닝의 근본 원리를 이해하고 텐서플로 코드 작성법을 학습하여 다음 단계로 도약하는 계기가 되길 바란다.

이 책의 대상 독자
● 머신러닝, 데이터 분석 전문가는 아니지만 AI 기술에 관심이 있는 분
● 딥러닝 알고리즘이 어떻게 구성되어 있는지 알고 싶은 분
● 텐서플로 공식 예제 코드를 제대로 활용하기 어려운 분

2. 책속으로
딥러닝이 세상의 주목을 받기 시작한 것은 “신경망이 이미지를 인식했다”라고 구글이 발표할 무렵부터입니다. 그후 DQN(Deep Q-Network)이라는 알고리즘이 비디오 게임 제어를 학습하고, 나아가 신경망을 이용한 머신러닝 시스템이 바둑 세계 챔피언을 이기는 등 놀라운 결과를 만들어 내고 있습니다. 그리고 이러한 딥러닝의 해설 기사에 반드시 등장하는 것이 바로 다수의 뉴런이 여러 층 결합된 ‘다층 신경망’을 도식화한 그림입니다. 이 신경망 내에서 대체 무슨 일이 일어나는 것인지, 딥러닝 알고리즘은 어떤 원리로 학습하는 것인지를 ‘어떻게 해서든 이해하고 싶다!’라고 느끼는 여러분이 바로 이 책의 대상 독자입니다.
_viii쪽

딥러닝은 ‘심층학습’이라고도 하며, 용어만 보면 뭔가 심오한 이론인 것처럼 느껴진다. 그러나 기본적으로는 앞서 그림 1 - 11과 같은 다층 신경망을 이용한 머신러닝에 지나지 않는다. 다만, 단순히 계층을 증가시켜 복잡화하는 것이 아니라 해결해야 할 문제에 맞게 각각의 노드에 특별한 역할을 부여하거나 노드 간의 연결 방식을 다양하게 연구한 것이다. 무조건 노드를 증가시켜 복잡화하는 것이 아니라 각 노드의 역할을 생각하면서 특정 의도를 갖고 구성한 신경망이라고 생각할 수 있다.
_13쪽

그렇다면 미니 배치 혹은 확률적 경사 하강법을 이용하는 이유는 무엇일까? 여기에는 크게 두 가지 이유가 있다. 첫 번째 이유는 트레이닝 세트 데이터가 대량으로 있을 경우에 1회당 계산량을 줄일 수 있다는 점이다. 일반적으로 특정 함수의 기울기 벡터를 구할 때는 계산 처리량이 많아진다. 텐서플로에서는 기울기 벡터 계산이 자동화되어 있어서 이용자가 계산 내용을 의식하지는 않지만, 그렇더라도 계산 처리량에는 주의가 필요하다. 트레이닝 세트에서 대량의 데이터를 투입하면 트레이닝 알고리즘의 계산이 상당히 느려지거나 대량의 메모리를 소비하므로 실용성이 떨어지게 된다.
_92쪽

특히, 복잡한 신경망을 이용할 경우 텐서보드로 오차 함수의 변화를 살펴보면 그림 3 - 25와 같이 오차 함수의 값이 계단 모양으로 변화하는 경우가 있다. 이것이 바로 극솟값 주위를 얼마간 돌아다닌 후에 갑자기 최솟값 방향으로 향하는 움직임에 해당한다. 극솟값을 갖는 위치가 여러 개 있을 경우에는 몇 단계에 걸쳐 오차 함수의 값이 변화하는 경우도 있다.
_135쪽

이번 장에서는 합성곱 필터와 풀링 계층을 2단으로 쌓은 CNN을 실제로 구성하고, 텐서플로를 이용해 최적화해서 어떤 결과가 나오는지를 확인해 보겠다. 여기서는 이를 위한 준비 과정으로 2단계 필터가 이미지 데이터에 대해 어떻게 작용하는지를 정리한다. 또한, 파라미터 최적화를 효율적으로 실시하는 데 필요한 CNN 특유의 테크닉에 관해 추가 설명한다. 구체적인 설명을 위해 첫 번째와 두 번째 단계의 합성곱 필터의 개수를 각각 32개와 64개로 가정한다.
_179쪽

CHAPTER 1 텐서플로 입문 1
1.1 딥러닝과 텐서플로 4
1.1.1 머신러닝의 개념 4
1.1.2 신경망의 필요성 7
1.1.3 딥러닝의 특징 13
1.1.4 텐서플로를 이용한 파라미터 최적화 16
1.2 환경 준비 24
1.2.1 CentOS 7에서의 준비 과정 25
1.2.2 주피터 사용법 28
1.3 텐서플로 훑어보기 33
1.3.1 다차원 배열을 이용한 모델 표현 33
1.3.2 텐서플로 코드를 이용한 표현 35
1.3.3 세션을 이용한 트레이닝 실행 39

CHAPTER 2 분류 알고리즘의 기초 47
2.1 로지스틱 회귀를 이용한 이항 분류기 49
2.1.1 확률을 이용한 오차 평가 49
2.1.2 텐서플로를 이용한 최우추정 실행 54
2.1.3 테스트 세트를 이용한 검증 65
2.2 소프트맥스 함수와 다항 분류기 69
2.2.1 선형 다항 분류기의 구조 69
2.2.2 소프트맥스 함수를 이용한 확률로의 변환 73
2.3 다항 분류기를 이용한 필기 문자 분류 76
2.3.1 MNIST 데이터 세트 이용 방법 76
2.3.2 이미지 데이터의 분류 알고리즘 79
2.3.3 텐서플로를 이용한 트레이닝 실행 84
2.3.4 미니 배치와 확률적 경사 하강법 90

CHAPTER 3 신경망을 이용한 분류 95
3.1 단층 신경망의 구조 97
3.1.1 단층 신경망을 이용한 이항 분류기 97
3.1.2 은닉 계층의 역할 100
3.1.3 노드 개수와 활성화 함수 변경에 따른 효과 110
3.2 단층 신경망을 이용한 필기 문자 분류 113
3.2.1 단층 신경망을 이용한 다항 분류기 113
3.2.2 텐서보드를 이용한 네트워크 그래프 확인 116
3.3 다층 신경망으로의 확장 124
3.3.1 다층 신경망의 효과 124
3.3.2 특징 변수에 기반한 분류 로직 128
3.3.3 보충: 파라미터가 극솟값으로 수렴하는 예 133

CHAPTER 4 합성곱 필터를 통한 이미지 특징 추출 137
4.1 합성곱 필터의 기능 139
4.1.1 합성곱 필터의 예 139
4.1.2 텐서플로를 이용한 합성곱 필터 적용 142
4.1.3 풀링 계층을 이용한 이미지 축소 150
4.2 합성곱 필터를 이용한 이미지 분류 153
4.2.1 특징 변수를 이용한 이미지 분류 153
4.2.2 합성곱 필터의 동적인 학습 159
4.3 합성곱 필터를 이용한 필기 문자 분류 163
4.3.1 세션 정보의 저장 기능 163
4.3.2 단층 CNN을 이용한 필기 문자 분류 165
4.3.3 동적으로 학습된 필터 확인 171

CHAPTER 5 합성곱 필터의 다층화를 통한 성능 향상 177
5.1 합성곱 신경망의 완성 179
5.1.1 다층형 합성곱 필터를 이용한 특징 추출 179
5.1.2 텐서플로를 이용한 다층 CNN 구현 184
5.1.3 필기 문자의 자동 인식 애플리케이션 189
5.2 그 밖의 주제 195
5.2.1 CIFAR-10(컬러 사진 이미지) 분류를 위한 확장 195
5.2.2 ‘A Neural Network Playground’를 이용한 직감적 이해 199
5.2.3 보충: 오차 역전파법을 이용한 기울기 벡터 계산 204

APPENDIX 부록 213
A 맥OS와 윈도우에서의 환경 준비 방법 214
A.1 맥OS의 환경 준비 과정 214
A.2 윈도우10의 환경 준비 과정 218

B 파이썬 2의 기본 문법 225
B.1 Hello, World!와 자료형, 연산 225
B.2 문자열 226
B.3 리스트와 딕셔너리 228
B.4 제어구문 230
B.5 함수와 모듈 233
C 수학 공식 235

찾아보기 237

나카이 에츠지(中井 悦司)
1971년 4월 오사카에서 태어났다. 노벨 물리학상을 타고 싶어서 이론물리학 연구에 몰두하며 학창시절을 보냈다. 그리고 대학 입시학원 강사 등 여러 직업을 거쳐 외국계 기업의 리눅스 엔지니어로서 유닉스/리눅스 서버와 인생을 함께하게 되었다. 리눅스 에반젤리스트를 거쳐 현재는 대형 검색 시스템 기업에서 클라우드 및 솔루션 아키텍터로 일하고 있다.
휴일에는 사랑스러운 초등학생 딸과 스포츠 센터에 수영하러 다니는 ‘좋은 아빠’로 동네에서 유명하다. ‘세계 평화’를 위해 일찍 집에 들어가려고 애쓰면서도 가끔은 각별히 사랑하는 변두리 선술집에 자신도 모르게 들르기도 한다. 요즘에는 머신러닝 이론을 비롯한 데이터 활용 기술에 관한 기초 지식을 세상에 널리 알리기 위해 강연 활동 및 잡지 기고나 서적 집필에도 주력하고 있다.

1. 역자 소개
진명조
현재 씨디네트웍스에 근무하고 있으며, 《서버/인프라 엔지니어를 위한 DevOps》, 《서버/인프라를 지탱하는 기술》, 《파이썬 더 쉽게, 더 깊게》, 《대규모 서비스를 지탱하는 기술》, 《클라우드의 충격》, 《인프라 엔지니어의 교과서: 시스템 구축과 관리편》을 포함하여 13종의 기술 서적을 번역하였다. IT 산업의 미시적인 영역과 거시적인 영역을 아우르는 통찰력을 갖게 되기를 꿈꾸고 있으며, 최근에는 머신러닝을 비롯한 인공지능(AI)의 대중화에 주목하고 있다.
등록된 서평이 없습니다.
 
전체평균(0)
회원평점   회원서평수 0
나카이 에츠지 의 최근 저서
 
머신러닝 이론 입문
22,500원
(10%↓+5%)
 
제이펍 출판사의 신간
알고리즘 도감
이시다 모리테루 저
18,000원
(10%↓+5%)
 
앵귤러 마스터북
네이트 머레이, 필리피 커리, 아리 러너, 칼로스 타보다 저
30,600원
(10%↓+5%)
 
쿠카의 코딩 크래프트
최성권 저
15,120원
(10%↓+5%)
 
사이트 신뢰성 엔지니어링
벳시 베이어, 크리스 존스, 제니퍼 펫오프, 니얼 리처드 머피 저
32,400원
(10%↓+5%)
 
AWS Lambda 인 액션 : 빠른 서버리스 앱 개발을 위한
다닐로 포치아 저
25,200원
(10%↓+5%)
 
이메일주소수집거부