로그인회원가입장바구니고객센터마이페이지회사소개
kangcom
전체
Home >   >   > 

안드로이드 음성 인식 애플리케이션 개발

 [구글 음성 인식 API와 다중 모달 인터페이스를 이용한 acorn+PACKT]
   
지은이 마이클 맥티어, 조라이다 까예하스   |   출판사 에이콘  |   발행일 2014년 08월 29일
 
클릭하시면 큰 도서이미지를 보실 수 있습니다.
판매가 16,000원14,400원 10%
마일리지 5% 800원
발행일 2014-08-29
ISBN 8960775746 | 9788960775749
기타정보 번역서 | 164쪽 | 일반
예상출고일 1~2일 이내 (근무일기준)
배송비 2,000원 (20,000원이상 무료배송)
   
종합지수 0p
   
이 책의 원서
  Voice Application Development for Android
Packt Publishing | Michael McTear
 

이 책은 구글 안드로이드 범용 애플리케이션 개발을 넘어 사용자들이 큰 관심을 가지고 있는 대화형 음성 인식 애플리케이션 개발을 위한 훌륭한 지침서다. 다중 언어와 다중 모달 다이얼로그를 이용해서 사용자의 의도를 파악하고 지속적인 대화를 제공할 수 있는 가상 개인비서 앱을 만들고 싶다면 이 책이 바로 그 시작점이 될 것이다.



[요약 ]



이 책은 구글 안드로이드 범용 애플리케이션 개발을 넘어 사용자들이 큰 관심을 가지고 있는 대화형 음성 인식 애플리케이션 개발을 위한
훌륭한 지침서다. 다중 언어와 다중 모달 다이얼로그를 이용해서 사용자의 의도를 파악하고 지속적인 대화를 제공할 수 있는 가상 개인비서
앱을 만들고 싶다면 이 책이 바로 그 시작점이 될 것이다.



[이 책에서 다루는 내용 ]



이 책은 독자가 기초적인 기술 기반으로 좀 더 진보되고 매력적인 애플리케이션을 개발할 수 있도록, 알기 쉬운 단계별 예제들을 다양하게
제공하는 실무 가이드다. 안드로이드 단말에서 즉시 사용할 수 있는 유용한 음성 인식 애플리케이션을 개발하는 방법을 배울 수 있다.

이 책에서는 음성 인식 앱 개발을 지탱하는 기술을 알기 쉽고 직관적인 방법으로 설명한다. 안드로이드 단말 사용자의 말을 인식하고 대화하는
앱을 개발하기 위해 오픈소스 소프트웨어를 사용하는 방법을 배운다. 오픈소스 소프트웨어를 기반으로, 유용한 태스크를 수행하는 좀 더 복잡한
앱을 개발해보고, 독자의 요구사항에 맞게 변경할 수 있는 간단한 음성 기반 개인비서 앱 개발 방법도 배울 것이다.



▪ 단말과 사용자가 대화할 수 있는 텍스트와 음성 간 합성 기술 사용법

▪ 단말이 사용자의 음성을 인식하게 하는 방법

▪ 단말이 사용자의 명령을 받아 실행할 수 있는 간단한 음성 상호작용 실행 방법

▪ 트랜잭션을 수행하는 데 필요한 정보를 수집하기 위해 사용자와 다이얼로그를 실행하는 음성 앱 개발

▪ 앱이 사용자의 말에 담긴 의미를 이해할 수 있는 문법을 사용하는 방법

▪ 다양한 언어 사용

▪ 음성에 대한 차선책으로 앱에 다중 모달 상호작용 기능을 추가하는 방법

▪ 챗봇 개발을 위해 오픈소스 기반 개발 플랫폼을 이용한 음성기반 개인비서 앱 개발


[ 이 책의 대상 독자 ]



이 책은 음성 기술과 모바일 컴퓨팅을 전공하는 학생을 포함해서 음성 처리 애플리케이션 개발에 흥미가 있는 모든 사람들을 위해 집필되었다.
범용적으로 사용되는 프로그램 개발 배경지식이 필요하며 특히 자바 언어에 대해 알고 있어야 한다. 더불어 안드로이드 프로그래밍에도 익숙하면
많은 도움이 된다.



[이 책의 구성 ]



1장, '안드로이드 단말의 음성 처리'는 안드로이드 단말에서 음성이 사용되는 방법을 설명하고 연관된 기술의 윤곽을 잡는다.

2장, '텍스트와 음성 간 합성'은 텍스트와 음성 간 합성의 기술을 설명하고 구글 TTS 엔진의 사용 방법을 보인다.

3장, '음성 인식'은 음성 인식 기술의 요약 내용과 구글이 공개한, 음성에서 텍스트로 전환하는 엔진의 사용 방법을 설명한다.

4장, '음성 상호작용'은 사용자와 앱이 정보를 얻거나 특정 액션을 실행하기 위해 서로 말할 수 있는 단순한 상호작용 기능을 구현하는
방법을 설명한다.

5장, '폼 작성 다이얼로그'는 음성을 처리할 수 있는 다이얼로그의 생성 방법을 설명하는데, 이 다이얼로그는 기존 웹 애플리케이션의 폼
작성 기법과 유사하다.

6장, '다이얼로그를 위한 문법'은 단어나 구, 혹은 그 이상의 사용자 입력을 번역하기 위해 사용하는 문법을 소개한다.

7장, '다중 언어와 다중 모달 다이얼로그'는 다양한 언어와 모달 기능을 사용하는 앱의 개발 방법을 설명한다.

8장, '가상 개인비서 다이얼로그'는 음성을 처리할 수 있는 가상 개인비서 앱의 개발 방법을 보여준다.


1장 안드로이드 단말의 음성 처리
__안드로이드 단말의 음성 기능 활용
____음성에서 텍스트로
____텍스트를 음성으로 변환
____음성 검색
____안드로이드 음성 처리 액션
____가상 개인비서
__음성 처리 앱의 설계와 개발
__왜 구글 스피치인가
__가상 개인비서를 개발하기 위해 무엇이 필요한가
__요약

2장 텍스트와 음성 간 합성
__TTS() 소개
__TTS 기술
__TTS 대신 미리 녹음된 음성 데이터의 사용
__구글 TTS의 사용
____TTS 엔진 사용의 시작
__구글 TTS를 적용한 애플리케이션 개발
____TTSLib 파일을 사용한 애플리케이션: 사용자 입력 읽기
____TTSReadFile을 사용한 애플리케이션: 파일 내용 읽기
__요약

3장 음성 인식
__음성 인식 기술
__구글 음성 인식 기술의 사용
__구글 음성 인식 API를 활용한 애플리케이션 개발
____ASRWithIntent를 사용한 애플리케이션
____ASRWithLib를 사용한 애플리케이션
__요약

4장 음성 상호작용
__음성 상호 작용
__음성으로 검색하는 앱
__음성 시작 명령을 사용하는 앱
__음성 검색 확인 앱
__요약

5장 폼 작성 다이얼로그
__폼 작성 다이얼로그
__폼 작성 다이얼로그 구현
__스레딩
__XMLLib
__FormFillLib
____VXMLParser
____DialogInterpreter
__뮤직브레인 앱
__요약

6장 다이얼로그를 위한 문법
__음성 인식과 자연어 이해를 위한 문법
__특수 문법이 적용된 NLU
__통계 문법이 적용된 NLU
____NLU 라이브러리
____XML 문법 처리
____통계 문법 처리
__문법 테스트 앱
__요약

7장 다중 언어와 다중 모달 다이얼로그
__다중 언어의 사용
__다중 모달
__요약

8장 가상 개인비서 다이얼로그
__가상 개인비서 구현 기술
____사용자의 의도 결정
__적절한 응답 생성하기
__판도라봇
____AIML
______다양한 기능을 추가하기 위한 oob 태그 사용
__VPALib 라이브러리
__판도라봇 생성
__샘플 가상 개인 비서: Jack, Derek, Stacy
____또 다른 가상 개인 비서
__요약

9장 앱 개발의 심화단계
__좀 더 발전된 가상 개인비서 개발
__요약

저자 : 마이클 맥티어

저자 마이클 맥티어(Michael McTear)는 음성 언어 기술 분야에 관심이 많은 얼스터(Ulster) 대학 지식 엔지니어링 연구실의 명예 교수로 재직하고 있다. 1965년 퀸스 대학교 벨파스트(Queens University Belfast)에서 독일어와 문학을 전공했고, 1975년 에섹스(Essex) 대학에서 언어분야 문학석사 학위를 취득했으며, 1981년 얼스터 대학에서 박사 학위를 받고 졸업했다. 1986년부터 1987년까지 하와이 대학 교수와, 1994년부터 1995년 독일 코블렌쯔 대학 교수, 그리고 2006년부터 2010년까지 스페인 그라나다 대학 객원교수를 맡았다. 15년 넘게 음성 다이얼로그 시스템 분야에서 연구 활동을 해 왔고 지금은 널리 쓰이고 있는 책인 『Spoken Dialogue Technology: Toward the Conversational User Interface(음성 다이얼로그 기술: 대화형 사용자 인터페이스를 향해)』(슈프링거 출판사, 2004)의 저자다. 또한 『Spoken Dialogue Systems (음성 다이얼로그 시스템)』(모건 앤 클레이풀 출판사, 2010)의 공동저자이기도 하다.



2004년 제네바에서 개최된 EU가 후원하는 DUMAS 워크숍, 2005년 리스본에서 개최된 SIGDial 워크숍, 그리고 2005년 그라나다에서 개최된 자연어 처리에 관한 스페인 컨퍼런스(SEPLN)를 포함한 많은 컨퍼런스와 워크숍에서 기조 연설을 했고, 2006년 아루바, 2007년 프라하에서 개최된 IEEE/ACL 컨퍼런스에서 초대 강연을 했다. 뉴욕과 런던에 있는 음성 처리 전문 기술 관련 컨퍼런스인 스피치텍(SpeechTEK)에서도 여러 번 강연을 했다. 공인 VoiceXML 개발자이자, 제네시스(Genesys), 오라클, 오렌지(Orange), 3, 후지쯔(Fujitsu), 산탄더(Santander)를 비롯한 많은 회사의 전문 트레이닝 코스에서 VoiceXML 과정을 강의한다. 북아일랜드에 위치한 울스터 병원에서 사용하는 2형 당뇨병 환자들을 위한 VoiceXML 기반 가정용 모니터링 시스템의 핵심 개발자이기도 했다.



저자 : 조라이다 까예하스

저자 조라이다 까예하스(Zoraida Callejas)는 지난 8년간 음성 다중 모달 인터페이스, 객체지향 프로그래밍, 소프트웨어 엔지니어링과 연관된 여러 주제를 강의했던 스페인 그라나다 대학에서 조교수로 재직 중이다. 2005년 컴퓨터과학과를 졸업하고, 그라나다 대학에서 2008년 박사 학위를 받았다. 체코의 리버레크 공과대학에서 2007년부터 13년까지, 이탈리아 트렌토 대학에서 2008년, 북 아일랜드의 얼스터 대학에서 2009년, 독일 베를린 공과대학에서 2010년, 독일 울름 대학에서 2012년, 프랑스 텔레콤 파리 공과대학에서 2013년에 객원 교수로 재직했었다.

음성 기술 연구에 매진하면서 특히 음성 다중 모달 다이얼로그 시스템에 온 열정을 바쳤다. 다이얼로그 시스템 분야에서 주최하는 핵심 컨퍼런스에서 많은 발표를 했고 여러 국제 저널과 서적을 통해 연구 성과를 발표했다. 조라이다는 상호 연결할 수 있는 음성 처리 시스템 개발 교육 과정을 개설해서 9년간 여러 대학원 과정에서 자바로 작성한 객체 지향 소프트웨어 개발 과정을 정기적으로 강의했다. 현재는 지적 장애가 있는 사용자를 위해 국내에서 진행 중인 안드로이드 기반 음성 처리 애플리케이션 개발 프로젝트를 이끌고 있다.



역자 : 조효성

역자 조효성은 광운대학교 전자공학과를 졸업하고 동대학원 임베디드 소프트웨어 공학과에서 안드로이드와 블루투스를 전공했다. 현재는 오비고에서 웹 개발자로 활동하고 있는 노드에 관심이 많은 행복 개발자이다. 행복한 HMI WebApp 개발팀에서 차량용 플랫폼에 올라가는 웹 앱을 개발하면서 많은 경험과 실력을 쌓고 있다. 번역 작업을 통해, 책을 읽는 모든 사람에게 꼭 도움이 되기를 바라는 마음을 늘 품고 있다. 에이콘출판사에서 출간한 『노드로 하는 웹 앱 테스트 자동화』(2013), 『익스프레스 프레임워크로 하는 노드 웹 앱 프로그래밍』(2014), 『Storm 실시간 빅데이터 분석 플랫폼』(2014)을 번역했다.


등록된 서평이 없습니다.
사이토 고키...
야마다 요시...
애덤 프리먼...
 
전체평균(0)
회원평점   회원서평수 0
에이콘 출판사의 신간
『Windows Debugging 2/e: WinDbg로 배우는 윈도우 디버깅』
최바울, 이태화, 김희준, 김성현 저
49,500원
(10%↓+5%)
 
『C++ 멀티스레딩 정복하기: 견고하면서도 병렬성과 병행성을 가지는 애플리케이션 작성법』
마야 포쉬 저
22,500원
(10%↓+5%)
 
『타이핑 슈팅 액션 게임 개발 with 유니티 2/e : 유니티 상급 개발자로 올라서기』
앨런 쏜 저
36,000원
(10%↓+5%)
 
『파이썬과 비즈니스 자동화: 파이썬 레시피와 함께하는 비즈니스 자동화 프로그래밍 개발』
체탄 기리다 저
27,000원
(10%↓+5%)
 
『*OS Internals Vol.3: 애플 운영체제의 보안과 취약점』
조나단 레빈 저
45,000원
(10%↓+5%)
 
이메일주소수집거부