상세정보
미리보기
자바와 파이썬으로 만드는 빅데이터 시스템 : 하둡, 카프카, 아파치 스파크로 연결하는 나만의 빅데이터 전처리 파이프라인 구현
- 저자
- 황세규 저
- 출판사
- 제이펍
- 출판일
- 2023-06-15
- 등록일
- 2023-08-02
- 파일포맷
- PDF
- 파일크기
- 66MB
- 공급사
- 예스이십사
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
빅데이터 프로그래밍을 위한 최고의 입문서!로컬에서 작은 규모나마 직접 빅데이터 서비스를 구현함으로써 독자들이 서비스 아키텍처에 대한 이해와 통찰력을 얻는 데 목표를 두며, 빅데이터 사용과 구현방식의 다양성을 위해 이 책은 자바와 파이썬으로 실습 애플리케이션을 구현하고, 각 빅데이터 기술의 설치와 설정에 있어서도 윈도우 11과 우분투 22.04에서 작업을 수행하며, 마지막으로 통합 개발환경은 이클립스 IDE를 사용하여 단일 개발환경에서 이 모든 개발을 진행합니다.
저자소개
연세대학교에서 기계공학을 전공했고 동 대학원에서 석사학위를 취득하였다. 소프트웨어 사업을 천직으로 여기며 끊임없는 자기계발과 인사이트를 찾으려 하는 기술 작가다. 오픈소스 기술이 가져오는 열린 마음, 포용적이고 개방적인 영향력을 체험하며 오픈소스 관련 개발 언어와 서비스에 대한 서적을 집필하고 있다. 《Eclipse와 JBoss7을 이용한 Java 웹서비스 구축》(홍릉과학출판사), 《빅데이터 프로그래밍》(지앤선)을 집필하였다
목차
머리말 viii베타리더 후기 xiiCHAPTER 1 빅데이터 개론 11.1 빅데이터란? 11.2 빅데이터 저장과 분석 121.3 데이터 전처리와 람다 아키텍처 23CHAPTER 2 개발 통합 환경 292.1 자바 설치 292.2 파이썬 설치 342.3 이클립스 설치 및 설정 392.4 저장소 설치 512.5 실습 데이터 63CHAPTER 3 하둡 파일 시스템 I 893.1 하둡 구조 및 기능 893.2 하둡 파일 시스템 설치 및 설정 933.3 하둡 파일시스템 API 114CHAPTER 4 하둡 파일 시스템 II 1294.1 자바 실습 프로젝트 1294.2 파이썬 실습 프로젝트 172CHAPTER 5 카프카를 이용한 데이터 송수신 1975.1 카프카의 개념과 기능 1975.2 카프카 설치 및 설정 2025.3 카프카 메시지 서비스의 API 2115.4 자바 실습 프로젝트 2245.5 파이썬 실습 프로젝트 231CHAPTER 6 아파치 스파크 배치 작업 I 2376.1 아파치 스파크의 개념과 하부 프로젝트 2376.2 아파치 스파크 설치 및 설정 2426.3 아파치 스파크 SQL API 252CHAPTER 7 아파치 스파크 배치 작업 II 2957.1 자바 실습 프로젝트 2957.2 파이썬 실습 프로젝트 306CHAPTER 8 아파치 스파크 스트리밍 작업 3178.1 아파치 스파크의 구조화 스트리밍 개념 3178.2 아파치 스파크 구조화 스트리밍 API 3228.3 자바 실습 프로젝트 3298.4 파이썬 실습 프로젝트 335CHAPTER 9 MySQL 데이터 작업 3419.1 관계형 데이터베이스 정의와 개념 3419.2 SQL 및 Python API 3479.3 파이썬 실습 프로젝트 376CHAPTER 10 몽고디비 데이터 작업 38910.1 몽고디비 개념과 특징 38910.2 몽고디비 API 39410.3 파이썬 실습 프로젝트 406찾아보기 415