경기대학교 전자책도서관

책소개

AI 기능이 ‘모델 선택’에서 끝나던 시기는 지났습니다. 실제 서비스에서는 GPU 자원, 스케일링, 장애 대응, 비용 통제, 멀티 테넌트 운영 같은 인프라 문제가 곧 성능과 사용자 경험을 좌우합니다. 『AI 서비스 엔지니어를 위한 쿠버네티스』는 LLM·RAG·에이전트 워크로드를 안정적으로 굴리기 위해 쿠버네티스를 중심으로 클러스터 설계부터 배포, 서빙 표준화, 파이프라인, 분산 서빙 아키텍처, 관찰 가능성과 운영 플레이북까지 단계적으로 정리합니다. KServe, Kubeflow, Ray Serve 등 실무에서 자주 맞닥뜨리는 구성 요소를 ‘왜 쓰는지’와 ‘어떻게 운영하는지’ 관점에서 연결해, AI 서비스 엔지니어가 바로 적용할 수 있는 운영 감각을 제공합니다.

저자소개

AI 서비스 엔지니어를 위한 쿠버네티스

프롤로그 문제는 모델이 아니라, AI 인프라다

1장 LLMRAG에이전트 워크로드와 클라우드 네이티브 기본기
1장 요약

2장 AI 워크로드 친화적인 쿠버네티스 클러스터 설계
2장 요약

3장 LLMRAG 서비스 컨테이너라이징과 배포 전략
3장 요약

4장 KServe로 LLMRAG 모델 서빙 표준화하기
4장 요약

5장 Kubeflow 기반 임베딩인덱싱재학습 파이프라인
5장 요약

6장 Ray Serve 기반 분산 LLM에이전트 서빙 아키텍처
6장 요약

7장 GPU 스케줄링오토스케일링비용 최적화
7장 요약

8장 멀티 모델멀티 테넌트 사내 AI 서비스 인프라 설계
8장 요약

9장 관찰 가능성장애 대응운영 플레이북
9장 요약

10장 단계별 도입 로드맵과 조직 설계

에필로그 조직과 기술이 함께 성숙하는 AI 인프라

판권기재

책소개

저자소개

목차