상세정보
AI 서비스 엔지니어를 위한 쿠버네티스 : LLM·RAG·에이전트를 쿠버네티스로 안정적으로 운영하는 실전 인프라 가이드: 쿠버네티스, MLOps, GPU스케줄링, LLM서빙, RAG, 클라우드네이티브, 비용최적화
미리보기

AI 서비스 엔지니어를 위한 쿠버네티스 : LLM·RAG·에이전트를 쿠버네티스로 안정적으로 운영하는 실전 인프라 가이드: 쿠버네티스, MLOps, GPU스케줄링, LLM서빙, RAG, 클라우드네이티브, 비용최적화

저자
플로우인사이트 저
출판사
스마트북
출판일
2025-12-24
등록일
2026-01-28
파일포맷
EPUB
파일크기
642KB
공급사
예스이십사
지원기기
PC PHONE TABLET 웹뷰어 프로그램 수동설치 뷰어프로그램 설치 안내
현황
  • 보유 1
  • 대출 0
  • 예약 0

책소개

AI 기능이 ‘모델 선택’에서 끝나던 시기는 지났습니다. 실제 서비스에서는 GPU 자원, 스케일링, 장애 대응, 비용 통제, 멀티 테넌트 운영 같은 인프라 문제가 곧 성능과 사용자 경험을 좌우합니다. 『AI 서비스 엔지니어를 위한 쿠버네티스』는 LLM·RAG·에이전트 워크로드를 안정적으로 굴리기 위해 쿠버네티스를 중심으로 클러스터 설계부터 배포, 서빙 표준화, 파이프라인, 분산 서빙 아키텍처, 관찰 가능성과 운영 플레이북까지 단계적으로 정리합니다. KServe, Kubeflow, Ray Serve 등 실무에서 자주 맞닥뜨리는 구성 요소를 ‘왜 쓰는지’와 ‘어떻게 운영하는지’ 관점에서 연결해, AI 서비스 엔지니어가 바로 적용할 수 있는 운영 감각을 제공합니다.

QUICKSERVICE

TOP