룰모아 노트

  • 홈
  • 태그
  • 방명록

vllm 1

vLLM v0.18 / v0.19 업데이트 해부: gRPC 서빙, 비동기 스케줄링, CVE-2026-0994까지

도입LLM 프로덕션 서빙의 사실상 표준인 vLLM이 2026년 4월에 두 차례의 메이저 릴리스를 내놨습니다. 3월 말의 v0.18.0은 gRPC 서빙과 GPU 스펙큘레이티브 디코딩을 들고 왔고, 4월 2일의 v0.19.0은 비동기 스케줄링을 기본값으로 전환하고 Gemma 4 아키텍처를 Day-0로 지원합니다. 더해서 Completions API에서 원격 코드 실행이 가능했던 CVE-2026-0994 패치도 이 사이클에 포함되어, 프로덕션 사용자는 가급적 빠르게 업그레이드가 필요합니다. 이 글에서는 릴리스의 의미, 성능 수치, 코드 관점에서의 변화를 정리합니다.📌 한 줄 요약v0.18.0 (2026년 3월 말): gRPC 서빙, GPU NGram 스펙큘레이티브, FlexKV 오프로딩, GPU-less r..

AI News 2026.04.19
이전
1
다음
더보기
프로필사진

룰모아 노트

rulmoa 님의 블로그 입니다.

  • 분류 전체보기 (20)
    • AI News (13)
    • AI Tips (7)

Tag

llm-wiki, LLM, OpenAI, 오픈소스, anthropic, graphify, 바이브코딩, claudecode, claude code, mcp, Skills, Gemini, Google Cloud Next 2026, AI에이전트, codex, Karpathy, 클로드, claude, AI코딩, 개발자도구,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바