#SGLang
1개 글
SGLang은 vLLM보다 빠를까 — 로컬 LLM 서빙 엔진 선택 기준
SGLang, vLLM, Ollama를 RadixAttention, PagedAttention, OpenAI 호환 API, 설치 난이도, 운영 리스크 관점에서 비교하고 로컬 LLM 서버 도입 기준을 정리했다.
1개 글
SGLang, vLLM, Ollama를 RadixAttention, PagedAttention, OpenAI 호환 API, 설치 난이도, 운영 리스크 관점에서 비교하고 로컬 LLM 서버 도입 기준을 정리했다.