구차니의 잡동사니 모음

exllama

vLLM 처럼 먼가 복수의 gpu를 복수의 사용자에게 서빙하는 걸 찾는 중인데..

이거 맞...나?

curl로 llama-swap 에게 api로 요청하기 (0)	2026.06.10
llama.cpp prompt 옵션 (0)	2026.06.10
stable diffusion train (0)	2026.06.10
gemma4-e4b it qat / gemma4-12b mtp on 1080 ti 11GB (0)	2026.06.08
nvidia 3070 8GB 테스트 gemma4-e4b (0)	2026.06.08

Posted by 구차니

구차니

나란히 동등하게 함께

잡동사니

Programming

Linux

Linux API

Microsoft

Apple

embeded

하드웨어

이론 관련

회사일

프로그램 사용

모종의 음모

게임

개소리 왈왈

아이디어!

파일방