vLLM 启动命令生成器

根据你的硬件和模型,一键生成可复制的 vLLM 启动命令。支持原生、Docker 和 docker-compose 三种格式。

1选择模型
2选择硬件
3调整参数
--enable-prefix-caching,适合多轮对话
--enable-chunked-prefill,提升吞吐

生成结果