vLLM 启动命令生成器
根据你的硬件和模型,一键生成可复制的 vLLM 启动命令。支持原生、Docker 和 docker-compose 三种格式。
1选择模型
2选择硬件
3调整参数
--enable-prefix-caching,适合多轮对话
--enable-chunked-prefill,提升吞吐
生成结果