通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结
一,通过vllm部署qwen3模型。1.安装vllmcondacreate-nqwen3python=3.9-ycondaactivateqwen3pipinstallvllm2.下载qwen3模型文件下载完整模型库modelscopedownload--modelQwen/Qwen3-1.7B下载单个文件到指定本地文件夹(以下载README.md到当前路径下“dir”目录为例)modelscop