Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

AI人工智能学习大礼包

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 人工智能AI >

VLLM、LMdeploy模型部署 PDF 下载


分享到:
时间:2026-01-18 10:20来源:http://www.java1234.com 作者:转载  侵权举报
VLLM、LMdeploy模型部署
失效链接处理
VLLM、LMdeploy模型部署 PDF 下载

 
 
相关截图:
 
主要内容:
 
1.Vllm 先安装环境需求:
 
conda init
conda create -n vllm python=3.12 -y
conda env list
conda activate vllm
pip install vllm
pip install modelscope
下载模型
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir
/root/autodl-tmp/model
modelscope download --model Qwen/Qwen3-0.6B --local_dir /root/autodltmp/qwen_model
vLLM运行大模型
sh命令:
vllm serve /root/autodl-tmp/model/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
vllm serve /root/autodl-tmp/qwen_model/Qwen/Qwen3-0.6B

 

vllm serve /root/autodl-tmp/model --api-key 12345 --served-model-name qwen --port
6006 --max-model-len 2048 --max-num-seqs 96
vllm serve /root/autodl-tmp/train_data/1.5b \
--api-key 12345 \
--served-model-name qwen \
--port 6006 \
--tensor-parallel-size 2 \
--max-model-len 2048 \
--max-num-seqs 96 \
--max-num-batched-tokens 8192 \
--gpu-memory-utilization 0.85 \
--enable-prefix-caching \
--disable-custom-all-reduce \
--disable-log-requests
ps aux
kill -9



 


------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐