sglang--deepseek

环境

os:centos7.9

cuda:12.4

gcc:12.1

conda create -n SGLang python=3.10 -y

conda activate SGLan

pip install --upgrade pip

pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1

pip install "sglang[all]" --find-links https://flashinfer.ai/whl/cu118/torch2.4/flashinfer/

python3 -m sglang.launch_server --model ./DeepSeek-R1-AWQ --tensor-parallel-size 8 --trust-remote-code --served-model-name deepseek-reasoner

文章作者: Administrator
本文链接:
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 IKKO
喜欢就支持一下吧