环境准备-显卡驱动
nvidia-smi

环境准备-conda
conda -V

创建conda的Xinference环境
conda create --name xinference python=3.10
conda activate xinference
安装指定 cupy, cudnn, cutensor, nccl 并指定 cuda 版本

conda install -c conda-forge cupy cudnn cutensor nccl cuda-version=12.4
安装 Xinference
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple "xinference[all]"
验证安装(true)
python -c "import torch; print(torch.cuda.is_available())"

问题记录

方案一:取消xinference的全部环境,只安装自己需要的
方案二:使用如下命令尝试重新安装
sudo apt-get update
sudo apt-get install python3-dev build-essential cmake libcudart-dev gcc g++ libgomp1
conda activate xinference
conda install -c conda-forge libgomp
conda install -c conda-forge gxx_linux-64
conda install -c conda-forge openmp
conda install -c nvidia cudatoolkit=12.4 cuda-version=12.4
CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python -U