Skip to content

在 windows 中安装 cuda

如当前最新版本 cuda_12.8.1_572.61_windows.exe

可以官网上找 CUDA Toolkit 下载对应的版本

选择版本:

  • 操作系统 Windows
  • 架构 x86_64
  • 版本 11
  • 安装方式 exe (local)

选择自定义。 cuda-toolkit-install-1

显卡驱动已经有了,不需要勾选。

cuda-toolkit-install-2

安装后查看情况

console
PS C:\Users\Administrator> nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Fri_Feb_21_20:42:46_Pacific_Standard_Time_2025
Cuda compilation tools, release 12.8, V12.8.93
Build cuda_12.8.r12.8/compiler.35583870_0
console
PS C:\Users\Administrator> nvidia-smi
Sun Mar  9 19:54:16 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 572.70                 Driver Version: 572.70         CUDA Version: 12.8     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4090      WDDM  |   00000000:01:00.0  On |                  Off |
|  0%   31C    P8             27W /  480W |     750MiB /  24564MiB |      1%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   1  NVIDIA GeForce RTX 4090      WDDM  |   00000000:05:00.0 Off |                  Off |
|  0%   29C    P8             17W /  480W |       0MiB /  24564MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|

pytorch 中使用 cuda

uv 安装 pytorch

先创建 python 虚拟环境。我这里推荐使用 uv 来管理(查看pypi镜像设置)虚拟环境

如果没有项目, 可以用 uv 创建一个。

bash
uv init study-pytorch
cd study-pytorch

# 创建虚拟环境
uv venv
# 按需激活 
# .\.venv\Scripts\activate

uv 项目增加带 cuda 的 pytorch,在 pyproject.toml 增加如下内容:

toml
[tool.uv.sources]
torch = [
  { index = "pytorch-cu126", marker = "sys_platform == 'linux' or sys_platform == 'win32'" },
]
torchaudio = [
  { index = "pytorch-cu126", marker = "sys_platform == 'linux' or sys_platform == 'win32'" },
]
torchvision = [
  { index = "pytorch-cu126", marker = "sys_platform == 'linux' or sys_platform == 'win32'" },
]

[[tool.uv.index]]
name = "pytorch-cu126"
url = "https://download.pytorch.org/whl/cu126"
explicit = true

用 uv 添加依赖

bash
# 下载可能比较慢,我的环境需要 1.5 小时。
uv add torch torchaudio torchvision

# 安装好后可以查包
uv pip list
# 或
uv tree

备注

  • 带 cuda 的 pytorch,有哪些版本,pypi的地址是多少?请参考 pytorch 的 get-started
  • 指定 sources 参考 uv 官方的说明:Using uv with PyTorch
  • 如果 不想创建 pyproject.toml 文件,只用 uv pip 的功能。可以用如下方式安装:
bash
# cd 到一个目录,如:
# cd ~/study-pytorch

# uv 创建虚拟环境 
# 创建 .venv 子目录
# 可以加 -p 3.x 参数指定 python 的版本
# uv venv -p 3.11
uv venv

# 指定 pypi 源的地址下载
uv pip install torch torchvision torchaudio --index https://download.pytorch.org/whl/cu126

验证 pytorch with cuda

如下代码可以放到 check_cuda.py

python
import torch

# 检查 PyTorch 是否支持 CUDA
print("CUDA available: ", torch.cuda.is_available())

# 如果 CUDA 可用,打印设备信息
if torch.cuda.is_available():
    print("CUDA Device Count: ", torch.cuda.device_count())
    print("CUDA Current Device: ", torch.cuda.current_device())
    print("CUDA Device Name: ", torch.cuda.get_device_name(torch.cuda.current_device()))
    print("CUDA Device Properties: ", torch.cuda.get_device_properties(torch.cuda.current_device()))

# 测试 CUDA 上的张量操作
if torch.cuda.is_available():
    tensor = torch.randn(5, 3)
    tensor = tensor.to('cuda')
    print("Random tensor on CUDA: ", tensor)

运行

bash
uv run python check_cuda.py

# 如 .\.venv\Scripts\activate 激活过虚拟环境,直接可以用 python 运行
# python check_cuda.py

结果,如:

console
CUDA available:  True
CUDA Device Count:  2
CUDA Current Device:  0
CUDA Device Name:  NVIDIA GeForce RTX 4090
CUDA Device Properties:  _CudaDeviceProperties(name='NVIDIA GeForce RTX 4090', major=8, minor=9, total_memory=24563MB, multi_processor_count=128, uuid=c522954a-xxx-529b-aa8c-xxx, L2_cache_size=72MB)
Random tensor on CUDA:  tensor([[ 0.6963,  0.9916, -0.7688],
        [ 3.0599, -0.4634,  0.0474],
        [-0.9436,  1.0714,  0.9171],
        [-0.3856, -1.3856,  0.4898],
        [-0.8716,  0.6349, -2.2697]], device='cuda:0')