Python | CUDA 與 cuDNN：用途與環境安裝

📚 前言

在前兩篇文章中，我們已經建立了 Python 與 Conda 的基礎環境。接下來，若要進行深度學習或圖片處理，就需要讓 GPU 幫忙加速。這篇文章將介紹 CUDA 與 cuDNN 的用途，以及如何在環境中安裝它們。

🤔 為什麼需要 CUDA 與 cuDNN

CPU vs GPU：CPU 適合少量複雜運算，GPU 擅長大量並行運算。
深度學習需求：訓練神經網路需要大量矩陣乘法與卷積，GPU 加速能縮短數天到數小時。
框架整合：TensorFlow、PyTorch 等框架都依賴 CUDA/cuDNN 來加速。

🎯 這些東西到底用來幹嘛？

對新手來說，安裝 CUDA 與 cuDNN 可能感覺很抽象，但它們其實是讓你的電腦 GPU 能夠幫助你更快完成深度學習任務的關鍵工具。

CUDA 是 NVIDIA 提供的工具包，讓開發者能寫程式直接控制 GPU，進行大量平行計算，像是圖片處理、科學計算、機器學習等。
cuDNN 是專門針對深度學習優化的函式庫，它幫助深度學習框架（如 TensorFlow、PyTorch）更有效率地使用 GPU，加速神經網路的訓練與推論。

換句話說，安裝這些東西後，你就能用 GPU 來跑深度學習模型，讓訓練速度快很多，而不是只能靠 CPU 慢慢算。

⏰ 什麼時候才需要安裝？

其實，對新手來說，剛開始學習 Python 或框架時，不一定馬上需要安裝 CUDA 與 cuDNN。

如果你只是寫一些簡單的程式或學習基礎概念， CPU 就足夠了。
只有當你開始要跑大型深度學習模型，或需要加速訓練時，才需要安裝這些工具。

所以，安裝 CUDA 與 cuDNN 是為了未來的需求做準備，不必急著一開始就裝，可以等到確定要用 GPU 加速時再來安裝。

👉 下面我們來看看，CUDA 與 cuDNN 用途與環境安裝。

🔥 CUDA 是什麼？

全名：Compute Unified Device Architecture
開發者：NVIDIA
用途：提供 GPU 通用運算平台，讓開發者能用 C/C++、Python 等語言編寫 GPU 程式。
應用場景：科學計算、圖片處理、機器學習、模擬運算等。

🧠 cuDNN 是什麼？

全名：CUDA Deep Neural Network library
開發者：NVIDIA
用途：專為深度學習優化的 GPU 加速函式庫。
支援操作：卷積、池化、激活函數、歸一化、Softmax 等。
整合框架：TensorFlow、PyTorch、Caffe 等。

🛠️ 安裝前準備

確認 GPU 型號：
1
nvidia-smi
確認驅動版本：NVIDIA Driver 必須與 CUDA 相容。
選擇 CUDA/cuDNN 版本：依照框架需求（例如 PyTorch 官網會列出支援的 CUDA 版本）。

📝 提醒：截至目前為止 Pytorch 的 CUDA 最新版本是13.0，而絕大多數的中高階 GPU 皆能支援此一最新版的 Pytorch，如果 CUDA 版本低於 13.0，可以試試看先更新顯卡驅動程式。

⚙️ 安裝步驟

👉 此部分使用的是手動安裝方式。

到 NVIDIA CUDA Toolkit 官網下載對應版本。
安裝 CUDA Toolkit。
到 NVIDIA cuDNN 官網根據作業系統下載對應安裝檔。

📝 另外提供 NVIDIA cuDNN 歷史版本頁面：連結
⚠️ 注意：NVIDIA cuDNN 早期的版本確實是以壓縮檔形式提供，使用者需要手動解壓縮並把 bin/, include/, lib/ 等檔案放到對應的 CUDA 安裝目錄裡。
安裝 NVIDIA cuDNN。

✅ 驗證安裝

檢查 CUDA：

1	nvcc --version

檢查 cuDNN

在 Jupyter Notebook 驗證：

啟動你的 Conda 環境
開啟 Jupyter Notebook，建立新筆記本
安裝 PyTorch（支援 CUDA）
- 使用 (PyTorch Start Locally)[https://pytorch.org/get-started/locally/] 選擇對應版本，複製指令安裝。
  
  ⚠️ 注意：指令執行後，需要一點安裝時間才會顯示安裝紀錄結果。

執行以下程式碼檢查 GPU 是否可用

import torch
print(torch.__version__)              # PyTorch 版本
print(torch.version.cuda)             # CUDA 版本
print(torch.backends.cudnn.version()) # cuDNN 版本
print(torch.cuda.is_available())      # True 代表 GPU 可用

⚠️ 注意：執行程式碼，如果 PyTorch 尚未安裝完畢，會於 PyTorch 安裝完畢後才顯示結果。

執行以下程式碼驗證 GPU 是否能正常運作

import torch
import time

# 檢查 GPU 是否可用
print("CUDA 是否可用：", torch.cuda.is_available())
print("cuDNN 版本：", torch.backends.cudnn.version())

# 建立一個大矩陣運算，測試 CPU vs GPU
size = 10000
a = torch.randn(size, size)
b = torch.randn(size, size)

# CPU 計算
start = time.time()
c_cpu = torch.mm(a, b)
print("CPU 花費時間：", time.time() - start, "秒")

# GPU 計算
a_gpu = a.cuda()
b_gpu = b.cuda()
start = time.time()
c_gpu = torch.mm(a_gpu, b_gpu)
torch.cuda.synchronize()  # 等待 GPU 完成
print("GPU 花費時間：", time.time() - start, "秒")

預期結果：

如果 CUDA 與 cuDNN 安裝正確，torch.cuda.is_available() 會回傳 True。

GPU 計算時間通常會比 CPU 快數倍，尤其在大矩陣或深度學習模型訓練時差異更明顯。

CUDA 是否可用： True
cuDNN 版本： 91200
CPU 花費時間： 2.8356847763061523 秒
GPU 花費時間： 0.3178558349609375 秒

⚠️ 常見問題與解法

版本不相容：請查 PyTorch/TensorFlow 官網的相容表。
- PyTorch
- TensorFlow
驅動過舊：更新 NVIDIA Driver。
多版本 CUDA：建議用 Conda 管理，避免系統環境混亂。
cuDNN 與 CUDA 版本支援：
- cuDNN 9.17.1 版本已支援 CUDA 13.x（包含 CUDA 13.1）版本，並優化最新 GPU 架構。
- 由於 CUDA 13 是較新版本，cuDNN Archive 頁面可能尚未列出對應版本，建議從官方最新版本頁面或開發者文檔下載。
- 使用最新 cuDNN 版本搭配 CUDA 13.1 可確保最佳相容性與效能。

結語 🎯

CUDA 與 cuDNN 是深度學習加速的基石。透過它們，我們能讓 GPU 發揮最大效能，縮短模型訓練時間。

在安裝過程中，最重要的是 版本相容性：CUDA、cuDNN、PyTorch/TensorFlow 之間必須對應正確，否則容易出現錯誤。建議讀者在安裝前先查官方相容表，並確認 GPU 驅動已更新。

此外，驗證方式不只限於 Jupyter Notebook，也可以直接用 PyCharm + Python 來快速檢查 GPU 是否可用，這樣能減少環境設定的麻煩。

總結來說：

初學者可以先用 CPU 學習框架基礎。
進階使用者在需要 GPU 加速時，再安裝 CUDA/cuDNN。
保持環境乾淨、版本一致，是避免安裝問題的關鍵。

只要掌握這些原則，就能順利在自己的電腦上開啟 GPU 加速的深度學習之路。

註：以上參考了
NVIDIA DEVELOPER
PyTorch
TensorFlow

Python | 虛擬環境介紹：Conda vs Virtualenv

Python | 安裝 PyCharm

↑
If you enjoy the article, please feel free to donate~ Thx.
若本文對您有幫助，您也願意支持打賞，謝謝您的鼓勵。

本文由J.J. Huang 創作，採用CC BY 3.0 TW協議進行許可。可自由轉載、引用，但需署名作者且註明文章出處。

J.J.'s Blogs

J.J. Huang 2026-01-03 Python Setup CUDA & cuDNN 瀏覽次數：次 {{moment(1767402000000).fromNow()}}