从零到跑通模型：用Anaconda在Ubuntu上搭建PyTorch 1.7.1 + CUDA 11.0完整开发流

张

张建站

2026/4/21 18:08:18

10分钟阅读

从零到跑通模型：用Anaconda在Ubuntu上搭建PyTorch 1.7.1 + CUDA 11.0完整开发流

从零构建PyTorch 1.7.1开发环境Ubuntu系统下的深度学习工作流实战在深度学习项目开发中环境配置往往是第一个拦路虎。特别是当需要复现旧论文或维护历史项目时特定版本的PyTorch与CUDA组合可能成为必须跨越的技术门槛。本文将带你完整走通Ubuntu系统下PyTorch 1.7.1 CUDA 11.0环境的搭建流程不仅解决基础安装问题更构建从环境配置到实际模型训练的全链路工作流。1. 基础环境准备与验证1.1 系统要求与前置检查在开始安装前确保你的Ubuntu系统满足以下最低要求操作系统Ubuntu 18.04或更高版本推荐20.04 LTSGPU硬件NVIDIA显卡计算能力≥3.5驱动版本≥450.51.05运行以下命令检查NVIDIA驱动状态nvidia-smi预期输出应包含GPU型号和驱动版本信息。若未安装驱动可通过Ubuntu附加驱动工具或官方.run文件安装。1.2 Anaconda的科学安装策略不同于直接使用系统PythonAnaconda提供了更灵活的环境管理方案。以下是优化后的安装步骤获取最新安装脚本推荐使用清华镜像加速wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2022.05-Linux-x86_64.sh验证文件完整性sha256sum Anaconda3-2022.05-Linux-x86_64.sh对比输出与官网提供的校验值如a7c0afe862f6ea19a596801fc138bde0463abcbce1b753e8d5c474b506a2db2d执行静默安装避免交互确认bash Anaconda3-2022.05-Linux-x86_64.sh -b -p $HOME/anaconda3初始化conda并配置镜像源~/anaconda3/bin/conda init conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/注意若使用zsh等非bash shell需手动将conda初始化语句添加到对应配置文件中2. CUDA工具链精准配置2.1 版本匹配与组件安装PyTorch 1.7.1官方明确要求CUDA 11.0与cuDNN 8.0.5组合。安装时需特别注意组件版本要求兼容性说明CUDA11.0.2需匹配NVIDIA驱动≥450.51.05cuDNN8.0.5.39必须完全匹配NCCL2.7.8多卡训练必需使用以下命令安装CUDA Toolkitsudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/3bf863cc.pub sudo add-apt-repository deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ / sudo apt-get install cuda-toolkit-11-02.2 环境变量与路径配置现代Linux系统推荐使用/etc/profile.d/下的独立配置文件而非直接修改.bashrc创建cuda配置sudo tee /etc/profile.d/cuda.sh EOF export PATH/usr/local/cuda-11.0/bin:\$PATH export LD_LIBRARY_PATH/usr/local/cuda-11.0/lib64:\$LD_LIBRARY_PATH EOF立即生效配置source /etc/profile验证安装nvcc --version # 应显示11.0版本3. PyTorch环境构建与验证3.1 Conda环境精准控制创建隔离环境时指定Python 3.7PyTorch 1.7.1的最佳实践版本conda create -n pt171 python3.7 -y conda activate pt171安装PyTorch时使用国内镜像加速conda install pytorch1.7.1 torchvision0.8.2 torchaudio0.7.2 \ cudatoolkit11.0 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/3.2 依赖管理的工程化实践推荐使用分层requirements文件管理依赖基础依赖requirements-core.txtnumpy1.16.0,2.0.0 scipy1.3.0 matplotlib3.1.0扩展依赖requirements-extras.txtopencv-python-headless4.5.3.56 tensorboard2.4.1 scikit-learn0.24.2安装时使用pip的约束模式pip install -r requirements-core.txt --no-deps pip install -r requirements-extras.txt提示--no-deps可避免依赖冲突但需手动解决缺失依赖4. 开发工具链配置4.1 VS Code深度学习工作区配置安装完成后需配置以下关键插件Python微软官方提供智能补全和调试支持Jupyter交互式开发体验Docker可选容器化开发支持配置settings.json实现自动环境检测{ python.autoComplete.extraPaths: [ ${workspaceFolder}/src, /home/${env:USER}/anaconda3/envs/pt171/lib/python3.7/site-packages ], python.pythonPath: /home/${env:USER}/anaconda3/envs/pt171/bin/python }4.2 环境验证测试脚本创建validate_gpu.py进行端到端验证import torch def check_environment(): print(fPyTorch版本: {torch.__version__}) print(fCUDA可用: {torch.cuda.is_available()}) if torch.cuda.is_available(): print(f当前设备: {torch.cuda.get_device_name(0)}) print(fCUDA计算能力: {torch.cuda.get_device_capability(0)}) # 简单张量计算测试 x torch.randn(3, 3).cuda() y torch.randn(3, 3).cuda() z (x y).sum() print(f计算测试通过: {z.item():.4f}) if __name__ __main__: check_environment()预期输出应包含GPU信息和成功计算的结果。5. 项目工程化实践5.1 环境复现与团队协作使用conda导出精确环境配置conda env export -n pt171 --no-builds | grep -v prefix environment.yml对于纯pip管理的依赖生成锁定文件pip freeze --exclude-editable | grep -v torch requirements.lock5.2 典型问题解决方案库建立常见错误应对方案错误现象解决方案TypeError: array() takes 1 argument...pip install pillow8.2.0CUDA out of memory减小batch_size或使用梯度累积Undefined symbol: ...重新编译CUDA扩展或匹配PyTorch/CUDA版本在项目根目录创建troubleshooting.md记录这些解决方案。实际开发中我发现使用conda的--no-deps选项配合手动依赖解析能显著提高环境稳定性。例如当同时需要opencv和scikit-image时先安装基础依赖再逐步添加扩展包比一次性安装所有依赖成功率更高。

保姆级教程：用R语言ggplot2为你的基因表达数据绘制带拟合线和统计指标的‘高级感’散点图

基因表达数据可视化：用ggplot2打造兼具科学性与美感的散点图在生物信息学研究中，一张精心设计的散点图往往能比枯燥的数字表格更直观地揭示基因间的表达关系。当我们需要展示基因A与基因B的共表达模式时，基础的散点图虽然能完成任务&#xf…...

2026/4/21 18:06:43 阅读更多 →

多工位冷镦机是什么？工作原理、生产优势与采购选型解析_FES上海紧固件展

行业升级趋势下，多工位冷镦机为何成为“标配设备”随着汽车、风电、轨道交通及高端装备制造等领域对紧固件性能要求不断提高，传统单工位或低自动化设备逐渐难以满足大批量、高一致性生产需求。近年来，行业普遍呈现出“设备自动化率提升、生产…...

2026/4/21 18:03:24 阅读更多 →

如何3分钟快速下载B站CC字幕？完整BiliBiliCCSubtitle使用指南

如何3分钟快速下载B站CC字幕？完整BiliBiliCCSubtitle使用指南【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 还在为无法保存B站视频字幕而烦恼吗&…...

2026/4/21 18:00:46 阅读更多 →

从T3到T5：全志工控处理器性能跃迁与工业应用场景深度解析

1. 全志T3与T5处理器核心架构解析全志T3（A40I）和T5（T507）作为两代工控处理器，在核心架构上有着显著差异。T3采用四核Cortex-A7架构，主频1.2GHz，搭配Mali400MP2 GPU，属于经典的"…...

2026/4/21 5:14:24 阅读更多 →

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全图解实战）一、前言二、列出 ES 所有索引：整体流程流程图三、Elasticsearch 列出所有索引：核心命令3.1 方法1：_cat/indices（最常用、运维…...

2026/4/21 5:14:28 阅读更多 →

SAP PI/PO HTTPS接口调用实战：从SSL证书导入到彻底告别iaik.security.ssl.SSLCertificateException

1. 当SAP PI/PO遇到HTTPS接口报错时发生了什么？ 最近在帮客户调试SAP PI系统调用外部HTTPS接口时，遇到了一个让人头疼的问题。系统在调用Swagger Petstore的API时，控制台突然抛出"iaik.security.ssl.SSLCertificateException: Peer cert…...

2026/4/21 5:14:31 阅读更多 →