PyTorch
PyTorch是一个基于Python的开源机器学习框架,以其强大的GPU加速张量计算能力和动态计算图技术,在深度学习领域占据重要地位。
简介
PyTorch是一个基于Python的开源机器学习框架,以其强大的GPU加速张量计算能力和动态计算图技术,在深度学习领域占据重要地位。它广泛应用于计算机视觉、自然语言处理等人工智能关键领域。PyTorch之所以备受青睐,得益于其易用性、灵活性和高效性,尤其适合快速原型开发、学术研究以及生产环境中的深度学习任务。DAS软件栈中的PyTorch版本,不仅保证了PyTorch 核心功能在DCU加速卡的可用性,还针对DCU特有的硬件架构进行了深度定制优化。这使得开发者能够以极低的成本,轻松实现应用程序在DCU加速卡上的快速迁移和性能提升。
版本约束
1. PyTorch软件版本配套关系
| PyTorch版本 | DCU适配版PyTorch软件包版本 | DCU加速卡型号 | DTK版本 |
|---|---|---|---|
| 2.3.0 | 2.3.0+das.opt1.dtk24042 | Z100、Z100L、K100、K100_AI | 24.04.2 |
| 2.1.0 | 2.1.0+das.opt1.dtk24042 | Z100、Z100L、K100、K100_AI | 24.04.2 |
| 2.1.0 | 2.1.0+das.opt2.dtk24043 | Z100、Z100L、K100、K100_AI | 24.04.3 |
| 2.3.0 | 2.3.0+das.opt2.dtk24043 | Z100、Z100L、K100、K100_AI | 24.04.3 |
| 2.4.1 | 2.4.1+das.opt2.dtk2504 | Z100、Z100L、K100、K100_AI、BW | 25.04 |
| 2.4.1 | 2.4.1+das.opt1.dtk25041 | Z100、Z100L、K100、K100_AI、BW | 25.04.1 |
| 2.5.1 | 2.5.1+das.opt1.dtk25041 | Z100、Z100L、K100、K100_AI、BW | 25.04.1 |
| 2.5.1 | 2.5.1+das.opt1.dtk25042 | Z100、Z100L、K100、K100_AI、BW | 25.04.2 |
| 2.7.1 | 2.7.1+das.opt1.dtk25042 | Z100、Z100L、K100、K100_AI、BW | 25.04.2 |
2. 注意事项
- DAS框架组件的whl包版本应与环境中已安装的DTK版本对应,请参考上述版本约束。例如已安装dtk-24.04.2,则需要在软件下载页面搜索软件包名称:2.3.0+das.opt1.dtk24042,下载whl包并安装。
前置条件
安装DAS软件前,需要确保安装环境中已安装了合适的软硬件。
- DCU加速卡及其驱动
- DTK
- Python环境
比如,在DCU环境上安装torch-2.3.0+das.opt1.dtk24042-cp310-cp310-manylinux_2_28_x86_64.whl,需要确保环境已安装了上述K100_AI等DCU加速卡及其驱动,要确保安装了dtk 24.04.2版本以及安装了python 3.10版本和pytorch等,该示例的详细安装步骤如下:
DCU加速卡及其驱动安装
- 硬件安装请参考: https://developer.sourcefind.cn/gitbook//dcu_tutorial/index.html
- 驱动安装请参考: https://developer.sourcefind.cn/gitbook//dcu_tutorial/index.html
物理机安装DTK
DTK安装前需要获取DTK的安装包及其部署文档,相关下载地址为: https://download.sourcefind.cn:65024/1/main/
DTK安装步骤可以根据部署文档安装,也可参考: https://developer.sourcefind.cn/gitbook//dcu_tutorial/index.html
python安装
cd /tmp \ && wget -O python.tgz https://registry.npmmirror.com/-/binary/python/3.10.0/Python-3.10.0.tgz \ && mkdir python-tmp \ && tar -xvf python.tgz -C ./python-tmp --strip-components 1 \ && cd python-tmp \ && ./configure \ && --enable-shared \ && make -j64 \ && make install \ && rm -rf /tmp/python* \ && ln -sf /usr/local/bin/python3 /usr/local/bin/python \ && ln -sf /usr/local/bin/pip3 /usr/local/bin/pip
使用pip安装PyTorch
1. 下载Pytorch
在平台下载torch的软件包。
2. 安装Pytorch
pip3 install torch-xxx.whl
验证
安装完成之后,可通过以下指令验证是否安装成功,指令执行后会显示当前PyTorch的版本号。
python -c "import torch; print(torch.__version__)"
建议阅读
有关PyTorch的更多信息,请参见: