[Share Experiences] deepin20.6正确安装rocm,前面一直整不好,今天终于搞定了
Tofloor
poster avatar
qq4945286
deepin
2022-07-13 06:47
Author

我现在用的是amd6600xt显卡,而blender从3.2版本起,cycles渲染器,amd显卡只能支持HIP。要用HIP就要安装rocm。采用以用的安装方法,安装rocm只要在blender启用HIP,cycles选GPU渲染,百分之90以上,会出现屏幕花屏和卡死。采用今天这种方法安装的,rocm完美解决花屏和卡死的问题。

截图_选择区域_20220712214930.png

就是上图对号那个地方,后面的一排字看不到了,反正不影响使用。也懒得搞原因了。

下面记录一下,今天折腾的方法:

1:在源里面加这么一条,等下安装rocm会出现一个依赖,只有ubuntu的源里面有。只个源加进去就是为了安装libpython3.8这个依赖,安装好这个依赖后,就直接删除,或注销。

安装libpython3.8依赖源deb http://security.ubuntu.com/ubuntu bionic-security main universe

方法如下,方便跟我一样的小白使用,直接用最笨的方法加吧

截图_选择区域_20220712220041.png

右边箭头指的deepin就是系统盘

截图_选择区域_20220712220147.png

2:源加进去以后,在终端输入sudo apt update更新一下。

3:安装NUMA支持库

就是一条命令

sudo apt install libnuma-dev

安装好后,重启一下电脑,reboot

4:加入rocm的安装源,我的方法很笨

这是路径/etc/apt/

进去以后,鼠标右键选择以管理员的方式打开

进到sources.list.d文件目录,在里面新建一个rocm.list的文件。把下面这条复制到里,保存退出

deb [arch=amd64] https://repo.radeon.com/rocm/apt/5.2.3 ubuntu main

5:在终端输入下面这些命令来安装

sudo apt update

sudo apt install libpython3.8

sudo apt install rocm-dev

如果在安装的时候,出现依赖什么的,这个时候,它出现什么依赖,你就先安装那个依赖。

这个有时网速很快,安装也很快就完成。有时是非常的慢的。

如果出现,那个有key这个的,你复制到百度里面搜索一下,就知道怎么解决的了,很简单的,我一下忘记那个叫什么。

6:等上面安装好后,在终端分别输入下面这个命令

ls -l /dev/dri/render*
sudo usermod -a -G render $LOGNAME
sudo usermod -a -G video $LOGNAME

设置用户 GPU 使用权限,将当前用户加入到权限组:

sudo usermod -a -G video $LOGNAME

为系统以后的用户都添加权限

sudo /opt/rocm/bin/rocminfo
sudo /opt/rocm/opencl/bin/clinfo

检查一下/etc/modprobe.d/amdgpu.conf,检查一下内容是否是这样:

options amdgpu si_support=1
options amdgpu cik_support=1

没有直接在终端输入下面的命令加入进去

sudo nano /etc/modprobe.d/amdgpu.conf

然后复制下面的粘贴进去,保存退出

options amdgpu si_support=1
options amdgpu cik_support=1

7:在终端输入

sudo /opt/rocm/bin/rocminfo

如果没有报错,说明安装成功了。到这里还没有完,接着网下看

8:将ROCm路径加入系统PATH环境变量

在终端输入

echo 'export PATH=$PATH:/opt/rocm/bin:/opt/rocm/profiler/bin:/opt/rocm/opencl/bin' | sudo tee -a /etc/profile.d/rocm.sh

到这里就基本安装完了,记得去源里把下面这条源删除了

deb http://security.ubuntu.com/ubuntu bionic-security main universe

9:下面来测试一下,有没有安装成功,如果你出现,跟下面类似的,表示安装成功

AMD 没有 NVIDIA 类似 nvidia-smi 的命令,只能使用第三方,这里推荐 radeontop,可以直接使用 apt 安装。

sudo apt-get install radeontop

sudo radeontop

如果显示全部是0表示没有成功

会现在下面类似的内容

Package: rocm-libs
Version: 5.2.0.50200-65
Priority: optional
Section: devel
Maintainer: ROCm Libs Support
Installed-Size: 13.3 kB
Depends: hipblas (= 0.51.0.50200-65), hipfft (= 1.0.8.50200-65), hipsolver (= 1.4.0.50200-65), hipsparse (= 2.1.0.50200-65), miopen-hip (= 2.17.0.50200-65), rccl (= 2.11.4.50200-65), rocalution (= 2.0.2.50200-65), rocblas (= 2.44.0.50200-65), rocfft (= 1.0.17.50200-65), rocrand (= 2.10.9.50200-65), rocsolver (= 3.18.0.50200-65), rocsparse (= 2.2.0.50200-65), rocm-core (= 5.2.0.50200-65), hipblas-dev (= 0.51.0.50200-65), hipcub-dev (= 2.10.12.50200-65), hipfft-dev (= 1.0.8.50200-65), hipsolver-dev (= 1.4.0.50200-65), hipsparse-dev (= 2.1.0.50200-65), miopen-hip-dev (= 2.17.0.50200-65), rccl-dev (= 2.11.4.50200-65), rocalution-dev (= 2.0.2.50200-65), rocblas-dev (= 2.44.0.50200-65), rocfft-dev (= 1.0.17.50200-65), rocprim-dev (= 2.10.9.50200-65), rocrand-dev (= 2.10.9.50200-65), rocsolver-dev (= 3.18.0.50200-65), rocsparse-dev (= 2.2.0.50200-65), rocthrust-dev (= 2.10.9.50200-65), rocwmma-dev (= 0.7.0.50200-65)
Homepage: https://github.com/RadeonOpenCompute/ROCm
Download-Size: 982 B
APT-Sources: https://repo.radeon.com/rocm/apt/debian ubuntu/main amd64 Packages
Description: Radeon Open Compute (ROCm) Runtime software stack

也可以在终端输入rocm-smi

截图_选择区域_20220712224546.png

如果上面图片出现都是0就表示没有安装成功

到这里就安装完成了。

进一步完善,请看14楼的评论,有详细的说明

Reply Favorite View the author
All Replies
jjcui8595
Moderator
2022-07-13 13:47
#1

感谢分享

Reply View the author
qq4945286
deepin
2022-07-13 15:39
#2
jjcui8595

感谢分享

不知道V23官方能在仓库放入这个rocm不,那样就方便安装了

Reply View the author
fuuko
deepin
2022-07-13 16:26
#3

这个牛逼啊,rocm装好后都可以用A卡炼丹了

Reply View the author
qq4945286
deepin
2022-07-13 17:09
#4
fuuko

这个牛逼啊,rocm装好后都可以用A卡炼丹了

我是通这样折腾成功的,开努以为是系统问题,换别的发行版也是一样的问题,启用hip渲染就花屏卡死。这样就不会了。唯一在blender里,那个打勾的后面那排字不显示。这样安装后达芬奇也使用正常

Reply View the author
Breeze
deepin
2022-07-13 17:51
#5

4k屏幕就是清爽啊,哈哈

Reply View the author
liwl
deepin
2022-07-13 22:45
#6

like

Reply View the author
种花人种花魂
deepin
2022-07-14 01:33
#7

同等算力的A卡和N卡训练时间差别大吗,你选A的理由是啥?

Reply View the author
qq4945286
deepin
2022-07-14 02:11
#8
种花人种花魂

同等算力的A卡和N卡训练时间差别大吗,你选A的理由是啥?

算力这些就不清楚了,选择a卡就是随机,以前用的是1060,后面换显卡就买张a卡玩吧。

Reply View the author
fuuko
deepin
2022-07-14 16:25
#9
qq4945286

我是通这样折腾成功的,开努以为是系统问题,换别的发行版也是一样的问题,启用hip渲染就花屏卡死。这样就不会了。唯一在blender里,那个打勾的后面那排字不显示。这样安装后达芬奇也使用正常

总之敢折腾ROCm还折腾成功了就是牛逼啊

Reply View the author
fuuko
deepin
2022-07-14 16:30
#10
种花人种花魂

同等算力的A卡和N卡训练时间差别大吗,你选A的理由是啥?

从硬件上来说,A卡算力碾压N卡,但是N卡生态和驱动做得好,软件方面A卡完全不是N卡的对手,以至于xbox和PS两个游戏机采用A卡的前提是,AMD把硬件的数据给他们,他们自己写驱动23333333(RX6000系列都是AMD解散驱动部门重新招人,结果驱动还是拉了)

所以一般推荐训练阶段还是用N卡省心,部署阶段的话,用N卡还是A卡都没问题

Reply View the author
dnxxt
deepin
2022-07-14 20:08
#11

这是大神

Reply View the author
xiongweixp
deepin
2022-07-14 22:27
#12

ROMc支持6000系列RDNA2的显卡进行计算了吗 ?比如pytorch-romc或者paddle-romc

Reply View the author
qq4945286
deepin
2022-07-15 02:38
#13
xiongweixp

ROMc支持6000系列RDNA2的显卡进行计算了吗 ?比如pytorch-romc或者paddle-romc

应该支持的,你可以到这里去看一下

https://docs.amd.com/

Reply View the author
qq4945286
deepin
2022-07-15 04:59
#14

截图_选择区域_20220714204424.png

刚才总算把前面那个对号的一把文字,显示出来了。就是自己的显卡型号。

说一下步骤吧

1:先到这里下载一个脚本,先那个ubuntu18.04的

https://repo.radeon.com/amdgpu/22.20/ubuntu/pool/main/a/amdgpu-install/

截图_选择区域_20220714204847.png

2:修改/etc/os-release中的ID为ubuntu,

sudo nano /etc/os-release

3:到脚本目录,鼠标右键,在终端打开,安装脚本。

sudo apt install ./你的脚本名.deb

4:修改/etc/apt/sources.list.d/amdgpu.list文件中的focal 为bionic,如果本身就是bionic,就直接退出,不用管

sudo nano /etc/apt/sources.list.d/amdgpu.list

5:sudo apt update

6:安装一下显卡驱动

sudo amdgpu-install --no-dkms

7:删除脚本

sudo apt-get purge amdgpu-install

8:ID修改回原来的

sudo nano /etc/os-release

截图_选择区域_20220714205830.png

重启一下电脑,完成!!!

Reply View the author
doooooit
deepin
2022-07-16 03:49
#15

第一张图的标题栏,宽到不协调

Reply View the author
qq4945286
deepin
2022-07-16 05:14
#16

第一张图只截取了软件的菜单栏,标题栏没有截取

Reply View the author
qq4945286
deepin
2022-10-23 13:53
#17

如果发现显卡在看戏不正常工作,加入下面的内容

添加
sudo nano /etc/modprobe.d/amdgpu.conf 打开,加入下面的
options amdgpu si_support=1
options amdgpu cik_support=1
sudo nano /etc/modprobe.d/radeon.conf 打开,加入下面的
options radeon si_support=0
options radeon cik_support=0

接下来来到最后一步环境变量配置,也往往是容易忽略的
终端下命令:
sudo nano ~/.bashrc 或者 sudo nano ~/profile

(bashrc对系统所有用户有效,profile对当前用户有效)

输入完命令后按i进行输入,将以下内容粘贴到里面(随便空白处即可,建议最开始或结尾):

export PATH=$PATH:/opt/rocm-5.2.3/bin (注5.23填写你安装的rocm本版号,在系统的opt文件下面就能看到你的版本号)

输入完后,按ESC退出,输入:wq,进行保存。保存完成后,还有一步操作,就是让更改的环境变量进行生效,在终端中输入以下命令内容:
source ~/.bashrc 或者 source ~/profile

Reply View the author
郭紫辰Skyler
deepin
2023-04-21 00:10
#18
It has been deleted!
156******41
deepin
2023-07-21 03:38
#19

sudo apt install libpython3.8这个用不了,显示没有这个软件包怎么办,求各位大佬解答

Reply View the author
qq4945286
deepin
2023-07-21 04:39
#20
156******41

sudo apt install libpython3.8这个用不了,显示没有这个软件包怎么办,求各位大佬解答

这个太老了,按这个吧https://bbs.deepin.org/post/251121

Reply View the author