PTT評價

[心得] RX9070XT 架構ROCm7 SD WebUI 流程測試

看板PC_Shopping標題[心得] RX9070XT 架構ROCm7 SD WebUI 流程測試作者
trfmk1
(TRF小兵)
時間推噓31 推:31 噓:0 →:42

這是繼上篇的文章的優化
我花了一點時間
測試如何在Win11系統環境下
讓9070XT跑最新的ROCm7


主要參考SD.Next網站上的說明
https://vladmandic.github.io/sdnext-docs/ZLUDA/

使用ROCm團隊架構的PyTorch安裝包

安裝方式參考
https://github.com/ROCm/TheRock

ComfyUI架構ROCm7可以參考下面網址教學
https://xoghfwdske.feishu.cn/docx/J2TmdPNOpoXWwBxOU57cSUjJnRU


架構ROCm7 Stable Diffusion WebUI SD.Next 簡易流程

安裝AMD PyTorch on Windows 測試驅動

https://www.amd.com/en/resources/support-articles/release-notes/RN-AMDGPU-WINDOWS-PYTORCH-PREVIEW.html

安裝AMD HIP SDK 6.4.2
https://www.amd.com/zh-tw/developer/resources/rocm-hub/hip-sdk.html


Git安裝

https://github.com/git-for-windows/git/releases/download/v2.47.1.windows.1/Git-2.47.1-64-bit.exe

Python 3.12.10 安裝
https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe

https://i.imgur.com/hr83AwA.png
把Python加入PATH 環境變數記得打勾


接著開啟Windows PowerShell可以用指令碼執行

桌面工作列上的視窗圖標案右鍵
選擇以系統管理員身分執行 PowerShell
https://i.imgur.com/yw6VzHz.png

輸入
Set-ExecutionPolicy RemoteSigned

完成後關閉PowerShell


接著開始安裝 Stable Diffusion WebUI SD.Next

準備要安裝的位置新增一個資料夾
我是取名為SD.Next

點進資料夾按右鍵 選擇從終端開啟
呼叫命令提示字元
https://i.imgur.com/JzO58wf.png

依序輸入
git clone https://github.com/vladmandic/sdnext

cd sdnext

git switch dev

python -m venv venv

venv\Scripts\Activate

python.exe -m pip install --upgrade pip

AMD RDNA4(RX9070、RX9070XT)系列要安裝ROCm7套件安裝指令如下

pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx120X-all/torch torchvision torchaudio

這個指令是是直接安裝伺服器最新的套件包


AMD RDNA3(RX7900、RX7800、RX7700、RX7600)系列要安裝ROCm7套件安裝指令如下
pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx110X-dgpu/ torch torchvision torchaudio

跑完後
確認ROCm7是否正確架構

輸入
rocm-sdk test

看到OK就可以關掉PowerShell


接著在sdnext資料夾下找到webui.bat
按右鍵>顯示其他選項>建立捷徑
https://i.imgur.com/I3nCODQ.png

建立的捷徑按右鍵>內容
把連結後面加入 --use-rocm --autolaunch
https://i.imgur.com/D286MG2.png


以後啟動就開這個捷徑
點即開啟後會跑架構SD.Next的後續動作
跑完會跳出SD.Next WebUI 網頁操作介面

我重複安裝測試好幾次應該沒問題
有問題請自己DEBUG
成功的人恭喜你
正式踏入修練AI煉金術的其中一員


主要模型會放在\sdnext\models\Stable-diffusion下面

這裡使用wai-nsfw-illustrious-sdxl動漫模型來測試
https://civitai.com/models/827184/wai-nsfw-illustrious-sdxl

動漫類提示詞我都抄這裡的
https://seesaawiki.jp/nai_ch/


舉例來個生成個天之罩杯
在中世紀旅館房間躺在床上
https://i.imgur.com/Hi3nSOG.png

用上ROCm7 生成一張圖片1024x1024+RealESRGAN_x4plus_anime_6B 放大1.5倍
只需要7s的時間 如果不升頻5s左右出圖
沒想到效率提升這麼多...

https://i.imgur.com/FIxkZch.png

https://i.imgur.com/vO8XVHH.jpeg

https://i.imgur.com/wDyjWpb.jpeg

https://i.imgur.com/hC7oEBT.jpeg

這就是賽博時代的煉金術
世界的真理之門

追加設定
現在A卡問題點是VAE解碼器很容易爆顯存
我有找到解VAE卡頓的方法

sdnext根目錄下找到webui.py這個檔案
按右鍵在記事本中編輯

加入一段參數
import torch
torch.backends.cudnn.enabled = False

像這樣
https://i.imgur.com/8DwcfvT.png

存檔關閉就好
ComfyUI則是修改main.py這個檔案

我想應該是cudnn這個功能是N卡在用的
ROCm現狀是走兼容CUDA
這功能關閉後就完全不卡
任意切換解析度也是

啟動測試
https://i.imgur.com/KSvHugd.png

算20步縮短到只要4s
算30步縮短到只要6s
https://i.imgur.com/s41Rpx5.png

https://i.imgur.com/FTe2Ga6.png
就算加上超分1.5倍也只是瞬間的事= =

AMD官方正式支持windows系統的ROCm7應該會在10月啦
9070系列應該要起飛了= =

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.229.59.186 (臺灣)
PTT 網址
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 17:12:24 ※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 17:14:16

d030b 10/12 17:21感謝分享

labbat 10/12 17:22時代的發展

heha751019 10/12 17:24期待A卡在AI應用的發展

t202202 10/12 17:29太強了

pcfox 10/12 17:50戰未來

ceming 10/12 17:521024*1024只要10秒內也太快

zero790425 10/12 17:58無yolo修正七秒內出圖其實真的很快

ksng1092 10/12 18:00grok現在很紅的圖轉影片,不知道能不能

ksng1092 10/12 18:00在本地辦到

tokikaze 10/12 18:02可以啊,wan2.x或hunyuan

tokikaze 10/12 18:03wan用A卡跑一樣會在VAE出問題,目前只

tokikaze 10/12 18:03能用CPU處理VAE

sporocyst 10/12 18:33希望能成功打破cuda一家獨大的局面

EBVirus 10/12 18:39很難啦 現在ai發展很快 很競爭,幾乎每

EBVirus 10/12 18:39天都有新模型 而且都要cuda 你是開發ai

EBVirus 10/12 18:39的團隊敢把資源挪到其他地方嗎

arnold3 10/12 18:42看有沒有大量出圖的需求吧

cowgan78 10/12 19:03感謝大大分享,intel顯卡一樣跑幾張就會

cowgan78 10/12 19:03爆掉,看來雙11還是換張16g顯卡來試試

silveryiris 10/12 19:22

howard10141 10/12 19:307900XTX的24G有地方用了

我有更新文章增加RDNA3安裝rcom7套件的指令

archangel 10/12 19:42讚讚!

sino6445 10/12 19:43好分享,讚讚

sino6445 10/12 19:43樂見N卡之外的發展,I卡的AI其實也能用

sino6445 10/12 19:43,支援度更沒有A卡好,讚讚

※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 20:06:56 ※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 20:10:31

ttmm 10/12 20:16推 之後來玩看看

htps0763 10/12 20:26前幾個禮拜弄到wan一直爆就沒玩了,等

htps0763 10/12 20:26更新,最近倒是在試新的ai 去碼工具,

htps0763 10/12 20:26總算搞好torch跟使用amd的硬體編碼器

htps0763 10/12 20:28然後前幾個月llm 的工具總算能在win上

htps0763 10/12 20:28跑滿了,感覺是都慢慢有在完善ai生態了

bdpq 10/12 20:32感謝大大分享教學

pentw 10/12 20:509070用ComfyUI算約9秒

Ceferino 10/12 20:52vae爆ram這個問題至少已經半年還沒解掉

Ceferino 10/12 20:52,真的不行

我找到解法了 已經更新文章

pentw 10/12 21:08VAE用分塊就不會爆了

lolicat 10/12 21:39我只是進來看天之罩杯的

b122771 10/12 21:46

yesheyman 10/13 03:20最近miniPC都搭配395max+128G 應該有料

yesheyman 10/13 03:21可惜只有RDNA3.5不是4 ROCm7還不支援

avans 10/13 08:13推推心得

litwild 10/13 08:50推個,上個禮拜 9070 9070xt各買一張了

※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/13/2025 11:21:05

jeff85898 10/13 11:25爆顯存5000買一張mi50 32GB就搞定了 不

jeff85898 10/13 11:25行就兩張

※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/13/2025 11:56:01

oread168 10/13 12:11巨大提升

odanaga 10/13 13:41rocm好起來了?

kaj1983 10/13 13:52天之罩杯呢?都擋住了

kaj1983 10/13 13:53兄弟你真會選角度,剛好都看不到本體

Chikei 10/13 14:36cudnn那個不是因為他只是為了相容N家

Chikei 10/13 14:37是AMD在這邊做了你在第一次跑的時候他會

Chikei 10/13 14:37benchmark各種算法,然後挑效能最好的記下

Chikei 10/13 14:38LLM這作法沒問題,用第一次跑換取加速

Chikei 10/13 14:39但是算圖換個解析度就要benchmark一次誰受

Chikei 10/13 14:39的了,更別說detailer有一堆解析度的可能

Chikei 10/13 14:40然後最重要的,你叫我benchmark這麼久也才

Chikei 10/13 14:405%效能差異

Chikei 10/13 14:41可以不用改code,加環境變數

Chikei 10/13 14:42MIOPEN_FIND_MODE=2 有一樣的效果

Ceferino 10/13 16:27這個torch.backends.cudnn.enabled = F

Ceferino 10/13 16:27alse我兩個禮拜前試過又改回來了,印象

Ceferino 10/13 16:27中在Linux掉速而且wan vae解碼一樣爆

Ceferino 10/13 16:29github上一堆鬼方法都試過了,覺得最有

Ceferino 10/13 16:29可能的是在vae解碼時是強制fp32在解的

Ceferino 10/13 16:29,AMD查了半年什麼鬼都沒回應

我這邊在純win環境下去跑 使用torch.backends.cudnn.enabled = False 這段參數是有效的 第一次運行跑圖不卡 任意切換解析度也不卡 現在就頂多會算到破圖 但也只要重開就好 不像之前卡到驅動會崩潰= = 看對岸有人9070XT跑ComfyUI也是用了參數就正常

https://b23.tv/HXuOwt0

※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/13/2025 17:37:16

ganei 10/13 18:38mi50不是一直被喊說要踢出新版ROCm 的支援

ganei 10/13 18:38列表了?可惜有32G HBM但核心太老不夠強

cowgan78 10/13 23:52感謝大大分享的參數設定 連intel的arc75

cowgan78 10/13 23:520也有用!一次生成20張圖都成功 整個只

cowgan78 10/13 23:52有爽 好人一生平安

felaray 10/14 05:03

xiaotee 10/14 10:35推推

brandon50615 10/14 17:27