PTT評價

[情報] i皇6代以上內顯開CUDA加速 最高buff 52%

看板PC_Shopping標題[情報] i皇6代以上內顯開CUDA加速 最高buff 52%作者
oppoR20
(R20)
時間推噓 6 推:6 噓:0 →:3

https://www.xfastest.com/thread-248583-1-1.html
本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼)

英文原文:
https://hothardware.com/news/cuda-on-intel-gpus-zluda

原作者Github:
https://github.com/vosen/ZLUDA

https://i.imgur.com/7QJsd9o.jpg

開發者開發出一款新的ZLUDA工具 可以拿來替換CUDA並跟i皇6代以上的內顯直接配合
目前支援Linux以及windows

根據開發者說法 效能目前可以達到近原生但部分功能有所限制
目前只有GeekBench能真正用這工具跑起來 開發者也警告不要把這工具當作日常使用

https://i.imgur.com/r1YRdXu.png

Windows上使用比較簡單 下載後打指令:
先cd到程式的位置 如:
C:\Program Files (x86)\Geekbench 5\
然後ps執行:
zluda_with -- geekbench5 --compute CUDA
根據原網站的測試 目前在Tiger Lake aka 11代筆電的Windows上會直接報錯說CUDA程式庫錯誤

開發者在i7-8700k(UHD 630)的測試上 跑GB5的跑分 CUDA總分為6333 以內顯跑原生OPENCL則是6482 低了2%左右
那標題寫的buff 52%在唬爛喔??
當然不是

https://i.imgur.com/VumwKal.png

是在細相的跑分上 最高有52% buff
原作者有在github解釋跑分結果:

為什麼部分跑分比較高?
原作者:大概是以下幾點結合的關係:
1.ZULDA用Level 0的API 比起OpenCL更低階更快的API
2.但是根據第一點 目前尚未支援異步執行 給我們了大優勢
GeekBench跑分僅用到CUDA同步api
3.NV跟i皇的GPU都有一組GPU指令 但OpenCL不會調用
開發者將Nvidia GPU最佳化的程式碼和OpenCL程式碼比較後 發現一個幸運的巧合:
那個最佳化的程式碼在i皇GPU上也可以執行的很好 歸功於底層的Intel Graphics Compiler

那為什麼部分跑分則是OpenCL比較高傲?
1.CUDA跑分會調用CUDA中的兩個功能:
atomicInc / atomicDec
這兩個功能在老黃的卡都是硬體支援的 但i皇的卡並不支援
因此要以軟體模擬功能 所以損失效能

那剩下跑比較差的原因?
原作者:
https://i.imgur.com/KRh3oGD.jpg

最有可能是因為某些測試我們用的是NVIDIA次優的GPU程式碼編譯 而其他測試ZLUDA則發出Intel次優的GPU代碼

目前還是很前期的版本 現在release只有2個版本
這是一個蠻有趣的project 希望看以後i皇Xe跟老黃能不能結合出更大的火花 更好的效能

--
https://i.imgur.com/IQtIYmx.jpg


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.138.101.91 (臺灣)
PTT 網址

iammatrix 02/28 23:07XE說不定變成挖礦神卡

jasn4560 03/01 00:22AMD又要被邊緣化了

Bencrie 03/01 01:02這個 lag 至少一個禮拜的消息 ...

pcfox 03/01 02:27你轉XF的打手會不會OP?

scarbywind 03/01 03:17xf那根本是機翻不知道哪個片面的源頭..

t5p3ax 03/01 05:51接下來零售的i家將只剩無內顯版本?要挖礦了嗎

kimula01 03/01 06:30XF水準你能夠多期待?

jyenhuang 03/01 16:46問題是你寫的並沒有比較好懂阿...看老半天還是去看

jyenhuang 03/01 16:46原文以後才知道你在講什麼