Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成
《轉載》
網路上傳deepseek繞過了輝達cuda,我跟大家講一下deepseek到底做了什麼。
輝達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用輝達的顯卡做高性能計算,就要透過cuda計算平台。
你說用AMD的顯示卡,嗨,它沒有生態呀,就像android和windows phone那麼大的差別。 你買蘋果手機,不是買的硬體,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 輝達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。
總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了輝達別無選擇,這就是過去十年AI圈的現實 ,天下苦達子久矣。
Deepseek開源以後利用Meta二十分之一的成本,完成了比Meta性能好十倍的大模型,達到了與全球領先chatgpt最新版本相當的實力。
Deepseek不僅公佈了開源了程式碼,公開了測試方式與數據,還發表了全新架構的論文,這相當於一把梭了。
各路人馬一開始不相信,然後開始扒deepseek,用deepseek的源代碼,測試數據,樣本等可以完全復現一次deepseekR1的訓練過程,成本就是那麼低,這讓所有人都閉嘴了。
有點從不服的心態變成你是挺牛逼的意思了,接著研究細節,然後從論文中發現了deepseek改造了輝達底層的cuda生態,用比cuda更底層的ptx語言重寫了cuda的硬件邏輯,讓其中有20個流處理器硬體做了CUDA規定以外的事,彌補了閹割版顯示卡在網路通訊上的不足,相當於繞過輝達的管理平台與運算生態,直接給輝達的硬體發號施令 。
這是英偉達股價崩盤的核心邏輯,輝達的最大護城河讓人挖開了一個洞。 輝達是個霸氣十足的太歲,如今deepseek在太歲頭上動土了。
deepseek可以這麼做,就代表別人也可以這麼做。有人問了那之前沒人能想到嗎?
這個問題很好,之前一定有大神想過,但是有很多問題導致無法實現。 一是在大模型剛出現的時候一片藍海,大家空間無限大,都在忙著攻城略地,速度和效率是最大優先級,沒人給你時間去搞底層語言編程這玩意,特別是美國人,花錢能解決的事不叫問題,不就是美元嘛,印就完了,錢有得是,輝達的顯卡隨便買,誰腦子有洞給自己找麻煩?
中國不一樣,被美國制裁只能用閹割卡,還不能隨便買,資源極度匱乏,必須用最小的硬體壓榨出最大的性能出來,只能劍走偏鋒。 所以用ptx繞過cuda這件事只會發生在中國,不可能發生在美國,邏輯不允許
第二點是大語言模型的發展進入了一個全新的時期,工作效率理解力推理能力精度都有了質的飛躍,deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作,這才使deepseek 的新版本有可能繞過CUDA完成程式指令集的巨量任務。 ptx是變種的組合語言,如果用真人寫,以現在的資料量累死也寫不完,但是AI它效率高呀,怎麼寫也不累…
輝達現在的危機是怎麼給投資人說cuda依然在未來幾十年的地位無法被撼動,但顯然他們還沒找到答案。 誰能想到AI的教宗竟然被AI給革了命,這找誰說理去。
我再強調一遍,國運,不在於人,而在於勢,美國的勢沒了,這才是最恐怖的。
小結:Deepseek好像用自家模型完成PTX的工作量
-----
Sent from JPTT on my Vivo V2227A.
--
Gossiping 綜合 ◎[八卦] 本板沒有特定立場
PTT八卦板自創立以來,一直秉持著公正、中立的立場,
以一個自由且不受限制之資訊交流平台而自居,
從而廣受國內外人士好評愛戴。
是故,由眾多使用者推舉出任之板主,
自然需承襲八卦板的一貫作風:只問對錯,不問立場。
--
這篇是AI寫出來的吧
推 祖國要走10大運年了 2035一統天下
用AI寫模型 真假?
完蛋了 天網真的要來了
AI會自我進化了
CUDA是人類寫的 輸給AI寫的了
PTX是 CUDA的一部分。一句話結案。
講解的很清楚,謝謝。
所以deepseek可以繞開微軟還有瀏覽器
講半天結論還是繞不開輝達硬體....
.
當初微軟開發簡體的WIN95是不是真有
必要?!
輝達的顯卡還是要插在裝有X86架構的
主板上,請問DEEPSEEK能繞開LINUX嗎?!
推
CUDA C/C++ → PTX → SASS(機器碼)
PTX是CUDA Compilation Toolchain之環節
蛤
所以deepseek能繞開IEEE的標準?!
就是 20 年前手刻 JVM byte code 同概念
能手寫 invokevirtual、fmul 那些而已
是在供殺毀 PTX還不一樣是輝達的指令
集
一直都是在輝達的硬體上跑 只是用不同軟體
ptx指令更方便 細調用控制gpu與記憶體
繞個甚麼咚咚
用遊戲理解 捏臉原本可調1-255,
用ptx 參數可調1-65535
輝達設計的指令集架構,還有編譯器
所以輝達不需將資訊顯示在電腦上,人
與人都是靠機器語言翻譯成腦電波及天
線在溝通的?!
任天堂紅白機都是靠組合語言將遊戲寫
入卡帶裡,PS1並未替自家設計的圖形處
理器命名
賣鏟子的剩台積電
圖形處理器就是GPU
cuda就是原來cpu幹的,把他給gpu平行運算,
在丟回去,本質還是c
因為ai用cpu太慢了
就原本用高階語言寫 發現速度太慢就用組語
deepseek 在華爾街眼裡 更少的計算 更少
的記憶體。
推這篇
ptx這段跟非算力富翁這段是很確實的
還不是要買nv的卡 而且發展更快 需求只
會更多
這篇會引來支語警察
推
google的tensor flow架構就沒有用cud
a輝達有崩壞嗎?也沒有。
deepseek 只是用一部份的ptx, 其他還
是用H800跑,還是用cuda的指令集啊
其實就只是有沒有最佳化而已,總之NV
對他的cuda工具還有最佳化的成長空間
,還是掌握在NV手上啊
意思是可以繞開cuda conpiler的某些限
不完美同意 發現一顆燈泡當十顆用的方法
美國也可以十顆燈泡當一百顆用
我覺得以後可能不準越獄了 還不快買
有沒有能證明這篇的專業解說
推
文章很好,但是你轉載不附上來源?
FB看到的
這篇正解,哥2008年就在用CUDA最早期版本
當時還要學怎麼利用記憶體延遲交錯load
資料優化效率,後來這都compiler做掉
用AI大規模針對不同硬體改底層語言可行啊
未來很有機會換一個底層就用AI改底層bind
binding跟linking的底層物件
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)![[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂 [爆卦] 數發部次長造謠Deepseek成本不只550萬鎂](https://i.imgur.com/jmMt7gnb.jpeg)
24
[爆卦] openAI 首席研究員來自台灣Deepseek事件後 OpenAI首席研究Mark chen 出來回應Deepseek Mark chen 2012年畢業於MIT16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中9
Re: [討論] Deepseek 繞開cuda 用任何GPU都可以這種文章完全就是在造謠 用PTX寫程式繞開的是CUDA開發框架而不是CUDA硬體 PTX是CUDA開發框架產生的中繼語言,通常,演算法工程師撰寫的是高階語言 (C++或pyt hon) ,開發環境會將高階語言轉換成中繼語言 你能直接撰寫PTX是可以說繞過CUDA沒錯,但繞過的是指CUDA框架的API以及從高階語言轉X
Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?剛剛看到最新分析 跳過 CUDA,Deepseek 用精細的 PTX 寫成 韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過 大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。 所以他不用cuda![Re: [討論] 藍白為什麼連蹭Deepseek都能翻車? Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?](https://i.imgur.com/rcylSPZb.png)
4
[討論] deepseek 主要創新點應該是繞過cuda看了一下討論 發現ds 主要有關ai 的部分如同老美的說法 但加速的關鍵主要還是來自於用組合語言直接寫 原本都還得透過cuda 這是nv 的技術護城河![[討論] deepseek 主要創新點應該是繞過cuda [討論] deepseek 主要創新點應該是繞過cuda](https://i.imgur.com/TJAtdO3b.jpeg)
5
[問卦] deepseek 說輝達是現代石油公司?以下是我題問的問題 1.目前都說,因為演算法的進步,未來不需要英偉達那麼多gpu算力那麼多是真的嗎? Deepseek 回答如下: 從技術發展的多元角度來看,**演算法進步確實會提升計算效率,但短期內對GPU算力的 需?3
Re: [問卦] deepseek 說輝達是現代石油公司?剛剛我又引導對輝達不利方式去說 以下我問的問題: 3.會因為演算法的進步,導至不需要那麼多算力(Nvidia GPU) ,讓微軟與meta 或其它公司去砍Nvidia 的訂單嗎? Deepseek 回答如下:2
Re: [新聞] DeepSeek梁文鋒放假消息做空輝達海撈?看來**量化真的有在套利 從「繞過CUDA」這種消息就可以知道他們在利用資訊差引發市場恐慌 寫PTX繞過的是CUDA高階語言API而不是繞過CUDA GPU,因為都叫cuda所以太好造謠了 你一個演算法本來就可以在各種硬體跑,這不是常識嗎?工程師移植功力好想在什麼阿貓 阿狗的GPU/CPU跑都是你的自由,把「繞過CUDA」講得好像別的GPU/CPU都可以跑出跟cudaX
Re: [討論] Deepseek 繞開cuda 用任何GPU都可以認真說,這是使用PTX語言寫的,而PTX依然是NVDA在維護的東西 『尚未』繞過NVDA 但 能這麼做,就表示具備能力可以可以針對AMD 針對AppleM 甚至針對華為910B 去針對優化編譯 直接跟底層硬體溝通![Re: [討論] Deepseek 繞開cuda 用任何GPU都可以 Re: [討論] Deepseek 繞開cuda 用任何GPU都可以](https://i.imgur.com/ozg9NCLb.jpg?fb)
![Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成 Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成](https://i.imgur.com/Enp8heXb.jpeg)