Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?
剛剛看到最新分析
跳過 CUDA,Deepseek 用精細的 PTX 寫成
韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。
所以他不用cuda
而是用比較低階的PTX編寫
使用的也不是最高階的H100而是H800
所以跟政黑原本以為的翻車根本不同
--
彎道超車!擺脫依賴輝達芯片,大成功!
下一步應該就是用全中文寫程式了
全面取代西方知識體系為主的字母
資料來源呢?
方塊字也能寫程式,徹底建構中國智庫
這就真的是硬凹了
是部份吧
神靈吹大家都知道表示什麼了
硬ㄠ成全部都用低階來寫
而且DeepSeek的問題在於它用OPENAI
的結果去算吧
你啥時這麼懂AI了
討論好幾篇沒人提到R1爆紅真正的原因
主要是RL取代RLHF 在小規模模型上高效
漲知識推
被懷疑拿OpenAI去train的是V3 V3就很鳥
理性推
R1也是建立在V3基礎之上的
整件事情是代表開源的價值
比OpenAI還Open
但真正大家驚艷的是R1本身的演算法 而
不是V3
過幾周Open AI也要丟O3出來了
OpenAI也有宣布O3-mini免費
到時候再看看
DeepSeek作為開源,可以自己下載建構
還是很香的
阿里巴巴也有出了R1演算法版本
DeepSeek-R1-Distill-Qwen
更正一下阿里巴巴出的是另一個版本
Qwen 2.5-MAX
肯定沒R1便宜
這有點奇怪,PTX是中間語言,通常是框架產
生,不太可能是人寫
感覺這很難移植吧
光是ID 內容大概要打8個問號
三個月手刻類似於assembly的PTX,這太奇葩
了
我看了原文,是 “部份”採用PTX ,那這就
有可能
這就有點像為了繞過CPU指令集而手刻assembl
y程式
捨CUDA用PTX就像是不用高階程式語言用
組合語言
H800明明可以用CUDA,誰會擺著硬體在那邊
不用,我猜測是新聞斷章取義
大部分人不懂不會亂說 但是有些人
自己沒很懂也在跟風 翻車是必然
公司本體是股市金融投資公司 不免懷疑就
是炒作話題搭配證券交易來賺錢 趁華人圈
放假 很多消息難驗證 然後中港台也沒辦
法交易的時候來玩一把
造謠仔
59
首Po其實基本上,藍白只要跟著美國華爾街表態 或是頂多像是川普那樣表達要努力超越 其實就好了 但是藍白偏偏不是, 硬是要拿著Deepseek強問台灣為什麼沒有1X
為何不能問台灣為何沒有? 不愛跟大陸比 就算跟南韓也是常常在比啊 好想贏韓國都變成迷因了 台灣跟南韓除了晶片贏1X
到底為何不能檢討台灣啊 民進黨就不能做任何批評嗎 反正民進黨做的永遠對 任何台灣輸的都是不該評論 不然就會這樣被一堆智障噓2
仇美派都蠻有趣的 只要非美國的消息來源 並且對美國不利的 就會毫無保留的相信 然後美國公司OpenAI說他們有剽竊智慧財產的證據84
神弟還記得你之前吹了一個禮拜的韓國常溫超導體 最後被證實是造假的事情嗎xddd 看板HatePolitics 作者Sinreigensou (神靈幻想)![Re: [討論] 藍白為什麼連蹭Deepseek都能翻車? Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?](https://i.imgur.com/SsbAVbmb.jpeg)
6
噓 mitsloanboy: DeepSeek連微軟也拿去用了啊一堆政 42.77.201.64 01/30 11:20 → mitsloanboy: 治腦可悲又可笑只看一堆文組白痴側 42.77.201.64 01/30 11:20 → mitsloanboy: 翼喂屎喔哈哈,我知道承認中國AI跟 42.77.201.64 01/30 11:20 → mitsloanboy: 醫學研究屌虐台灣很傷台派政治腦可 42.77.201.64 01/30 11:20 → mitsloanboy: 悲的玻璃心啦,遇到中國什麼都先打 42.77.201.64 01/30 11:20![Re: [討論] 藍白為什麼連蹭Deepseek都能翻車? Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?](https://i.imgur.com/Tq9OrkUb.jpeg)
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)![[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂 [爆卦] 數發部次長造謠Deepseek成本不只550萬鎂](https://i.imgur.com/jmMt7gnb.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
8
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未簡單說明一下為什麼NVDA暴跌 很多人一定覺得很奇怪,然後各種文組出來表演秀下限 簡單說NVDA能在40系GPU出來的時候打爛AMD , 就是因為他們的AI級伺服器GPU , 例如A100 還有H100 然後Deepseek現在告訴你 , 這些為了AI打造的GPU都是垃圾 接下來我舉個簡單的例子,Intel曾經想推動WiMAX 來一統高速無線網路![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
24
[爆卦] openAI 首席研究員來自台灣Deepseek事件後 OpenAI首席研究Mark chen 出來回應Deepseek Mark chen 2012年畢業於MIT16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中21
[討論] 靠北,馬斯克都不上車也認為DS在說謊馬斯克認為DS不可能用如此低的成本完成 在X針對兩則貼文回應 首先有人問DeepSeek擁有5萬張輝達H100晶片的報導,想知道是否屬實 馬斯克回應是 很明顯(Obviously)![[討論] 靠北,馬斯克都不上車也認為DS在說謊 [討論] 靠北,馬斯克都不上車也認為DS在說謊](https://i.imgur.com/eHe9t8Gb.jpeg)
9
Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉OpenCL真的很難紅得起來 10年前大學時因為修課不得已寫過幾次 完全可以理解為何cuda打遍天下無敵手 現在基本上只有學術產paper時,出於研究性質的一發藝 近來也有很多論文,開始很放心地玩PTX (CUDA的bytecode)![Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉 Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉](https://img.youtube.com/vi/um8xqvVwxMA/mqdefault.jpg)
4
[問卦] 用H200的算力去強化Deepseek的演算法有中國的Deepseek用低階的H800算力 幹掉美國高階H100海的OpenAI 相對的用高算力H200算力去優化中國Deepseek變成更強的OpenA I有沒搞頭? --![[問卦] 用H200的算力去強化Deepseek的演算法有 [問卦] 用H200的算力去強化Deepseek的演算法有](https://i.imgur.com/tzXrVVOb.jpeg)
1
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤DeepSeek 終歸是個軟體... 硬體標竿還是硬體標竿阿 DeepSeek 這軟體用中低階硬體來算出 其他軟體用高階設備的算力