Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算
現在DeepSeek紅成這樣喔 他們不用自己去找廠商做
廠商會自己拿他們的模型自己做 連CPU上頭都能跑了
沒有什麼做不到的
前端的pytorch就是在那 現在在做AI ASIC的廠商都有這個能力
直接把模型放到自家的機器上頭跑 時間快慢而已
Groq Cerebras都是
就跟之前Meta的llama一樣 開源當下沒幾個小時就能直接部署在各家的AI ASIC上
尤其中國的廠商 巴不得靠著DeepSeek來衝高自己的人氣
※ 引述《keane9112 (拎北逮頑郎 拎北反支那啦)》之銘言:
: 就是阿
: DeepSeek目前被譽為最強的AI回答運算軟體
: 但為啥DeepSeek還要用輝達NVIDIA/超微AMD的GPU
: NVIDIA/AMD這兩家 都美國企業
: 基本上還是聽令於美國政府的
: DeepSeek這樣不就=被美國掐著脖子嗎?
: 應該不用NVIDIA/AMD這兩家 GPU才是最佳解吧
: 畢竟 對DeepSeek來講 美國企業就是敵國企業
: 用敵國生產的工具來發展AI 以後出事後容易被掐脖子
: 為啥DeepSeek不用自己中國產的GPU來運算啊?
--
※ PTT 留言評論
17
首Po就是阿 DeepSeek目前被譽為最強的AI回答運算軟體 但為啥DeepSeek還要用輝達NVIDIA/超微AMD的GPU NVIDIA/AMD這兩家 都美國企業 基本上還是聽令於美國政府的5
剛剛看到中國那邊的消息,不知真假 Deepseek(簡稱DS)團隊宣稱已經要遷移至華為昇騰910B的算卡了 跟輝達的N卡比起來,DS在華為昇騰910B的效果略輸5% 但成本下降了70%,差不多是168萬美元左右(560萬*0.3) 之後可能還會有更具體的消息吧![Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算 Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算](https://framerusercontent.com/assets/7vbNABnJobyuHg5UCpPrEhW3nYY.jpeg)
X
為啥不用Nvidia跟AMD以外的GPU加速卡?我以為這個問題很明顯耶.... 要的就是這兩家加速卡晶片所使用的製程技術呀,光是台積電的最新一代製程的 優勢下,帶來的效能優勢,就不知道海放中國的加速卡幾條街了,不然為什麼 中國想盡辦法要挖台積電的技術? 要說中國自己搞不出接近Nvidia相關的加速卡技術,我是不太相信,演算法跟![Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算 Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算](https://framerusercontent.com/assets/7vbNABnJobyuHg5UCpPrEhW3nYY.jpeg)
6
回一下自己的文章 前天的文章已經陸續有國內媒體報導了 當然在昇騰運行DS的成本大幅降低及實際效果相當還沒引入報導 不過至少確定即使日後DS完全拿不到任何NV算卡,也能保證在華為昇騰或其他AMD算卡上繼續運作執行,美國再怎麼瘋狂制裁,也壓不住DS這把星火燎原![Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算 Re: [問卦]DeepSeek為啥不用NV/AMD外的GPU來跑AI運算](https://img.ltn.com.tw/Upload/business/page/800/2025/02/03/phpmdFdT4.jpg)
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
爆
[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G標題: DeepSeek R1 is now available on Azure AI Foundry and GitHub DeepSeek R1 現已在 Azure AI Foundry 和 GitHub 上提供。 來源: 微軟 Azure 官方 Blog![[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G [情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G](https://i.imgur.com/Mn5ppb7b.png)
爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:![[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3 [情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3](https://i.imgur.com/xVyT4dsb.png)
68
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模更新: 年初一大新聞 美國上市公司(NET)、CDN市佔80%的 Cloudflare 宣佈引入 Deepseek R1 模型至他們的 serverless GPUs 產品 Workers AI 中![Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模 Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/rDAhYVDb.png)
20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普7
[問卦] deepseek公布成本開源?大家一起撈不好嗎?如題 deepseek基本上是用上兩代的老黃晶片下去跑 成效逼近openai最新模型不說 成本可能不到人家2% 才是這次ai相關股慘跌的原因![[問卦] deepseek公布成本開源?大家一起撈不好嗎? [問卦] deepseek公布成本開源?大家一起撈不好嗎?](https://i.imgur.com/zIogjXWb.jpeg)
3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI2
Re: [問卦] 有deepseek越強其實對台灣是大利多的卦?deepseek橫空出世 對台灣當然是大利多 台灣有很多號稱做AI的教授只會拿別人的模型來訓練 meta的llama釋出之前 只能在網路上找些更爛的開源model做出只會講幹話的東西1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平