PTT評價

Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?

看板HatePolitics標題Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?作者
Sinreigensou
(神靈幻想)
時間推噓 X 推:8 噓:9 →:36

剛剛看到最新分析

跳過 CUDA,Deepseek 用精細的 PTX 寫成

韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。

所以他不用cuda

而是用比較低階的PTX編寫

使用的也不是最高階的H100而是H800

所以跟政黑原本以為的翻車根本不同

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.217.127.7 (臺灣)

※ 文章網址:
https://www.ptt.cc/HatePolitics/E.RQgpZsGzd864

Yaomini 01/30 09:22 彎道超車!擺脫依賴輝達芯片,大成功!

Yaomini 01/30 09:22 下一步應該就是用全中文寫程式了

Yaomini 01/30 09:23 全面取代西方知識體系為主的字母

fdtu0928 01/30 09:24資料來源呢?

Yaomini 01/30 09:24 方塊字也能寫程式,徹底建構中國智庫

DameLillard 01/30 09:25這就真的是硬凹了

kuninaka 01/30 09:26是部份吧

bear701107 01/30 09:26神靈吹大家都知道表示什麼了

kuninaka 01/30 09:26硬ㄠ成全部都用低階來寫

kuninaka 01/30 09:26而且DeepSeek的問題在於它用OPENAI

kuninaka 01/30 09:26的結果去算吧

HenryLin123 01/30 09:28你啥時這麼懂AI了

zzahoward 01/30 09:28討論好幾篇沒人提到R1爆紅真正的原因

zzahoward 01/30 09:30主要是RL取代RLHF 在小規模模型上高效

漲知識推

zzahoward 01/30 09:31被懷疑拿OpenAI去train的是V3 V3就很鳥

windyyw 01/30 09:31理性推

※ 編輯: Sinreigensou (49.217.127.7 臺灣), 01/30/2025 09:32:07

kuninaka 01/30 09:35R1也是建立在V3基礎之上的

kuninaka 01/30 09:36整件事情是代表開源的價值

kuninaka 01/30 09:36比OpenAI還Open

zzahoward 01/30 09:36但真正大家驚艷的是R1本身的演算法 而

zzahoward 01/30 09:36不是V3

kuninaka 01/30 09:36過幾周Open AI也要丟O3出來了

kuninaka 01/30 09:37OpenAI也有宣布O3-mini免費

kuninaka 01/30 09:37到時候再看看

kuninaka 01/30 09:37DeepSeek作為開源,可以自己下載建構

kuninaka 01/30 09:37還是很香的

kuninaka 01/30 09:38阿里巴巴也有出了R1演算法版本

kuninaka 01/30 09:42DeepSeek-R1-Distill-Qwen

kuninaka 01/30 09:45更正一下阿里巴巴出的是另一個版本

kuninaka 01/30 09:48https://i.imgur.com/rcylSPZ.png

kuninaka 01/30 09:49Qwen 2.5-MAX

kuninaka 01/30 09:49肯定沒R1便宜

z1976 01/30 09:56這有點奇怪,PTX是中間語言,通常是框架產

z1976 01/30 09:56生,不太可能是人寫

yayohola 01/30 09:59感覺這很難移植吧

tamanoko 01/30 10:00光是ID 內容大概要打8個問號

z1976 01/30 10:01三個月手刻類似於assembly的PTX,這太奇葩

z1976 01/30 10:01

z1976 01/30 10:03我看了原文,是 “部份”採用PTX ,那這就

z1976 01/30 10:03有可能

z1976 01/30 10:04這就有點像為了繞過CPU指令集而手刻assembl

z1976 01/30 10:04y程式

kougousei 01/30 10:05捨CUDA用PTX就像是不用高階程式語言用

kougousei 01/30 10:05組合語言

z1976 01/30 10:11H800明明可以用CUDA,誰會擺著硬體在那邊

z1976 01/30 10:11不用,我猜測是新聞斷章取義

bear701107 01/30 10:11大部分人不懂不會亂說 但是有些人

bear701107 01/30 10:11自己沒很懂也在跟風 翻車是必然

jimhall 01/30 10:48公司本體是股市金融投資公司 不免懷疑就

jimhall 01/30 10:48是炒作話題搭配證券交易來賺錢 趁華人圈

jimhall 01/30 10:48放假 很多消息難驗證 然後中港台也沒辦

jimhall 01/30 10:48法交易的時候來玩一把

benny1990615 01/30 12:57造謠仔