Re: [討論] 藍白為什麼連蹭Deepseek都能翻車？

Sinreigensou 發表於 2025/1/30 上午9:20:25

看板HatePolitics標題Re: [討論] 藍白為什麼連蹭Deepseek都能翻車？作者

Sinreigensou

(神靈幻想)時間Jan 30 09:20:25 2025推噓 X 推:8 噓:9 →:36

PTT評價

剛剛看到最新分析

跳過 CUDA，Deepseek 用精細的 PTX 寫成

韓國大宇未來資產的分析報告指出，Deepseek 並未使用 Nvidia 的 CUDA 編寫，而是透過大量精密調整的併行線程執行代碼，達成採用較低規格的硬體產出高效能 AI 模型表現。

所以他不用cuda

而是用比較低階的PTX編寫

使用的也不是最高階的H100而是H800

所以跟政黑原本以為的翻車根本不同

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.217.127.7 (臺灣)

※ 文章網址:

https://www.ptt.cc/HatePolitics/E.RQgpZsGzd864

→

Yaomini 01/30 09:22 彎道超車！擺脫依賴輝達芯片，大成功！

→

Yaomini 01/30 09:22 下一步應該就是用全中文寫程式了

→

Yaomini 01/30 09:23 全面取代西方知識體系為主的字母

噓

fdtu0928 01/30 09:24資料來源呢？

→

Yaomini 01/30 09:24 方塊字也能寫程式，徹底建構中國智庫

推

DameLillard 01/30 09:25這就真的是硬凹了

推

kuninaka 01/30 09:26是部份吧

噓

bear701107 01/30 09:26神靈吹大家都知道表示什麼了

→

kuninaka 01/30 09:26硬ㄠ成全部都用低階來寫

→

kuninaka 01/30 09:26而且DeepSeek的問題在於它用OPENAI

→

kuninaka 01/30 09:26的結果去算吧

噓

HenryLin123 01/30 09:28你啥時這麼懂AI了

→

zzahoward 01/30 09:28討論好幾篇沒人提到R1爆紅真正的原因

→

zzahoward 01/30 09:30主要是RL取代RLHF 在小規模模型上高效

漲知識推

→

zzahoward 01/30 09:31被懷疑拿OpenAI去train的是V3 V3就很鳥

推

windyyw 01/30 09:31理性推

※ 編輯: Sinreigensou (49.217.127.7 臺灣), 01/30/2025 09:32:07

推

kuninaka 01/30 09:35R1也是建立在V3基礎之上的

→

kuninaka 01/30 09:36整件事情是代表開源的價值

→

kuninaka 01/30 09:36比OpenAI還Open

→

zzahoward 01/30 09:36但真正大家驚艷的是R1本身的演算法而

→

zzahoward 01/30 09:36不是V3

→

kuninaka 01/30 09:36過幾周Open AI也要丟O3出來了

→

kuninaka 01/30 09:37OpenAI也有宣布O3-mini免費

→

kuninaka 01/30 09:37到時候再看看

→

kuninaka 01/30 09:37DeepSeek作為開源，可以自己下載建構

→

kuninaka 01/30 09:37還是很香的

→

kuninaka 01/30 09:38阿里巴巴也有出了R1演算法版本

推

kuninaka 01/30 09:42DeepSeek-R1-Distill-Qwen

推

kuninaka 01/30 09:45更正一下阿里巴巴出的是另一個版本

推

kuninaka 01/30 09:48https://i.imgur.com/rcylSPZ.png

→

kuninaka 01/30 09:49Qwen 2.5-MAX

→

kuninaka 01/30 09:49肯定沒R1便宜

噓

z1976 01/30 09:56這有點奇怪，PTX是中間語言，通常是框架產

→

z1976 01/30 09:56生，不太可能是人寫

→

yayohola 01/30 09:59感覺這很難移植吧

噓

tamanoko 01/30 10:00光是ID 內容大概要打8個問號

噓

z1976 01/30 10:01三個月手刻類似於assembly的PTX，這太奇葩

→

z1976 01/30 10:01了

→

z1976 01/30 10:03我看了原文，是 “部份”採用PTX ，那這就

→

z1976 01/30 10:03有可能

→

z1976 01/30 10:04這就有點像為了繞過CPU指令集而手刻assembl

→

z1976 01/30 10:04y程式

噓

kougousei 01/30 10:05捨CUDA用PTX就像是不用高階程式語言用

→

kougousei 01/30 10:05組合語言

噓

z1976 01/30 10:11H800明明可以用CUDA，誰會擺著硬體在那邊

→

z1976 01/30 10:11不用，我猜測是新聞斷章取義

→

bear701107 01/30 10:11大部分人不懂不會亂說但是有些人

→

bear701107 01/30 10:11自己沒很懂也在跟風翻車是必然

推

jimhall 01/30 10:48公司本體是股市金融投資公司不免懷疑就

→

jimhall 01/30 10:48是炒作話題搭配證券交易來賺錢趁華人圈

→

jimhall 01/30 10:48放假很多消息難驗證然後中港台也沒辦

→

jimhall 01/30 10:48法交易的時候來玩一把

噓

benny1990615 01/30 12:57造謠仔

同系列文章

[討論] 藍白為什麼連蹭Deepseek都能翻車？

其他人也閱讀了

PTT 熱門相關