[菜單] DeepSeek 671b大模型推理機
已買/未買/已付訂金(元):未買
預算/用途:用來跑DeepSeek 671b大模型推論機。模型大小404GB,需要全部載入DDR上用CPU來算
CPU (中央處理器): 全新 EPYC 7K62 48核心96線程 2.6G 正式版 $7500
MB (主機板): 超微H11SSL-i 二手 $8900
RAM (記憶體): 三星DDR4 ECC REG 64G 2666 x 8 $1600x8 = $12800
VGA (顯示卡): 舊EVGA 3060 12G(已有)
Cooler (散熱器): 6熱管金錢豹AMD epyc 散熱器 $850
SSD (固態硬碟): KIOXIA 鎧俠 Exceria G2 2TB M.2 2280 PCIe 3.0 ssd $3590
HDD (硬碟):
PSU (電源供應器): 台達 金牌全模組650W $2890
CHASSIS (機殼):
MONITOR (螢幕):
Mouse/KB (鼠鍵):
OS (作業系統): Ubuntu
其它 (自填):
總價 (未稅/含稅):$36530
CPU 主機板、DRAM在洶寶買。
是否有更好選擇
謝謝
--
洶寶<3
H11SSL-I只有PCI-E 3.0,你要確定耶,
還有沒有支援Resizable BAR,這H12才有
只用cpu跑,pcie沒關係
這一問一答要多久啊
要本地部署嗎?
我是覺得個人玩家直接用線上的就好,
自由度也高
這速度大概跟macmini跑速度差不多
https://is.gd/u3VvxG 這連結你參考一下
還有這個 https://is.gd/vKxtAT
他是vram不是ram
我記得H100要好幾張
h100要8張,買不起。
肯定是淘寶或小黃魚買
用unsloth處理過只需要不到200G
我是用Z840,128G一萬多而已,再加
線上一直斷線,根本不能用
SSD、RAM、GPU
你串MAC MINI會不會比較快?
荒唐
不過顯卡不延長只能插一張
deepseek 用CPU跑效率好嗎?
671b應該不太好,unsloth動態量化後
還可以,但是會有非預期EOF問題
哇....@@
老黃下巴掉了
我還是選擇api就好
這不會慢死嗎?
KTransformers可以參考一下
用GPU加速的純CPU方案
最大的參數量拿單機去跑很慢拉
哈哈哈哈哈哈
期待原po未來分享用cpu跑671b的效率
老哥 買顯卡跑蒸餾完的不就好了
收張3090跑32b就好
每天睡覺前問問題, 睡醒看回答嗎 XD
已讀不回AI模擬機
線上跑就好了,不用蝦折騰
笑了
可以用袐塔
什麼鬼 這樣要跑多久?
??????
有人也是epyc+ddr4,可跑3~4token/s
比拿ssd跑快多了
先試試api吧!
蠻好奇這樣可以跑多快
跑7B還行,想跑671B?
推實驗精神,bilibili 有用transformer
s 跑6.6 tokens/s
Ktransformers
要怎麼看自己電腦的token數啊?
deepseek動不動就過宅,是要怎麼用線上的
3060我看對岸是說大約每秒10 tokens
現在可以在3060上跑14b, 速度很好。用cpu
, 可跑32b速度可以接受。
但是還是要用cpu 跑671b, 測試。
訓練ai確實一定要用gpu, 因為都是用fp32
或fp16來算。但推論都是經過量化的,多
以int8來算,cpu不見得不好
上面有人提到ktransformer, 也要先建一個
至少512gb dram的平台,再用4090加速
這次先讓它能跑起來就好了
太貴。e5 26xxv4 x2 不過應該都被炒起來了
謝謝,xeon也會研究一下
在前陣子ds剛爆紅時就在推特看過這種全
載ddram用cpu跑的方案,記得那時看到是
說大概5 tokens/s左右!?
期待後續成果
ktransformers聽說可以加速快30倍是真
假?
我記得很像有人用雙路cpu跑到13token/s
我幫你問deepseek本人了,感覺不太行
ktransformers建議是ram至少1t
1-10 tps可以接受
1tps 可以接受....猛
因為會寫程式去問它
ktrans 需要GPU 24GB VRAM 和382GB DRAM
這是為了玩還是工作? 2 3t/s真的不是人用的
deepseek自己的很塞可以用openrouter
即使免費的也有10t/s 怎樣都比 2 3t/s強
deepseek網頁版看起來應該有個3 40t/s
但有些問題光"想"它就能花上3 5分鐘
用你這方案豈不得跑一小時
網頁版的問題是現在服務常常不穩定
要建知識庫,不可能上傳網頁使用。
雙路13token0.3版才出不過MoE限制6個=閹割
ktrans至少要用16GB以上的顯卡,看來要換
discussions/11765
看這篇測q5的r1有4t/s
cpu跑ai模型?你是不是搞錯了什麼?
推論本來就可以用cpu跑
知識庫我用GOOGLE試算表一類的記錄,
算線上嗎?
科技公司:原來AI這麼便宜的...
11
[菜單] 40k工作遊戲多開機請益/無OS分別在罰站屋跟藝人店各做了菜單,畢竟兩家店的商品有所差異 向電蝦版友請益有沒有更好的建議 已買/未買/已付訂金(元):未買,預算40k 預算/用途:工作網拍文案編輯&模擬器多開 藝人店3
[菜單] 20K 小主機 長輩機已買/未買/已付訂金(元): 未買 預算/用途: 體積小放客廳,長輩看盤用,聲音越小越好,溫度越低越好 沒有遊戲需求,可能接電視 菜單A= ASRock Deskmini X600:![[菜單] 20K 小主機 長輩機 [菜單] 20K 小主機 長輩機](https://i.imgur.com/wLZTKEjb.jpeg)
3
[菜單] 24k 4060電腦請益已買/未買/已付訂金(元):未買 預算/用途:23990/日常文書遊戲 CPU (中央處理器):i5-12400f MB (主機板):華碩PRIME B760M-A D4-CSM RAM (記憶體):PNY XLR8 LP DDR4-3200 16G*22
[菜單] 43K 遊戲機含OS已買/未買/已付訂金(元):CPU MB SSD已買 預算/用途:43K/3A遊戲,希望能應付後五年。 CPU (中央處理器):AMD R5 7600 MB (主機板):華碩 TUF GAMING A620M-PLUS WIFI RAM (記憶體):十銓 TEAM T-CREATE EXPERT DDR5-6000 32G(16G*2)2
[菜單] 45K影音遊戲機已買/未買/已付訂金(元):未買 預算/用途:目前電腦已使用8年想更新電腦,想組台至少能使用5年以上的新電腦~ 螢幕為4K60,再麻煩幫忙指教改進,謝謝~ CPU (中央處理器):☆組合★ i5-12600K+華碩 PRIME Z790-P D4-CSM ATX主機板 9887 MB (主機板):同上2
[菜單] 17K上網影音機已買/未買/已付訂金(元):未買 預算/用途:上網影音 CPU (中央處理器):AMD 5500GT MB (主機板):技嘉 B550M DS3H AC RAM (記憶體):十銓 TEAM T-CREATE EXPERT DDR4-3200 32G(16G*2)(CL16)1
[菜單] 30k 遊戲機已買/未買/已付訂金(元): 預算/用途:遊戲兼少量剪輯 CPU (中央處理器):12700k(美亞已購) MB (主機板):技嘉 Z690M AORUS ELITE DDR4 RAM (記憶體):博帝 Patriot Viper Steel DDR4-3200 32G(16G*2)(CL16)1
[菜單] 36K遊戲機已買/未買/已付訂金(元):未買 預算/用途:遊戲 CPU (中央處理器):期間限定★ AMD R5 7500F MPK+華碩 TUF GAMING A620M-PLUS WIFI M-ATX主機板+鎧俠 EXCERIA PRO 1TB M.2 PCIe SSD 10299元 MB (主機板):同上 RAM (記憶體):ACER 宏碁 Predator Pallas II DDR5-6000 32G(16G*2)(CL30) 超頻桌上型記憶體《銀》3099元
[菜單] 30K遊戲機已買/未買/已付訂金(元):未買 預算/用途:黑悟空、魂系、其他3A遊戲 CPU (中央處理器):技嘉 B650 EAGLE AX+AMD【6核】Ryzen5 7500F MB (主機板):同上 RAM (記憶體):十銓 TEAM T-CREATE EXPERT DDR5-6000 32G
[菜單] 35K左右工作機已買/未買/已付訂金(元):未買 預算/用途:工作機,主要為Autocad 2D繪圖/多開網頁/文書 CPU (中央處理器):技嘉 B760M GAMING X AX DDR4+Intel【12核】Core i7-12700K MB (主機板): RAM (記憶體):TEAM T-CREATE EXPERT DDR4-3200 64G(32G*2)(CL16)
![Re: [菜單] DeepSeek 671b大模型推理機 Re: [菜單] DeepSeek 671b大模型推理機](https://img.youtube.com/vi/Tq_cmN4j2yY/mqdefault.jpg)