Re: [情報] 中國5090 DeepSeek 大模型一體機需求爆發
沒辦法,算是錯誤的供需市場吧
應該是Deepseek運用高效算力提供便宜的API給民用商用需求
結果API也不便宜,網頁版本還時常不可用跟言論審查
大幅加速中國本地推理需求,畢竟這是目前開源的推理模型
而且對中文圈華語使用者有很道地的中文訓練資料
昨天雲飛直播切片也談到了DS目前是GPT的替代品
o3跟o3mini確實很強,但本機跑DS確實也不用錢就有推理聯網知識庫
而且還能迫使OpenAI從閉源態度轉向開源,屆時才是真的顯卡風暴
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.106.204 (臺灣)
※ PTT 網址
推
反正NV股票下單就對了
→
連淘寶一堆改RAM的顯卡都被掃貨就知道這波
→
有多瘋狂了,會持續多久只能說暫時還看不到
→
盡頭 (合掌)
推
賣鏟子的繼續躺著賺
推
NV都沒啥漲 爆漲是SMCI 跟 intel 真黑人問號
推
Intel是川普一直在救 利多消息很多
推
保固我倒覺得還好,四年前的顯卡應該是30
→
系列,用到今天是我的話早就已經更新了
→
回錯篇
推
以前鏟子要買大把的 現在小把的也開始熱
→
賣
推
DS恐慌仔不是說算力需求量下降...
推
AMD做點事好不
推
不是說deepseek的訓練法可以繞過cu
→
da嗎?這樣的話AMD應該也行吧
推
之前llama3.1就很好用了
→
這波是被炒作起來的吧
→
我7600S用ollama也能跑 就是那個速度...聊
→
勝於無
推
老黃躺在陽台笑看下面眾生吵吵鬧鬧
→
本機跑不用錢的前提是你的硬體可以
→
跑夠大的模型吧
→
不管怎麼樣都要花大錢
→
開源太強了 逼你開源阿
→
這麼先進的模型,當然是用sis6326就能用了啦
推
6326XD
→
既然言論審查怎麼一堆人搶著用啊XD
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
40
Re: [閒聊] DeepSeek是不是真的很強?這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普9
[問卦] 要收費的OpenAI是不是完蛋了感覺美國的這些AI公司都講好了 開源的模型不能超越閉源的 很明顯這些開源的大公司有在禮讓 不能把別人的飯碗全部端走 讓OpenAI這個閉源的可以繼續撈![[問卦] 要收費的OpenAI是不是完蛋了 [問卦] 要收費的OpenAI是不是完蛋了](https://i.imgur.com/Xf1S6o8b.jpg)
7
Re: [閒聊] DeepSeek是不是真的很強?根據 openrouter.ai 速度體感就 4080 vs 1060 openai o3 mini 一秒輸出1280個字/令牌(tokens) deepseek r1 一秒輸出 43個字/令牌(tokens) DeepSeek R1 8個供應商速度都不快,![Re: [閒聊] DeepSeek是不是真的很強? Re: [閒聊] DeepSeek是不是真的很強?](https://i.imgur.com/IuPQsd4b.jpeg)
6
Re: [問卦] DeepSeek是真貨,版圖會不會大改?Deepseek真正改變的是讓開源生態系注入了新的活水,過去半年其實大家都是被OpenAI的生 態系越玩越死,新創很怕自己做出的服務馬上就被閉源的chatGPT直接取代,然後要做出服 務還要付出大筆服務費,要自己搭還需要大量計算能力。 但DeepSeek R1直接告訴你要讓語言模型有推理能力根本不需要真的做大,要訓練推理能力 也不需要讓人去轉出人類的思考過程(TTT模式),直接拿好的基礎我們去蒸餾再去給他環3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我先講我非AI專業 但這件事情基本就是鬼扯 甚麼叫做利用O1蒸餾出R1 你要用API抓多少資訊量跟TOKEN才做得出來 然後這件事情OPENAI還會不知道?
Re: [討論] 怎麼白藍人&中國人不討論deepseek了?chatgpt o3mini出來了,你們不是也沒吹噓嗎,哥布林本來就沒有討論這個議題的能力 ALTMAN說在開源問題上,openai可能站在了歷史的錯誤一邊,哥布林知道嗎,敢討論嗎 英國印度都藉著deepseek準備大展拳腳,AMD/NVIDA/AMAZON都在自己的體係裡大力引入deepseek chatgpt o1本是不公開推理過程的,但是o3mini開放了,價格也猛降,應該感謝誰。 deepseek數學和編程指標領先,全世界沒有質疑的![Re: [討論] 怎麼白藍人&中國人不討論deepseek了? Re: [討論] 怎麼白藍人&中國人不討論deepseek了?](https://i.imgur.com/yApcfCCb.jpeg)
![[情報] 中國5090 DeepSeek 大模型一體機需求爆發 [情報] 中國5090 DeepSeek 大模型一體機需求爆發](https://i.imgur.com/e3ghlzGb.png)