Re: [討論] Deepseek就之前吹過頭了呀 XD
主要是他們故意少說了
預訓練那些專家模型的成本
只說訓練後的成本
不過還是比Open AI的GPT便宜就是
因為他們是特化型訓練,跑分仔。
-----
Sent from PttX on my iPhone
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.192.21 (臺灣)
※ PTT 網址
→
魯大師
推
支那的技倆就是複製貼上 再壓低預算 跟
→
藍白共一樣整整齊齊的
推
中國就是這樣用價格破壞去搶市場關注
推
這新聞跟小紅書一樣,這些產品/模型有
→
實際價值,但被吹得太大。像這兩天還有
→
人沒常識到瞎吹中國ai敢開源、實際一定
→
領先美國更多代,完全不知道meta這些企
→
業也是開源系統,互相站在別人肩膀上前
→
進本來就是開源的特性
47
首Po來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
前面省略 中間省略![Re: [討論] Deepseek就之前吹過頭了呀 XD Re: [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/V8KUdXCb.png)
15
想說什麼大事情 結果起來打開電腦一看 那斯達克大跌..........3.07% 人家華爾街找個理由漲多修正而已 真的出事,還跟你在那邊跌3%![Re: [討論] Deepseek就之前吹過頭了呀 XD Re: [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/zOIuF5Ob.jpeg)
因為看的不是那斯達克,看的是廢半. 費半: -9.15% 台積: -13.33%![Re: [討論] Deepseek就之前吹過頭了呀 XD Re: [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/wIo3Bp2b.jpg)
2
中國每一年都要有一個東西可以拿來吹,用來證明「東升西降」跟「遙遙領先」。 2024就是新能源車 2025看來就是AI了 現在可以先想想看2026是什麼 但無論如何,套路只有一個
我覺得最好笑的是, 之前支那一眾自媒體批評AI現在沒有大用, 都是歐美人吹起的泡沫。 結果現在搞了一個 大量人工精煉+抓跑分+偷用nv卡的Deepseek,
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
10
[問卦] deepseek會刺破ai泡沫嗎?原來訓練ai並沒有那麼昂貴, 中國Deepseek 公司用低成本就能訓練媲美OpenAI的gpt 中國低價策略根本讓高成本美國巨頭無法招架 Deepseek 會刺破ai泡沫嗎?有台積股票的會顫抖嗎? 有卦?9
[問卦] 中國deepseek是不是大贏chatgpt?最近有中國AI公司宣稱,用550萬美元成本 訓練大模型語言,效能贏很多美國大廠 台灣有沒辦法達到? 中國人的智慧是不是比美國人還厲害啊?9
Re: [請益] Deepseek v3 對台積電有影響嗎沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.imgur.com/wcgo1TCb.jpg)
8
[問卦] deepseek是不是掀了老美的遮羞布?如題啦 中國新創公司近期發布deepseek大模型 其性能可與gpt匹敵 而且訓練成本比美國所開發的低 與ai相關的科技股也應聲大跌 這也象徵老美的ai泡沫即將破滅6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI![[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt [爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt](https://i.imgur.com/Zo1PKXwb.jpg)
X
Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝達H10"世界一開源 中國就領先" 這是一句最近流傳的諺語~~~ 之前中國嘴砲7奈米量產 結果一開蓋 發現是TSMC like的製程 多重曝光 現在要驗證 deepseek是否真的是便宜成本就可以訓練好 只要請deepseek 公佈模型架構 不要提供完整訓練好的模型3
Re: [請益] Deepseek v3 對台積電有影響嗎的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.imgur.com/ZGzxwgNb.jpg)
1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平