[請益] DeepSeek 會不會反加大中美 AI 差距
最近中國的 AI 團隊 DeepSeek 宣布了一個大突破,透過 DualPipe、FP8 低精度計算、通訊優化 這些技術,讓 AI 訓練的效率大幅提升,意思就是說 用比較少的 GPU 就能達到原本需要超大量 GPU 才能完成的 AI 訓練。
表面上看起來這對中國 AI 產業是個好消息,因為 美國對中國禁售高端 GPU,中國 AI
企業的算力一直是硬傷。所以很多人說deepseek是中國彎道超車,讓中國即使不用美國高端晶片也能達成相同效果。
但問題來了,美國 AI 巨頭(OpenAI、Google、Meta)目前擁有最新最強的 NVIDIA GPU,如果這些公司也大規模使用 DeepSeek 的技術,老美也擴大加重晶片管制,那這不反而讓美國AI 訓練的速度更快,成本更低,進一步擴大中美之間的差距嗎?畢竟中國再怎樣使用從軟體上優化, 但那個硬體限制還是在啊...本來美國 AI 就已經遙遙領先,現在如果效率又大幅提升,中國 AI 還追得上嗎?
DeepSeek 這個技術到底能不能彌補中國 AI 企業因為晶片短缺而落後的問題?
還是這種技術其實對美國 AI 企業的幫助更大,讓它們以更快的速度繼續拋開中國?
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.190.13.72 (澳大利亞)
※ PTT 網址
推
目前的問題是如何商品化(#
→
LLM 能用來幹嘛?
推
優化需要很多工程師。
推
你怎麼知道DS有把家底全部都秀出來
→
?
推
DS還有許多王炸還沒丟出來,下一個
→
是文生影片模型
推
大家都開源 最終能有效制裁的只有硬
→
體
→
但晶片到他國繞一圈到中國就好了
→
心照不宣而已
推
其實千問也很強 比較不知名而已 還
→
有華為的 華為才是軍事背景背後深不
→
見底的
→
光圖片都破成那樣
推
本來可以商品化 現在中國ㄧ捲…
推
難說
噓
王炸 LOL
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響78
[心得] DeepSeek將是刺破本輪泡沫的那根釘子從DeepSeek騰空出世,在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺,這輪的科技 股估值修正才正剛開始,誰能引爆華爾街炒作了整整一年的AI神話泡泡?或許DeepSeek就會 是刺破本輪AI泡沫的那根釘子。 記得2021 Nvidia顯卡被炒作的神話嗎?那時候以太幣漲到一顆4500,NV的RTX3060顯卡從24 99美元被炒作到6000美元以上,後來的故事大家都知道了,隨著2022那輪幣圈的泡沫暴跌跟47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。8
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未簡單說明一下為什麼NVDA暴跌 很多人一定覺得很奇怪,然後各種文組出來表演秀下限 簡單說NVDA能在40系GPU出來的時候打爛AMD , 就是因為他們的AI級伺服器GPU , 例如A100 還有H100 然後Deepseek現在告訴你 , 這些為了AI打造的GPU都是垃圾 接下來我舉個簡單的例子,Intel曾經想推動WiMAX 來一統高速無線網路6
[問卦] deepseek其實會引爆AI晶片更缺貨吧?一堆人在說什麼deepseek會造成AI泡沫 實際是更會造成晶片缺貨吧 巨頭計算模型輸中國的話 只會加大訂單買晶片 要用算力拼過別人8
[問卦] 脆:deepseek證明台灣不需要核電脆上面說 Deepseek證明訓練AI不需要多高級的GPU也不需要大量GPU 可見發展AI不需要更多電力 世界各企業用幻方的模型訓練AI後 不再需要更多電力6
[問卦] 美國AI巨頭的想法哪裡出了問題?大家好 AI需要靠GPU的神經網絡運算 一個GPU裡面有上千個核心 所以CPU要運算好幾天的問題 GPU只要幾個小時就可以算完4
Re: [請益] 憑良心說AI要怎麼賺錢?1. 投資AI相關股票 - 投資如Nvidia的GPU製造商股票,因GPU對訓練人工智能模型非常重要 - 投資雲端服務供應商如Amazon Web Services、Microsoft Azure等,他們提供人工智能雲端運算資源 - 投資人工智能軟件公司如Google、OpenAI等知名AI公司的股票 2. 利用Nvidia GPU提供加速運算服務4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是- 不會的,高層會開始思考,原來底下那些冗員整天要求增加算力和資金,實際上效率卻如 此低下。Deepseek 的訓練成本甚至不如一個高管的年薪,而這些大公司卻有幾十個領著 高薪的高管。這表明這些大公司擁有的算力本可以發揮出十倍的效果或進展速度,但卻因 為內部效率問題而被浪費。 這反而會促使這些大公司加大對高效率 AI 公司的投資,因為他們意識到自己內部存在的