Re: [新聞] 路透:美國暗裝追蹤器查AI晶片非法轉運
《經濟通通訊社14日專訊》據英國《金融時報》報道,中國人工智能公司DeepSeek在使用華為芯片訓練失敗後推遲發布新AI模型DeepSeek-R2,這凸顯了北京方面推動取代美國技術的局限性。
綜合市場報道,DeepSeek-R2大模型原定5月推出,其後再傳將於8月15日至30日期間發布,惟接近DeepSeek人士指消息不實,並確認DeepSeek-R2在8月內並無發布計劃。
《金融時報》稱,DeepSeek在使用華為昇騰芯片訓練其R2模型時遇到持續的技術問題,導致其最終選擇使用英偉達芯片進行訓練,而昇騰芯片則用於推理。
美國早前與英偉達達成分成協議,允許其恢復在中國銷售H20芯片,但中國官方對英偉達AI芯片提出安全顧慮。有消息指政府約談科技公司,鼓勵其使用國產半導體產品,尤其避免在與政府相關場景中使用H20芯片。
=============分隔線=============
其實今天金融時報的報導,DeepSeekR2遲遲無法推出的原因,也部分跟美國這個追蹤輝達晶片的做法有關。
根據美國眾議院的報告,DeepSeek公司手上目前有的輝達GPU量大約是至少6萬片,分別是:A100 1 萬、H100 1 萬、H800 1 萬、H20 3 萬。(今年1月底的分析)
H800跟H20都是中國特供版本,性能比H100差
可以用TFLOPS來看能力:
H100(1979TFLOPS)>H800(1200-1400)>A100(312)>H20(296)。
目前OpenAI的GPT-5,使用多少GPU訓練並未公布,但在建的星門計畫以耗電量4.5GW,回推是要裝預計200萬片的GPU(應該是GB200,TFLOPS號稱是H100的30倍)
https://reut.rs/4mFqKUb
馬斯克的xAI以7月份的新聞報導,他目前就已經使用23萬片GPU(包含3萬片GB200)訓練他的Grok4
GPT-5的綜合能力比Grok4高,所以預計至少不少於20萬片GPU
相比起來Deepseek的GPU數量只有1/10(A100跟H20就不列入了,差太多),並且其中半數是特供的低階版本,Deepseek要在最
近訓練出能比拼GPT5、Grok4、Gemini、Claude這幾款AI模型的可能性不高。
而美國用追蹤器防止晶片偷運去中國也一定會造成DeepSeek這一眾公司難以取得更新的B系列GPU。
再來說說華為一直吹的升騰(Ascend)系列晶片,華為一直聲稱該款GPU能達到H100的算力,但從這新聞可以看出來華為的GPU架構有問題,再結合之前華為的盤古大模型被爆料是套殼其他家的模型時,那位內部人有寫到用華為的GPU訓練發生多次崩潰的情形,所以這應該就是為什麼DeepSeek要棄用升騰,用回H20等比較低階的GPU。
另外升騰910C的晶片,就是之前台積電發現華為透過第三方皮包公司下訂的那款晶片。
依據預計,目前華為有的台積電生產晶片量大約可以支撐到2026年,而為什麼是迂迴找台積而不找中芯的原因,主要原因就是7nm的製程,中芯良率只有20-40%,相比台積來說80-90%良率差的不是一點半點,就算是良品,也不代表該晶片性能就等於台積製造的晶片,之前三星跟台積一起代工蘋果處理器結果台積的效能散熱都比三星好就是例子。
如果美國出台GPU上都要強制使用時要有地點確認機制的話,對中國來說就是真的連偷運都很難了。
※ 引述 《geordie (夢の住民)》 之銘言:
:
: 原文來源:
: https://bit.ly/45NZdKD
: 原文摘要:
: 路透:美國暗裝追蹤器查AI晶片非法轉運中國
:
: (中央社新加坡/紐約13日綜合外電報導)根據兩位知情人士透露,美國當局已經有針對性
: 地在他們認為遭到非法轉運至中國風險很高的先進晶片出貨中,秘密安裝定位追蹤裝置。:
: 路透社報導,這兩位消息人士指出,這些做法目的在於探查人工智慧(AI)晶片遭到轉運至
: 美國出口限制地區的情況,僅適用於正遭到調查的特定貨物。
:
: 這些作為凸顯美國貫徹對中國晶片出口限制的程度,即使川普政府已試圖放寬中國取得美國
: 先進半導體的部分管制。
:
: 由於事涉敏感而不願意透露姓名的消息人士表示,這些追蹤器有助於對因違反美國出口管制
: 而獲益的個人和公司提起告訴。
:
: 定位追蹤器是美國執法機構追蹤諸如飛機零件等受出口管制產品時,沿用數十年的調查工具
: 。一名消息人士表示,定位追蹤器近年來也被用在打擊半導體非法轉運上。
:
: 積極參與AI伺服器供應鏈的另外5人表示,他們知道使用輝達(NVIDIA)和超微(AMD)晶片
: 的戴爾(Dell)和美超微(Super Micro)等製造商的伺服器出貨被安裝追蹤器。
:
: 這些人士表示,追蹤裝置通常被隱藏在伺服器出貨的包裝內,但他們不清楚由哪些單位進行
: 安裝,也不知道是在運送路線中的哪個環節進行。
:
: 路透社無法確認美國當局在晶片相關調查中使用追蹤器的頻率,也無法確認何時開始利用追
: 蹤器調查晶片走私。美國2022年開始限制輝達、超微及其他製造商對中國銷售先進晶片。(
: 譯者:林沂鋒/核稿:何宏儒)1140813
: 心得感想:
: 台積出品的應該也會裝追蹤器吧?(在美國的台積)
:
: 不過這樣子的話,美國會不會也要求台灣的半導體也裝追蹤器?
: 以免像上次台積的晶片最後轉到禁售名單的手上去
: 注意事項:請注意版規內容。
:
:
--
華為沒有輸
良率20~40% 就算挑出來能用的 電性也不會好
deepseek 又是你
所以日本人才要偷台積電2奈米製程技術
華為走回GPGPU路線就是因為架構沒辦法跟輝達競爭
問題是台灣ai全用美國貨,也沒本土的啊
台灣又沒受限制,哪來本土貨需要?
中芯十四奈米/十奈米(N+1)/七奈米 (N+2)
可以看作同一世代的製程
本質上來說就是多重曝光,沒那個EUV就只能這樣幹
每多一次曝光必然導致良率衰減一次,多次就多次衰
減
吹完黑悟空,deepseek都不了了之,下一波要吹什麼
?
吹假的第三款六代戰機
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
26
Re: [問卦] 有沒有中國這次第四次AI工業革命要GG了AI晶片很多家做,但輝達的CUDA和GPU軟硬 結合,可以用CUDA當C語言編譯器,把輝達 GPU當CPU用。現在中國的AI大用戶,,好像 不想用高閹割版的輝達H20,於是都各自要把 自家用CUDA編譯的整套程式,慢慢改寫轉移21
[討論] 中國一直在釋放「高階晶片無用論」從華為7nm事件到DeepSeek 中國一直在努力證明高階晶片無用 也確實有發揮到創意 但是世界發展高階晶片會因為這樣停止嗎? 2048個H800可以訓練出對標o1的AI![[討論] 中國一直在釋放「高階晶片無用論」 [討論] 中國一直在釋放「高階晶片無用論」](https://i.imgur.com/FZQ2FIzb.jpeg)
17
Re: [閒聊] 如果高階晶片需求趨緩,台積房會gg嗎Deepseek模型出來 對於訓練的算力要求大減 但推論的晶片還是需要 只是把貴桑桑的gpu轉去 特定功用的asic便宜晶片 但還是要用台積的工廠製造 但最大問題是出在美國強迫台積到美擴大生產 台積美廠之前被爆出超過一半外地人7
[請益] DeepSeek 會不會反加大中美 AI 差距最近中國的 AI 團隊 DeepSeek 宣布了一個大突破,透過 DualPipe、FP8 低精度計算、 通訊優化 這些技術,讓 AI 訓練的效率大幅提升,意思就是說 用比較少的 GPU 就能達 到原本需要超大量 GPU 才能完成的 AI 訓練。 表面上看起來這對中國 AI 產業是個好消息,因為 美國對中國禁售高端 GPU,中國 AI 企業的算力一直是硬傷。所以很多人說deepseek是中國彎道超車,讓中國即使不用美國高4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是![[問卦]DeepSeek是不是台積電的救世主? [問卦]DeepSeek是不是台積電的救世主?](https://i.imgur.com/Z7twi0Sb.jpg)
1
Re: [新聞] DeepSeek 傳為改用中國國產 GPU 做準備除了deepseek在準備繞過輝達CUDA 有風聲說DS可以在華為手刻晶片上運行之外 前幾天網路衝浪看到有一個西台灣的科技宅 自稱提早八個月預測到DS的成功 然後說了他下一個預測是3
Re: [新聞] 輝達將恢復向中國銷售H20晶片 華爾街日結果中國幾家大廠跳出來否認採購H20 字節跳動負責人說我們目前不打算採購H20 7 月 23 日,360 集團創始人周鴻禕對外明確,公司晶片採購正轉向中國國產晶片。他坦言,儘管中國國產晶片與輝達存在差距,但必須堅持使用,因為只有通過大量應用,才能推動其持續改進。2
Re: [問卦] 中國484又要搖搖領先叫華為做顯卡?= =其實華為有GPU產品線, 2018年底華為推出了昇騰910芯片和配套的 AI大模型框架,而英偉達推出A100及配套的 產品比華為晚大約一年。 昇騰910是台積電7nm EUV初代工藝代工的,