Re: [新聞] 阿里巴巴推新晶片 中企搶攻自主技術拼不
週末來閒聊美中AI晶片的故事,
這是我個人觀點也會加上我對未來十年的看法,
我盡量避免中美政治議題與辦公室政治學
先說結論,
這也是我當年面試高通SnapDragon Core team時,
最大的頭跟我說的話:
業界一直在重複循環相同的發展,
從大到小, 小再到大,
從單機到分散式處理, 再從分散式處理到單機
他當年在IBM做Mainframe,
同時期的競爭對手是SunMicro System,
當時的情況就跟現在AI比拼算力一模一樣,
大家都想盡辦法做出超級電腦,
結果他們團隊在離開IBM時的最後一個project,
是跟蘇大媽合作的cell process, 給遊戲機使用,
然後他們出來開公司做的是手機ARM CPU,
而同樣的對手從SunMicrso System離開也是開公司(PA Semi)做手機ARM CPU,
又很巧合的一家被高通收購,
另一家被蘋果收購,
他說他們無法想像同一個團隊做比一個房間還要大的超級電腦,
最後居然是做比一個指甲還要小的手機CPU
以下是我的看法,
AI 晶片正在走過一模一樣的路,
現在處在堆算力的超級電腦階段,
之後一定會慢慢演變到EdgeAI,
模型也一定會從LLM 慢慢轉變成分散式處理的SLM,
我無法給確切時間,
但是我猜兩三年內會轉換成分散式處理的SLM,
EdgeAI的應用應該在三到五年內會普及,
再多說就太底層的東西,
我自己也不是很懂,
反正你上網找SLM, LLM, EdgeAI 就能找到相對應的公司股票
接下來我用編年史的方式描述AI晶片的發展過程,
大概在2010年之前,
大部分的ML都還是靠CPU 運算比較多,
GPU加速有, 但是幫助不大,
真正帶起這波AI浪潮的關鍵在2010年初期,
有人拿GPU 去跑類神經網路 (neural network),
把一個卡住四五十年的人類古老科技 (neural network),
用GPU 的算力重新定義,
也就是Deep Learning,
AI 晶片突然火紅起來
在2010年初,
只有NVDA GPU能跑Deep Learning,
華為在那時候想開發類似的AI 晶片跑Deep Learning,
也就是昇騰的第一版,
同時間,
寒武紀把NPU AI晶片的想法實現在手機上,
谷歌那時候也看到Deep Learning的威力, 開始開發TPU
所以第一波AI晶片的領跑者是NVDA,
谷歌, 華為, 寒武紀大概落後NVDA一兩年,
不過同樣是第一梯隊
手機NPU的研發相對沒那麼困難,
所以隔不久,
很多公司也就跟著發表類似的手機NPU,
包含蘋果, 高通, 谷歌 (Tensor), 聯發科 (後來分出來成耐能科技),
這大概是2016年左右
但是server端的AI 晶片開發並不順利,
很多公司嘗試打入 server AI 晶片, 全都失敗,
這段時間, 2016-2022年,
只有NVDA 一家寡占,
其中有一些公司陸續開發一些ASIC,
像是阿里巴巴的含光, Amazon ASIC, 谷歌TPU,
但是"每年"一直持續開發演進的只有谷歌TPU,
原因是AI應用達到瓶頸了,
Deep Learning 在影像處理跟語音辨識等等超強,
但是到了2022年,
這些應用已經到了極限, 能用到的都用了,
圖像分辨率可以高達99.99% (你逃不掉天網的),
AI很像要冷卻下來了,
現有的ASIC 處理影像, 語音跟手機照相, 監視器等等已經足夠,
然後就迎來了AI二次革命, ChatGPT,
這個真的把業界打得措手不及,
谷歌是真的被殺的很慘,
尤其GPT這算法還是谷歌自己發明自己open source,
被別人拿自己的魔法來攻擊自己,
2022年之後,
ChatGPT 帶來LLM的需求,
之前所有的設計全都不適用, 不能用在LLM,
不論是NPU, TPU, 含光, 昇騰全都不能用在LLM,
整個架構跟設計必須重做,
當然,
事情沒有真的那麼糟,
畢竟LLM (ChatGPT) 只是千萬種AI應用之一,
大部分的AI應用不用LLM的話,
舊有的ASIC跟架構還是能順順使用
只是2022年之後,
LLM ChatGPT在風頭上,
但是當時全世界只有NVDA GPU能夠跑LLM,
業界必須重新設計架構來面對LLM,
這兩三年業界也的確研發出新的架構可以處理LLM,
包含博通, Alab, Mrvl, 谷歌TPU等等,
華為的解法是類似博通Alab的方式用網路堆算力,
阿里巴巴跟寒武紀的架構我就不熟了,
故事講完了
--
tapeout週期性發展 先做個大的把東西塞進去Demo功能
然後再微縮化想辦法做小省錢提高die count
做小後新的知識和layout成熟就繼續做大 堆數量提升
達成更高單晶片算力 loop
推分享,學歷史
Edge 我賭riscv
商學組 有看沒有懂 淚)
謝謝TQ王分享
謝謝
FPGA呢
厲害,六年級前端班生以上嗎
祝假期愉快
好文值得推,感謝提供投資思維
嗯嗯對對跟我想的一樣
推
感謝
推故事
謝謝分享 現在似乎要專精於網路的迭算力 所以傳輸
很重要 單個晶片就是拚不過輝達 要並聯了!
感謝分享,感覺LLM還要再變革架構才能更前進就是..
. 可能是用免費版CHATGPT吧,失憶還是滿嚴重的...
狗家兩邊都有成果,看影片感覺新披索的edgeai還不
錯
重返榮耀?
阿里巴巴開盤就大漲18% 有夠猛 但台灣要買很麻煩
應該沒有什麼人吃到這一波 可惜
美股baba啊 蒙格之前被套很慘
感謝前輩分享,先推再享用
美股的巴巴上周五就十多趴了,敢追要心臟大顆
買狗沒事
他的手穿過我的巴巴
推分享
推講古
推AI講古!我猜gpt無法講得比這篇好
好奇架構為何不能用在LLM? 不都是deep learning
原來的架構記憶體不夠大可以處理LLM 訓練, NVDA GPU 在那時候就已經可以串連(NVLink, NVSwitch)做LLM 訓練
卷起來棒
推分享
繪圖架構的天生優勢就是大通道高頻高容量記憶體囉
畢竟原本需求就要存大量的texture
我覺得下一波需求Server AI會從LLM往World Model走
LM會下放到edge AI 但會往雲端調用高級需求(深度推
理之類)
Edge需要更深度與Home和Glass之類的應用整合
推一個
好文推
請問edge AI現在已經很成熟了不是嗎?例如車用、工
廠自動化之類的,認為會有爆發性成長是指在更多領
域?
EdgeAI 跟 SLM 只是個統稱, 其方向是對某些AI應用做本地端的硬體加速與應用, 每種不同的EdgeAI 跟 SLM 都有完全不同的設計, 所以EdgeAI 與SLM 的方向跟AGI剛好相反, 但是可以透過分散式處理達到AGI的效果 所以EdgeAI 很成熟只在特定某些部分的應用, 目前最成熟的是圖像辨識跟語音辨識, 比方說人臉辨識99.99%準確率, 阿里巴巴的含光最強的就是圖像辨識這塊, 被拿去裝在無人商店監視器, 天網系統, 小愛等等, 但是Chat GPT類的應用在 EdgeAI 非常不成熟, 目前只有Gemini 能夠在EdgeAI 本地執行, OpenAI ChatGPT要遠端連線到伺服器處理 我個人看法, 自駕車跟智慧眼鏡雖然還稱不上是成熟, 但是自駕車跟智慧眼鏡的EdgeAI廣泛運用今年已經開始, 大概一兩年的時間能夠成熟, 監視器,語音辨識等等已經完全成熟, 最後最難的部分會是在手機的EdgeAI, 因為手機的EdgeAI 會比較偏向AGI, 各種AI應用都會想在手機上面實現
Edge AI永遠都有功耗和性能提昇的需求 因為哪些應用
和運算會下放到Edge是一個動態進化的過程
推
類似windows或iso 要一直update然後越來越吃硬體規
格這樣?
是也不是 作業系統再怎麼升級功能都是作業系統
Edge AI的硬體升級是整個AI社會架構層面運算力分配
規劃與能源效率尺度的問題
漲知識:)
感謝業內人士分享
感謝分享
之前稍微了解一下過,2010 年拿 GPU 去跑的時候
可能連黃董都沒想到過?!
黃董作CUDA最早是為了GPGPU 是不是已經預見了AI不好
說 但是最晚最晚到2014~2015他已經意識到了
感謝業內人士講古
TQ王有料,勉強しました
@@
Core team=Gerard W.?
不是, 你說的Gerard W. 是nuvia, 主要是做筆電的CPU, 我是在nuvia之前的core team, 做手機CPU krait kryo, 後來整組幾千人被裁掉, 所以我才會中年失業, 這又是另外一個故事了
※ 編輯: waitrop (76.103.225.6 美國), 09/03/2025 11:47:56爆
Re: [新聞] 超微AI晶片將追趕輝達講這就表示尼不懂R TPU一部分的問題就在asic惹 估狗AI晶片最重要的應用是廣告推薦DLRM 不是現在流行的chatbot/LLM 尼asic做成那樣惹 就不用來跟gpu比惹 我說我現在的港覺喇![Re: [新聞] 超微AI晶片將追趕輝達 Re: [新聞] 超微AI晶片將追趕輝達](https://i.imgur.com/JGyxT9Nb.jpg)
94
Re: [新聞] 輝達傳再推中國特供AI晶片 最快「這時」老黃應該是有機會能繼續用黃家刀法 用高階價錢賣低階產物給中國 從美國的最大化利益角度來想 美國也會希望老黃賣次級的晶片給中國 這樣就某種程度能最大化阻滯中國發展 和弱化中國科技樹發展 比方說 中國最近的華為昇腾910B AI晶片號稱對標A100 已經賣給百度作為AI開發用途 如果說中國目前上面自製化晶片算力是10 那A100是30 H100是50 那老黃只要賣給中國晶片![Re: [新聞] 輝達傳再推中國特供AI晶片 最快「這時」 Re: [新聞] 輝達傳再推中國特供AI晶片 最快「這時」](https://i.imgur.com/ehbrItPb.jpg)
42
Re: [新聞] 稱霸 AI 推理性能,NVIDIA B200 晶片海相關文章可以參考這個 比較有意義的是這邊 前言![Re: [新聞] 稱霸 AI 推理性能,NVIDIA B200 晶片海 Re: [新聞] 稱霸 AI 推理性能,NVIDIA B200 晶片海](https://img.youtube.com/vi/jpfC7rzoX2A/mqdefault.jpg)
13
[情報] 挑戰Nvidia,AMD收購AI優化軟體新創業者B挑戰Nvidia,AMD收購AI優化軟體新創業者Brium 文/林妍溱 | 2025-06-05發表 AMD宣布收購AI推論優化技術業者Brium,以協助LLM在AMD等非Nvidia硬體架構上的推論效能。 Brium產品涵括的組譯器技術、模型執行框架及完整的AI推論最佳化技術,其方案旨在提升多種硬體架構上大型語言模型(LLM)的推論效率。AMD解釋,Brium技術特別之處在於它能優化模型接觸到硬體前的整個技術堆疊,有助於減少對特定硬體配置的依賴,而能在更多元環境上,實現更快的AI應用。 AMD表示,Brium的收購有助於提升該公司硬體平臺的效率和彈性。而Brium的收購連同AMD之前收購的Silo AI、Nod.ai及Mipsology,可強化該公司執行開源軟體生態系的能力。![[情報] 挑戰Nvidia,AMD收購AI優化軟體新創業者B [情報] 挑戰Nvidia,AMD收購AI優化軟體新創業者B](https://s4.itho.me/sites/default/files/field/image/0605-amd-qing_jing_-shi_yi_-guan_fang_tu_pian_-960.jpg)
10
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不解決幻覺,不一定要從LLM解, 而是靠系統架構解。 例如,做一個問答系統,很多人減少幻覺是這樣做的: 0. 預先整理好QA問答資料集 (人工整理,或機器輔助整理)5
Re: [新聞] 蘋果積極徵才開發生成式AI 力拚整合到iPh蘋果這條路線跟高通一樣 就是on-device inference 高通之前示範過了 目前個人不負責任理解是 Meta/Adobe/MS/Google/Saleforce都在走向雲端大模型 (e.g., Foundation/LLM AI)也就是AI as a Service 有些Startup公司已經開始在把Foundation/Pre-trained Moedel當作工具在賣![Re: [新聞] 蘋果積極徵才開發生成式AI 力拚整合到iPh Re: [新聞] 蘋果積極徵才開發生成式AI 力拚整合到iPh](https://img.alicdn.com/tfs/TB1LCE1aQ5E3KVjSZFCXXbuzXXa-200-200.png)
2
[問卦] 台灣沒有ai的前端發展是不是沒有電啊?想一想 也是真奇怪 全世界的ai工廠 ai的基礎都在台灣 而且我們跟 nvda這麼好X
[情報] 中國團隊推出首顆以TDD方案 AI 設計 CPU中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍, 並可運行 Linux 作業系統,且性能堪比Intel 486。
Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎講一些自身經驗好了 自從AI領域在生成式題材大火後 全世界就進入到AI軍備競賽 所有的AI基礎研究都是以週甚至日為單位在迭代 舉個例子 當年Robert G. Gallager 在1960提出類神經網路的LDPC code到2004年才大放異彩 無限接近shannon bound 光這個演進就花了40年 對照這幾年的AI科技樹發展 根本就是指數在成長![Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎 Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎](https://pic1.zhimg.com/v2-63720ccb03e4a336652f3a0200ca7944_l.jpg?source=172ae18b)
84
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
52
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
38
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
29
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性20
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐15
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預16
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
14
[請益] 第一金最近有什麼大事要發生嗎?11
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
8
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性5
[情報] 2548 華固 10月營收 MoM 702% YoY 37447%![[情報] 2548 華固 10月營收 MoM 702% YoY 37447% [情報] 2548 華固 10月營收 MoM 702% YoY 37447%](https://i.meee.com.tw/gQ7aplg.png)
4
[情報] 日本兩年期公債收益率升至1.03%2
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://i.imgur.com/4uwgTa3b.png)
1
Re: 00641R 富邦日本反1 小單多
X
Re: [請益] 0056可以這樣操作嗎
[情報] 工紙族群多
[標的] 2454聯發科2330台積電 哪個好![[標的] 2454聯發科2330台積電 哪個好 [標的] 2454聯發科2330台積電 哪個好](https://i.imgur.com/TbK5aJcb.jpeg)
![Re: [新聞] 阿里巴巴推新晶片 中企搶攻自主技術拼不 Re: [新聞] 阿里巴巴推新晶片 中企搶攻自主技術拼不](https://img.alicdn.com/tfs/TB1lWP9aG67gK0jSZFHXXa9jVXa-520-520.png)