[問卦] Deepseek註定辱華吧?
之前中國各科技巨頭推出大語言模型
什麼文心一言、通義千問、混元、盤古、星火、百川
各個名稱都有夠中國
結果Deepseek橫空出世取了個英文名字
中國最屌的AI怎麼能是英文名勒?
是不是辱華啊?有八卦咩
-----
Sent from JPTT on my iPhone
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.104.229 (臺灣)
※ PTT 網址
→
都是辱台
噓
你484擔心開盤
推
取英文名所以撼動華爾街
推
Mimi表示
→
乳
噓
中文名字叫深度求索...
→
辱台 因為台灣還在宇宙飄做不出來
→
早晚共產黨收回歸黨產
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:![[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3 [情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3](https://i.imgur.com/xVyT4dsb.png)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
6
[問卦] deepseek其實會引爆AI晶片更缺貨吧?一堆人在說什麼deepseek會造成AI泡沫 實際是更會造成晶片缺貨吧 巨頭計算模型輸中國的話 只會加大訂單買晶片 要用算力拼過別人![[問卦] deepseek其實會引爆AI晶片更缺貨吧? [問卦] deepseek其實會引爆AI晶片更缺貨吧?](https://i.imgur.com/tObU5uYb.gif)
9
Re: [新聞] DeepSeek凌晨發布新款開源AI模型!Janus這個DeepSeeK真的有那麼厲害嗎? 不是說為了政治正確 很多東西都屏蔽掉 就算是真的贏過OpenAI 那也只是贏過美國而已 但是全世界都知道6
[問卦] 說AI模型不重要的被打臉了嗎現在美國各大金融新聞 都在報導Deepseek Apple store 上下載量更是超越chatGPT 之前各路AI 大老都表示什麼 AI模型不重要![[問卦] 說AI模型不重要的被打臉了嗎 [問卦] 說AI模型不重要的被打臉了嗎](https://i.imgur.com/iq67SPml.jpg)
4
[問卦] 阿里巴巴的通義千問一問三不知?如圖 自稱比ChatGPT強的大型語言模型 只不過隨便問個問題就把它考倒了 一樣問題人家ChatGPT、Gemini、Claude 都可以把前因後果、死多少人,羅列出來![[問卦] 阿里巴巴的通義千問一問三不知? [問卦] 阿里巴巴的通義千問一問三不知?](https://i.imgur.com/jsnYIHcb.jpeg)
5
[問卦] 台灣有沒有AI語言模型?中國大陸的Deepseek用低成本做出語言模型 美國科技股嚇到皮皮挫 台灣的AI語言模型進度到哪了? --2
Re: [問卦] 有deepseek越強其實對台灣是大利多的卦?deepseek橫空出世 對台灣當然是大利多 台灣有很多號稱做AI的教授只會拿別人的模型來訓練 meta的llama釋出之前 只能在網路上找些更爛的開源model做出只會講幹話的東西1
Re: [問卦] deepseek會刺破ai泡沫嗎?不會 其實在美國 大家還巴不得有這種突破出現 2024年的AI還是在同一個transformer架構下堆料 拿更多東西訓練 真實世界沒有的拿合成的資料練 如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1 那些有十萬張的公司就能搞出更屌的東西