Re: [問卦] deepseek是騙局嗎?已經涼了?
這個真的擋不了
川普盡全力擋了
但是中國還是有其他管道偷渡
像是從馬來西亞進口之類的
此外中國還有一招直接在國外訓練
訓練完再把llm模型帶到中國
以前曾有帶硬碟入境被抓包但事實上用網路傳更快
但是現在中國也在布局ai晶片了
現在中國的ai早就霸榜ai排名
https://www.gvm.com.tw/article/123570
反觀台灣只有學術有ai能力
企業主只想賺政府標案、接民間醫美網頁這種小單
想做ai的企業只想花月薪3-4萬聘請專家連刷條碼的薪資都不如
※ 引述《notanyone (notanyone)》之銘言:
: 乳題
: 之前剛出的時候全世界驚訝
: 中國被美國禁高階晶片的情況下
: 竟然可以用那麼少的資源,
: 造出一個AI可以跟全世界頂尖企業的AI PK
: 那時候大家都在講說不用買那麼多機器了
: 只要優化算法就好
: 看樣子是個騙局嗎?
: 用一用還會卡頓
: 現在是涼了嗎?
: 為什麼現在又回到瘋狂買機器的時期啊??
: 卦?
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.216.134 (臺灣)
※ PTT 網址
推
台灣學術有ai能力?
推
把deepseek換成taiwan就對了
推
陸生求學狠如狼 台籍生看傻眼
→
新加坡也有啊 中國一堆賣算力的掮客
推
如果沒有擋現在可能是第一
→
擋不住的 他AI已經能幫你換臉換嘴型換聲音
推
中國14億人996 怎麼打= =
→
所以老黃跟馬斯克的策略是先卡位市場
推
台灣學術有AI XD 連他馬的一張卡申請半年
→
都下不來了
13
首Po乳題 之前剛出的時候全世界驚訝 中國被美國禁高階晶片的情況下 竟然可以用那麼少的資源, 造出一個AI可以跟全世界頂尖企業的AI PK9
其實他在某方面回應還是不錯啦 尤其是中文圈的知識基本上還是表現的滿強的 只是跑的真的太慢了 不過要專業用途需求就會比較少一點 但平常要回答閒聊的議題表現很好16
9月17日Deepseek登上Nature雜誌封面 裡面提到訓練成本是29.4萬美元左右 並且沒有蒸餾OpenAI 「DeepSeek-R1論文首次公開了僅靠強化學習,就能激發大模型推理能力的重要研究成果,啟發全球AI研究者;這一模型還成為全球最受歡迎的開源推理模型,Hugging Face下載量超1090萬次。此番獲得《自然》的認證,可謂是實至名歸。![Re: [問卦] deepseek是騙局嗎?已經涼了? Re: [問卦] deepseek是騙局嗎?已經涼了?](https://hao.cnyes.com/download_image.ashx?file=%2FUpload%2Fdb2596fd327e4f56940ebd884aab293d.png)
2
看青鳥隔一陣沒看到DS新聞就要跳一跳唱衰一 下的酸葡萄心理真的很趣味,好像以為阿共那 邊就只有一家DS 阿共那邊真的該注意的是阿里巴巴啦,他才是 資本支出可以跟美國那邊搞軍備的。DS比較像
餓死抬頭,阿肥外商碼農阿肥啦! Deepseek其實一直以來主打的用戶就不是對外面向全面通用型的服務公司,其實以當前純開 源讓企業用戶可以自架的模型來說,DS v3 0324還是很好用的,拿來做合成數據或是自架自 家的Agent flow都很香的,尤其是當前v3.2 Exp採用DSA架構(簡單理解就是把超長文本在 進入模型的時候直接濃縮,優勢在於這樣可以大幅減少超長文本計算量,可以把企業的上百
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
28
Re: [新聞] 歐洲企業捨棄ChatGPT了!投向DeepSeek懷deepseek最重要的就是把AI的大資本進 入障礙整個打掉了 歐洲這波因為資本支出跟不上沒錢自己 搞大模型,錯過整個AI產業。但一旦大 模型變白菜價,精簡版LLM可以直接在![Re: [新聞] 歐洲企業捨棄ChatGPT了!投向DeepSeek懷 Re: [新聞] 歐洲企業捨棄ChatGPT了!投向DeepSeek懷](https://img.youtube.com/vi/Run03PWXGBc/mqdefault.jpg)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
7
[請益] DeepSeek 會不會反加大中美 AI 差距最近中國的 AI 團隊 DeepSeek 宣布了一個大突破,透過 DualPipe、FP8 低精度計算、 通訊優化 這些技術,讓 AI 訓練的效率大幅提升,意思就是說 用比較少的 GPU 就能達 到原本需要超大量 GPU 才能完成的 AI 訓練。 表面上看起來這對中國 AI 產業是個好消息,因為 美國對中國禁售高端 GPU,中國 AI 企業的算力一直是硬傷。所以很多人說deepseek是中國彎道超車,讓中國即使不用美國高6
[問卦] 沒有言論審查的 DeepSeek R1 模型登場!沒有言論審查的 DeepSeek R1 模型登場!推理能力甚至一樣強 Perplexity AI 公布震撼消息,宣布釋出全新的「R1 1776」模型;簡而言之,它是中國 廠商所開的 DeepSeek R1 的延伸版本,但經過後訓練消除言論審查機制,能夠針對敏感 議題,例如台灣獨立提供事實回答,模型權重已上線 Hugging Face 和 Sonar API。 遵守中共規則,DeepSeek 不回答敏感言論4
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤算力愈強,模型愈強~ 就算deepseek 真的不用高階晶片就能訓練出說不弱於openAI o1 的模型, 那未來新的模型在有高階晶片的加持下, AI 不是會發展的更快、更難以想像嗎? AI 發展的更快,商用、消費用的領域愈多,對半導體的需求愈大,5
[問卦] 所以DeepSeek 是學別人AI 的AI嗎?這幾天八卦版突然有很多AI專家 那剛好問一下 這兩天看到很多人說 DeepSeek 是用蒸餾(Distillation)手法學習chatgpt的 所以訓練費才會這麼便宜3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI2
[問卦] 台灣沒有ai的前端發展是不是沒有電啊?想一想 也是真奇怪 全世界的ai工廠 ai的基礎都在台灣 而且我們跟 nvda這麼好