Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭
※ 引述 《Yirgacheffe》 之銘言:
: 3.完整新聞標題: 專訪杜奕瑾:DeepSeek被炒作過頭
: 4.完整新聞內文: https://www.youtube.com/watch?v=5bgeHE3rI8M
阿肥外商碼農阿肥啦!
這幾天都在休假陪老婆本來懶得說什麼,但這咖就沒什麼料,還覺得自己是專家。
Deepseek R1真正的貢獻就是在方法論上證明讓大語言模型直接走真正的RL去鼓勵模型生成思考鏈的格式以及讓模型去想更久就會出現語言模型的啊哈時刻(AHA moment),而且是無論模型的大小只要強化學習給模型指導規則讓AI模型持續接受指導跟環境學習模型就會在某個時間點突然頓悟。
過去半年不管是學界或是業界其實都被OpenAI的o1閉源(連方法論都閉源)嘗試了不少需要消耗大量人工的方法,其實就是TTT那套PRM(過程獎勵模型)需要大量人工去撰寫人類思考過程的標註數據,這東西業界學界也沒幾個團隊弄得出來,畢竟人類思考過程每個人都不一樣。同樣是1+1可以用很多種過程方法找到2的答案。而Deepseek R1直接開源方法論告訴你讓AI自己頓悟就好了,這跟當年的Alpha Zero讓AI自己左右互搏有異曲同工之妙,就某些人眼瞎覺得貢獻很小。
當前UC Berkeley 還有史丹佛李飛飛的團隊都成功復現DeepSeek r1的成果,李飛飛團隊還證明了只要1000個文檔16張H100 26分鐘就可以讓32B的千問模型出現啊哈時刻。
只能說眼界狹隘的人看什麼都蠻可撥的。
--
講那麼多還不是被一些國家禁用
不能問六四的ai應該禁掉
看來眼界最高的都在八卦版
你不用就能阻止對方變強嗎 笑死
義大利、美國、澳洲、日本都眼界狹隘
就你看的最遠XD
AI頓悟了是不是有意識了???
而且比較笨的AI多想幾次就懂了
被禁用是國安問題,倒不是DS很爛就是了
代表三個臭皮匠也能勝過諸葛亮?
看來算力根本不重要
就被黨餵食到沒有辨識的能力,只好說
對手被誇大是廢物。畢竟拿了黨這麼多
錢是不能客觀地說中國的東西好。
今天就有老外在講DS的啊哈時刻 DS從學
所以那些禁用的能用chatgpt 嗎
習中自我進化了
天才IT大臣: 我成功讓它回答64問題。
s1跟r1基本上還是不同,budget forcing
是個非常有用的方法
醒醒吧,沒料但開公司拿標案 ,$成就99%
碼農望塵莫及,人要往$看啊
爆
我看推文裡 有一個標案 給了杜 9000萬 就很好奇是什麼計畫 能給到9000萬 這不可思議的數字 然後 查到後面 你會被氣死,你的納稅錢就這麼被它浪費掉了![Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭 Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭](https://i.imgur.com/iK9CFVVb.jpg)
16
不知道 總是覺得這個人 不是什麼神仙 就是離神仙界 也很遠 哥幾十年前開始用撥接打bbs的時候 根本沒有人會把架站站長當做神 因為不要說大學 一堆高中都有自己的站![Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭 Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭](https://i.imgur.com/NHIUVg9b.jpg)
6
兩個原因啦。 一個是後期,各連線站廣告一堆,這個也不是自己的站擋得住, 只要有參與伺服器轉信,紫色花園pc-game版發的文,就會轉到不良牛的pc-game。 最早轉信站是為了讓不同bbs的人也都能一起討論。 但最後廣告信比討論文更多。95
剛臉書滑到 有記者發現 杜9000萬的計畫 臉書官網居然刪了 真的是錢拿到就跑嗎![Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭 Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭](https://i.imgur.com/R6bv9Iqb.jpg)
2
杜其實滿low的,你看他之前拿AI去分析什麼八卦版協同帳號 連哈哈 笑死這種東西都拿來講,你就知道這人格局有多低 終國弄AI的至少還能搞Deepseek出來,台灣只有硬體台積電能拿來說嘴 號稱資訊大師的整天在臉書抓PTT帳號 不是說不能做,而是這種很low的工作一般都是側翼這種下等網軍在弄3
這個去年就關閉了才對 去年10月黃國昌就有在交通委員會質詢過這個9000萬傻B計畫 當時就裝死不回應秒關臉書跟IG了 不會是風頭過後偷偷打開然後又關吧4
老實講真正軟體九千萬的確是不多拉 但是9000萬一個盜皮的網站多不多見人見智了 再來就是政府軟體標案九千萬多還是不多 有做過的都知道這數字跟天價一樣 之前教育部一堆標案 要負責買平板還要網路建置 還要教學軟體 有一千萬大家都搶破頭了 還九千萬勒 顆顆 所以沒一家撐得住的 所以在台灣要政府標案生存的 就是靠關係才有辦法1
以前的政府貪..喜歡放煙火.. 因為打上去噴一噴..結束了死無對證..多少錢隨便你報.. 現在的政府貪..都直接數位化.. 做個網頁做個APP..幾千萬幾億的在花... 結束了..一樣什麼屁都沒有..11
2021年就被高虹安質疑過了 「今天如果是用9000萬元的預算,來進行一個VR網站的 建置,那我們不禁還是要問這個預算來源為什麼是從 我們的紓困特別預算?大家都知道紓困特別預算目前![Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭 Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭](https://img.youtube.com/vi/EJ25zqrf39g/mqdefault.jpg)
9000萬有很多嗎? 小草都這麼窮? 杜亦僅什麼人物你知道嗎?台灣人工智慧的發展都是他在推動的,如果在矽谷,他照樣也 能拿9000萬,而且是美金 他之前利用AI偵破協同帳號,大破藍白網軍,我就知道中國一定會把他視為眼睛釘;如今 又一嘴拆穿deepseek的假面具,又一次保護了台灣
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
爆
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據以下部分資訊來自於Reddit anitakirkovska文章的翻譯 LDPC哥哥講到一個重點 Reinforcement Learning =/= Reinforcement Learning from Human Feedback 這也是R1為什麼爆紅的原因![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/lunsvb2b.jpg)
爆
[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G標題: DeepSeek R1 is now available on Azure AI Foundry and GitHub DeepSeek R1 現已在 Azure AI Foundry 和 GitHub 上提供。 來源: 微軟 Azure 官方 Blog![[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G [情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G](https://i.imgur.com/Mn5ppb7b.png)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
16
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據現在全網路上的開源數據資料是屬於pre-training端 大多都是野生數據 無標籤 那東西只是讓模型去向鸚鵡一樣 去做文字接龍 但第二階段訓練會用到RLHF (Reinforcement Learning from Human Feedback) 就是要人類針對不同數據給意見 這個是要給標籤 所以你才會聽到狗家之前要求全公司員工去給意見讓Gemini前身 Bard 去做人類feedback![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://huggingface.co/blog/assets/open-r1/thumbnails.png)
6
Re: [問卦] DeepSeek怎麼一天就走下神壇?專業一句話就是 R1是一個"方法論"而不是模型 v3是新模型範式的概念驗證 建議先去看 LATS 或 ANPL 比較好理解什麼叫"方法論" 先講v3價值:打破了以往單一模型走scaling law 成本是近似指數或n^2誇張上升 原本AI能力要變強 原本是要暴脹式的砸錢 軍備競賽般的資本競賽 v3 open的paper說明了 用成千上百個小model集合也能做出類似效果 不用被大n懲罰1
[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣剛看了DeepSeek R1原始文件 Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv preprint arXiv:2501.12948. 看完結論就是![[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣 [問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣](https://i.imgur.com/jY9j0u3b.jpg)
3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI1
[討論] 所以可以開吹Deepseek了嗎?微軟Ai副總: DeepSeek R1 is now available in the model catalog on Azure AI Foundry and GitHub, joining a diverse portfolio of over 1,800 models, including frontier, open-source, industry-specific, and task-based AI models. As part of Azure AI Foundry, DeepSeek R1 is accessible on a trusted, scalable, and![[討論] 所以可以開吹Deepseek了嗎? [討論] 所以可以開吹Deepseek了嗎?](https://i.imgur.com/YdMmsJwb.jpeg)