Re: [問卦] DeepSeek怎麼一天就走下神壇?
※ 引述《tim790809 (scheduling)》之銘言:
: 所以DS到底是屌不屌啊?
: 有沒有專業一句話說明??
專業一句話就是 R1是一個"方法論"而不是模型 v3是新模型範式的概念驗證
建議先去看 LATS 或 ANPL 比較好理解什麼叫"方法論"
先講v3價值:打破了以往單一模型走scaling law 成本是近似指數或n^2誇張上升
原本AI能力要變強 原本是要暴脹式的砸錢 軍備競賽般的資本競賽
v3 open的paper說明了 用成千上百個小model集合也能做出類似效果 不用被大n懲罰
回來講R1 舉例來說 可以先看ANPL原理
ANPL讓AI變強做法是讓AI先拆解問題 再逐步解決 類似"Let's think step by step"
之前要讓LLM做深度思考一律都是COT
比如把每次LLM的輸入輸出當作一個節點
把多個節點做評分 最終選擇整條鏈評分最高的項目 即MCTS概念
這就像是alphago那樣 每次棋步後面都要估算後面幾十步對於這步的總評分(勝率)
LATS就是用LangGraph去實現MCTS的COT 這是方法論 所以可以套用任何LLM
你替換任何LLM LATS都能提升輸出成果
GPT-o1(原q* project)採用人工先寫好大量的推論步驟去保證COT品質
並非直接讓AI去隨意生成許多條節點再自我評分 而是人工先標註什麼是好推論
因此人工撰寫教科書等級的推論就是o1高成本最主要的因素
(這也是CloseAI藏起來的主因 這個很貴不能給其他人看到XD)
就像alphago master需要挖出所有頂尖對局棋譜然後數位化
R1則是捨棄了節點拆步驟思維 直接讓LLM去隨意探索可能方式
在這個情況下R1反而做出了各種有創意的推論方式
就像是alphago zero 自行探索反而下出自己一套邏輯
如同LATS可以替換任何的LLM R1也可以使用任何的LLM去做這件事
實驗室復現R1是指拿一個LLM 做這個方法論 看可以拿到AI怎麼做推論過程
復現的結論也高度一致 使用越優秀的LLM當作基底 可以拿到更好的推論過程
所以任何LLM都可以做R1 就跟任何LLM都可以套LATS類似
因此
在那邊說不能回答64 就是根本不懂R1
你拿任何可以回答64的LLM套用R1的方法論 就拿到可以回答64的AI了
今天就算有人把中國從地球上移除 下一個人也可以做出v3和r1
--
分析一下台灣的ai lab
方法不同
下一位
挺誰直接說。
我挺open source 誰open我挺誰 meta open llama 挺 v3 r1 open 挺 google open 挺 x.ai 唬爛的假公開 thumb down CloseAI閉源thumb down
※ 編輯: KanzakiHAria (36.231.98.6 臺灣), 01/29/2025 23:11:54其實就是監督式和強化式學習的原理
講得剎有其事 其實是在唬爛
這篇是廢文嗎?
青鳥看不懂論文很氣喔
※ 編輯: KanzakiHAria (36.231.98.6 臺灣), 01/29/2025 23:27:42好了啦
那DS怎麼不用中國國產的AI模型來作結
論 ?
deekseek不會威脅美國Ai工業
deepseek的優化原理減少訓練成本能否複製
才是讓NVDA一天跌17%的關鍵 美國人懂
應該說 華爾街的恐慌是這個
DS這次重點是RL方法論
有什麼AI能用當然就用什麼 都能用
感謝專業回覆
推專業 義和團實在太多了
中共同路人 吊死你
爆
首Po耶~不是... 禮拜一造成全球股價大崩盤 APP、Android排行第一的軟體 八卦捧到爆的AI 阿怎麼才過1天多8個小時就瞬間被戳破?2
中國出品 謊言保證 但就是有一群領著PRC祖國之中華民國護照 還要幫叛國的PRC說話 為我國政治軍事上的敵人胭脂抹粉 這就是我中華民國要去打台灣內部的吃裡扒外的內應 給PRC看 看看中國政府在我國境內養的甚麼樣的對我國不忠誠的人1
笑死 唐鳳的作為不就證明了deepseek 是真的ai 如果是人為的 不就自動屏蔽了 可能硬體設備不足 可能運用還待證明 更可能被美國陣營全面打壓7
走下神壇? deepseek開源開出了一整片神國 你要他走下什麼東西? 這東西對台灣最大的意義5
幾個月前剛好看到youtuber在講解FPV無人機的發展史 是如何從一群玩家手中的玩具發展成為戰場上的大殺器 裡面有提到一個關鍵在於 FPV無人機一開始的發展是開放開源
35
Re: [請益] AI到底是遇到什麼問題?技術跟應用場景的問題我不談,之前的人已經談過了,大致上沒有問題。 不同領域的人可能體驗不太一樣,但LLM普及的程度並沒有這麼低,具體而言,主要是 ChatGPT ,在部分領域已經是不可或缺的必要工具,到了掛掉會影響到正常工作或不能工作的程度。 首先是 coding,就我而言,至少有50%的程式碼已經是由 ChatGPT 完成的,遇到 bug 我幾乎沒有再用 Google 或是 stackoverflow ,log 直接丟進 ChatGPT , 大部分情況下它都能大幅減少我的工作時間。 除了遇到有關於 pydantic 的問題,因為這個 module 最近出了V2,模型的回答經常會混合V1的答案,而且傻傻分不清楚,在之前舊的沒有納入 pydantic 的版本時,這問題更為嚴重,必須要自己先提供文件用RAG 讓它知道。 但是就我實際的觀察周邊的人,發現LLM 對於低階的工程師,高階的工程師的幫助個別顯著,但是對於中階工程師而且有使用上的困難。29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了10
Re: [討論] OpenAI GPT o1模型阿肥外商碼農阿肥啦! 目前技術太多都說得太雲裡霧裡,但是截至目前為止針對o1其實OpenAI透露出來的技術細 節都不如過往得多,像之前GPT-4跟GPT-3.5過往還有完整的文件跟引用可以窺探,所以就 不做過份的臆測了。 以目前的一些文件上有提到的可以確定這次o1使用了CoT這絕對是一個Agent沒錯(跟過往10
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不解決幻覺,不一定要從LLM解, 而是靠系統架構解。 例如,做一個問答系統,很多人減少幻覺是這樣做的: 0. 預先整理好QA問答資料集 (人工整理,或機器輔助整理)8
Re: [新聞]不,你無法用 600 萬美元複製一個 DeepSee呃,這新聞是哪個平行時空新聞,當前一堆美國大學實驗室都已經成功用其他小型模型像ll ama或Qwen 復刻R1實驗了,而且也事實證明模型只要有辦法再訓練的時候盡可能要求模型更 長更多輪的思考時間那就必然會讓模型依據上下文湧現出推理能力。無論模型大小或是否用 deepseek的模型架構。 一堆知名的框架也開始嘗試復刻開源版的R1 Code,我覺得R1幾個比較可行的思路就是改用6
Re: [問卦] DeepSeek問世會讓顯卡降價嗎顯卡一定會漲價 目前己經有很多deepseek布署在本機電腦的教學 ollama上也有deepseek R1模型可以下載 deepseek R1模型各參數量對顯卡記憶體需求2
Re: [問卦] AI產生意識並且洗腦控制人類行為怎解?以目前 AI 能做的事情,還很遠 當然不排除未來可以,但是至少是現在不行 現在連 AGI (通用人工智慧) 都很難 目前不管是生圖的 AI 或是大語言模型(LLM)的 AI 本質上都是猜,只是這個猜的過程可以從模型輔助讓猜這件事猜的更準X
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習- 講一些自身經驗好了 自從AI領域在生成式題材大火後 全世界就進入到AI軍備競賽 所有的AI基礎研究都是以週甚至日為單位在迭代 舉個例子 當年Robert G. Gallager 在1960提出類神經網路的LDPC code到2004年才大放異彩 無限接近shannon bound 光這個演進就花了40年 對照這幾年的AI科技樹發展 根本就是指數在成長
爆
Re: [新聞] 愛莉莎莎「IG臉書聲援柯文哲」 轉發1文喊拜託:這是人92
[問卦] 現在戒嚴跟民主不衝突了?77
[問卦] 現在不能…反對戒嚴?22
[問卦] 沒人發現一個國家不想追求和平很詭異嗎!21
[問卦] 遷居桃園第一個要注意的是什麼?96
[問卦] 陸委會:八炯說快點打 是反串 什麼意思12
[問卦] 如果查族譜發現祖先是中國人怎麼辦26
Re: [新聞] 獨家/雙和醫院保全嗆「不搞政治」驅趕罷15
[問卦] 韓國人怎那麼愛自殺88
[問卦] 在科技業會啥英文單字最屌22
[問卦] 資深藝人裡面 你最喜歡誰?12
[問卦] 會用餐具吃餅乾的人多嗎?16
Re: [新聞] 柯文哲血尿嚴重前天戒護就醫! 北所:目5
[問卦] 白色恐怖的受害者現在在想什麼?8
[問卦] 桃園跳電???8
[問卦] 一個月存30000,算及格嗎= =....?4
[問卦] 外國年輕妹妹想來找我住,合理嗎?8
[問卦] 有辦法下毒半年 神不知鬼不覺殺人嗎5
Re: [新聞] 「堂堂正正的中國人」 區桂芝親上火線19
[問卦] 高雄大樹有什麼好吃的嗎?9
[問卦] 為啥現在的人寧願衝突也不忍?8
[問卦] 戒嚴可以出國嗎?22
[問卦] 認真問!4大AI有融入你的生活嗎?3
[問卦] 體重破百還要吃宵夜嗎?8
[問卦] 憂鬱症海鮮素阿滴為什麽要霸凌鍾明軒6
[問卦] 沒人發現家教時薪太高了嗎?7
[問卦] 韓國的姓氏7
[問卦] 小豆島旅遊行程請益33
[問卦] 現在的中國能抵擋八國聯軍嗎?6
[問卦] 下禮拜沒有母雞卡可以看了怎麼辦