Re: [討論] DeepSeek開源背後的邏輯
這幾天看了一下
自己也有來用
目前強又便宜的中文LLM還真的是DeepSeek-R1
阿什麼時候台灣才有又便宜又強的中文LLM
可以免費讓台灣人用嗎?
我願意給一千億預算給中研院開發
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.42.25 (臺灣)
※ PTT 網址
→
你先給再說阿...
→
台灣歲入一直創新高,給AI一千億還好吧
噓
DeepSeek員工是先開發完才拿到薪水?
推
點麵線AI屌打滴細
推
去問唐鳳
推
叫立法院發預算啊
推
立法院決定把預算砍剩1元
推
問題在於你有一千億嗎?
爆
[問卦] 中研院自己做的大型語言模型怎麼了?中研院最近發布了他們自己開發的LLM 說是在處理繁體中文的任務上表現優異 可是小妹看了一下跑出來的成果![[問卦] 中研院自己做的大型語言模型怎麼了? [問卦] 中研院自己做的大型語言模型怎麼了?](https://i.imgur.com/I1zNnIab.png)
32
Re: [爆卦] 唐鳳成功繞過DeepSeek不是耶 台灣人真的超級可憐 Deepseek強 是技術上強 用更低的成本達到一樣的效果 一般人看到是中國做的 去問敏感話題正常到不行![Re: [爆卦] 唐鳳成功繞過DeepSeek Re: [爆卦] 唐鳳成功繞過DeepSeek](https://i.imgur.com/eXxznq3b.jpeg)
14
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我比較好奇closeai怎麼證明對方有抄? 現在llm訓練出來的model都是黑盒子,沒人看的懂裡面結構 deepseek給closeai能拿來指控的只有他公開的原始碼和論文 這二個說是抄,那第一天就被抓出來了,還需要closeai出來吵? 至於有人說這個是證據的![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/A0TL3C8b.jpeg)
10
Re: [黑特] 唐鳳讓DeepSeek乖乖說出天安門事件滿好笑的 DeepSeek本來就是開源的LLM 任何能都能運用他的model自己改好嗎 本來就是讓你任意取用的 主打就是便宜![Re: [黑特] 唐鳳讓DeepSeek乖乖說出天安門事件 Re: [黑特] 唐鳳讓DeepSeek乖乖說出天安門事件](https://i.imgur.com/Q7fknL5b.jpeg)
X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。![Re: [爆卦] 中央研究院詞庫小組大型語言模型 Re: [爆卦] 中央研究院詞庫小組大型語言模型](https://llama-chat-4fcmny015-replicate.vercel.app/opengraph-image.png?0806238e04f3e3af)
4
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://observer.com/wp-content/uploads/sites/2/2025/01/GettyImages-1540568234.jpg?quality=80)
3
[問卦] meta、mistral接下來怎麼辦?Deepseek, Meta , Mistral 目前的開源AI LLM三本柱DMM 而且還分別代表美、歐、中三地的開源ai領頭羊 目前焦點都在deepseek了 mistral接下來想要擴點亞洲4
Re: [問卦] deepseek公布成本開源?大家一起撈不跟我想像的一樣,畢竟發佈DS這個LLM,而且公開的串接費用又那麼便宜,又開源 看不出做出這個大模型對於這間公司到底有什麼營利的機會。 強調開源跟訓練成本快速跟低廉,就是刻意針對那些已經花了大錢買硬體的AI巨頭![Re: [問卦] deepseek公布成本開源?大家一起撈不 Re: [問卦] deepseek公布成本開源?大家一起撈不](https://i.imgur.com/yf757exb.jpg)
[問卦] 台灣本土化LLM是不是騙局??完整的LLM訓練成本極高 可能一次就要兩百萬美金 如果本土化LLM因預算限制只進行fine tune調整 因為pre trained內容以英文為主 處理中文效率差很多