[問卦] Deepseek又推出一個開源的多模態模型
NEW Deepseek-Janus-Pro-7B Update is INSANE! (FREE!)
https://youtu.be/6V2qRNZ-qeg?si=CN1qaoC1OhubxK0s
這個影片直接比較新模型跟OpenAI在多模態上的能力比較
更重要的是這個模型一樣是開源的,下面是官網可以直接試用
這次AI界也太多新年大禮包了吧
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.232.109.183 (臺灣)
※ PTT 網址
※ 編輯: purplvampire (118.232.109.183 臺灣), 01/29/2025 13:19:48
→
你腿了
→
昨天的事情
推
不小心看成 多變態模型
→
樓下傻鳥繼續扯64
推
台灣愚民又要測試政治問題了XD
推
旋律又可以破解了
推
不去研究開發概念跟科學基礎,在那
→
不少圈內人說,這次DS源代碼真的很有料
推
邊測試智障話題
噓
源代碼 你是哪一圈的圈內人?
推
藍白興奮的樣子就像是自己的親兒子
→
一樣
→
旋律該你上場了
推
往死裡打 請關懷身邊小鳥的心理狀態
→
有料是有料 不過底層是用臉書開源跟
→
阿里下去改 要說強大還早的很 越燒米
→
國阿爸下手狠
→
別說了 年後開盤一堆人直接GG
噓
昨天凌晨就出了,用起來很爛不用怕
→
Meta的Liama3.2目前還是開源多模態最強
→
。這個Janus pro不成氣候
→
連台灣自己搞不出來也一堆用llama下去
→
改
→
沒料 國中科展砸錢請研究生寫的
推
你腿了,鴿子封包?
→
開源的美國阿爸下什麼手,
29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://i.imgur.com/vA7ifFRb.jpeg)
27
[問卦] DeepSeek剛剛發布新款開源AI模型圖像生成模型Janus-Pro 在 GenEval 和 DPG-Bench 基準測試中打敗 OpenAI 的 DALL-E 3 和 Stable Diffusion? 請問中國人不過年嗎? 半夜放新模型是不是想炒美股?![[問卦] DeepSeek剛剛發布新款開源AI模型 [問卦] DeepSeek剛剛發布新款開源AI模型](https://cimg.cnyes.cool/prod/news/5847178/m/5ddbd59484861b45ae070a3a996bf42c.jpg)
20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普9
[問卦] 要收費的OpenAI是不是完蛋了感覺美國的這些AI公司都講好了 開源的模型不能超越閉源的 很明顯這些開源的大公司有在禮讓 不能把別人的飯碗全部端走 讓OpenAI這個閉源的可以繼續撈![[問卦] 要收費的OpenAI是不是完蛋了 [問卦] 要收費的OpenAI是不是完蛋了](https://i.imgur.com/Xf1S6o8b.jpg)
7
Re: [討論] 台灣為什麼搞不出DeepSeek?LibSVM早就是上古以前的東西了,現在做分類大家也都說拿好的backbone基礎大模型再接一 層硬train一個baseline了,像Meta、谷歌這些基礎模型再預訓練的時候就想盡辦法拿到一 堆沒看過的數據語料圖片設法先讓模型從複雜數據中學會抽基礎特徵,這樣後續你做分類根 本不需要做什麼kernel function 就有能力擬合任意函數。如果你發只是純SVM的東西到現 在ICCV等應用類的頂會只是刷分大概會被直接reject到爆,沒跟這些基礎大模型比根本沒插8
[問卦] 如何利用deepseek開源模型 建構台灣AI聽說 deepseek-R1 是目前開源AI模型第一名 我有一個大膽的想法 既然這個模型是開源的 我們可以使用這個模型來建構台灣的 openAI 擺脫對美國AI大廠的依賴 是不是很聰明啊?9
Re: [新聞] DeepSeek凌晨發布新款開源AI模型!Janus這個DeepSeeK真的有那麼厲害嗎? 不是說為了政治正確 很多東西都屏蔽掉 就算是真的贏過OpenAI 那也只是贏過美國而已 但是全世界都知道1
關於 deepseek-ai/Janus-Pro-7B/ 文生圖當地時間1月27日, DeepSeek團隊正式發佈兩款多模態框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款統一多模態理解與生成的創新框架, 通過解耦視覺編碼的方式,極大提升了模型在不同任務中的適配性與性能。 JanusFlow是一款通過生成流(Rectified Flow)與自回歸語言模型融合實現 統一的框架。它不僅在理解任務中表現優異,還能生成高品質圖像,展現了框架
X
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習
Re: [閒聊] Deepseek的角色扮演Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1