Re: [閒聊] DeepSeek是不是真的很強?
本來沒有很關注這件事,但昨天跟朋友聊到,覺得很好奇就查了一下,也看了一下評論留言
我現在只有一個問題,不好意思可能我查得不夠徹底,但我沒看到很明確的答覆,所以只好來問了
到底可不可以色色?
既然他是開源的,把他載到本地電腦能不能自己用聊天或者別的方式,訓練他突破任何規則?不管是什麼中國審查規則還是西方各種政治正確規則
隨便假設,假設而已喔,一個負責「特定功能」的npc?成本會很高嗎?
純粹為了研究用途,有沒有AI大佬可以解惑一下?
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.90.104 (臺灣)
※ PTT 網址
推
你可以想辦法繞過去
→
都有人可以繞過去讓AI大談8964之類的了
推
你這段直接拿取問deepseek就可以了
推
蒸餾過的小模型可以 完整版6xxB的不知道 應該也行吧
→
然後"成本"是指? 錢 還是說硬體需求?
推
即使是現有的模型你咒語夠長都可以繞,因為這些回應限
→
制並不是真的寫死哪些不能講,是靠ai自己判斷是不是屬
→
於違禁詞
推
接進酒館用角色卡就隨便色了 AI色色早就玩到爛
推
你這個問題去裏恰搜就很多串了
→
東西一直都有 怎麼叫出來就看本事了
→
可以色色啊,問題他色起來又不如C3.5s
推
色起來可以,但無法直接的描寫,他會用藝術的方式和你
→
說
→
像小書痴那種貴族語的藝術化說法嗎?
推
可以吧,去載別人改過的ablated版本
→
deepseek-r1-qwen-2.5-32B-ablated
推
個人測試以llama為基礎蒸餾的寫色會比qwen的更直接
→
鄉民可以自己抓下來玩玩阿 我GitCopilot用了很久 昨天第一
→
次本地架ollama 簡單到嚇人 筆電7940HS+7600S(8G)+64G 可以
→
跑DS-14B蒸餾模型 就是速度...能跑就好
推
因為14B顯卡要12G以上才有機會用GPU加速 速度自然感人
推
還真的有色色版本
→
rated
推
我也覺得deepseek色色沒有其他家強
9
首Po我讓他續寫手塚火鳥的未完成篇章 也就是近現代篇 結果還滿有模有樣 優化一下就是三個阿道夫等級作品 以後是不是人人都能創作了? ------------------------- 手塚治虫未完成的《火之鳥·近現代篇》被普遍认为是他最神秘的遺憾。根據手塚工作室爆
結果今天就被踢爆是中國大外宣了 研究機構:DeepSeek硬體GPU支出逾160億台幣 SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」(DeepSeek)以推動AI技術研發,在此之前,幻方量化於2021年,也就是任何出口管制生效前,投資購買了1萬顆輝達(Nvidia)A100 GPU。 報告指出,該公司在GPU的投資上花費超過5億美元。![Re: [閒聊] DeepSeek是不是真的很強? Re: [閒聊] DeepSeek是不是真的很強?](https://www.cna.com.tw/img/pic_fb.jpg)
10
話說 我讓deepseek寫些色色的東西啊(讓他幫我寫些色色遊戲設定) 他現在大約寫完後會延遲十秒才收回去(如果他願意寫的話) 這是故意留給我時間讓我趕快複製貼上嗎 怎麼這麼貼心![Re: [閒聊] DeepSeek是不是真的很強? Re: [閒聊] DeepSeek是不是真的很強?](https://i.imgur.com/Ut8LL0ob.jpeg)
6
老哥 雖然中國真的很常唬爛 但也不能沒搞清楚就亂吐槽 反而自曝無知= = AI模型只要訓練一次(花幾天~幾個月)就能一直用![Re: [閒聊] DeepSeek是不是真的很強? Re: [閒聊] DeepSeek是不是真的很強?](https://www.cna.com.tw/img/pic_fb.jpg)
3
是這樣的 美國人做事比較喜歡用正攻法 他們就很要求任何技術都要「科學」 你這麼做,你要拿出證據、拿出理論依據 不只要證明他真的會更好,還要說明他為什麼會更好40
這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低11
假如以網路遊戲來類比,輝達就是遊戲的開發商與營運,其他開發AI的科技巨頭就是遊戲玩家 DeepSeek 則是一個發現了快速練等技巧的玩家。原本幾百小時才能練滿一個帳號,現在DeepSeek 找出了幾十個小時就能練滿的方法。 因為是快速練等,所以裝備可能還是跟不上那些扎實練功的科技巨頭玩家。但是可以縮減大量的遊戲時數,所以其他玩家也紛紛跟進,畢竟練滿角色可以少花幾張點數卡,看起來遊戲公司可能會陷入經營危機。 不過由於遊戲的內容實在太豐富,大家都想多練幾個帳號來玩,長久來看玩家們還是會繼續買點數卡挹注遊戲公司營收。 以現實人物來比喻的話,輝達是經營天堂的遊戲橘子,DeepSeek是找出一堆遊戲秘技的四叉貓11
: : 稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs : 來做測試資料集 : : 看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係![Re: [閒聊] DeepSeek是不是真的很強? Re: [閒聊] DeepSeek是不是真的很強?](https://i.imgur.com/OgkvURxb.png)
1
我的理解是 原本一份專業的工作只有研究生以上的人能處理 後來產業升級後變成高職就能身任 雖然還是可以繼續雇研究生 但是慣老闆愛省錢的結果肯定誰便宜用誰69
說回來 感覺很多人很氣訓練用別人資源 但是感覺又對openAI沒反應 我覺得這就很奇怪 因為OpenAI最知名的一個點
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)![[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂 [爆卦] 數發部次長造謠Deepseek成本不只550萬鎂](https://i.imgur.com/jmMt7gnb.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
34
[討論] 各國際媒體紛紛報導DeepSeek內建自我審查今天有許多國際主要媒體紛紛報導DeepSeek內建自我審查。 彭博社 how-does-china-s-ai-model-compare-to-openai-meta![[討論] 各國際媒體紛紛報導DeepSeek內建自我審查 [討論] 各國際媒體紛紛報導DeepSeek內建自我審查](https://assets.bwbx.io/images/users/iqjWHBFdfxIU/i47c_uxu63zM/v1/1200x802.jpg)
14
[問卦] 大陸已經在AI領域完全超車了吧?大陸自主研發的開源AI DeepSeek 不管是對硬體需求更低的高運算力或是訓練模式, 都吊打洋鬼子的OpenAI 現在連美國的研究人員都要改用DeepSeek來發展AI了 大陸用不到兩年的時間就直接幹爆洋人![[問卦] 大陸已經在AI領域完全超車了吧? [問卦] 大陸已經在AI領域完全超車了吧?](https://i.imgur.com/ytoXu5Hb.jpeg)
6
Re: [問卦] Deepseek出現 一堆人放錯重點吧: : 2.言論審查: : 一樣問題,人家都直接開源釋出了,他的公版有自己喜好,想穿這個skin 搭配這個背景 : 練習 : 這個職業是他的事=>3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AIX
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習
[閒聊] ai好像都變成用來給程序員問代碼用聽說deepseek v3這東西比別人開發的成本低很多 1.2000 顯示卡訓練 2.成本比他牌低數百倍 完全開源 但我不太明白於是想找看看相關影片說說![[閒聊] ai好像都變成用來給程序員問代碼用 [閒聊] ai好像都變成用來給程序員問代碼用](https://img.youtube.com/vi/BnoMTeKxwBQ/mqdefault.jpg)
1
Re: [閒聊] DeepSeek是不是真的很強?真要說的話,OPEN AI盜用個人創作者的作品來訓練,這個直觀上就是侵權了。 反而是AI生成的內容已經被美國法院判定沒有著作權,從這個意義上說,用“AI生成的內 容”來訓練自己的model反而不構成侵權。 另外,著作權在法律上還有一個豁免,就是為了公共利益的合理使用,比如新聞媒體在報 道時的合理使用。Deepseek是開源且免費,它甚至可以主張使用OPEN AI訓練是符合公共