Re: [討論] 廖先翔:為什麼禁deepseek不禁google fb?
→ EvilSD: 因為地端版不用聯網呀 就是在local端設置 114.137.249.234 03/13 13:58推 lookjason: 台灣第一瞎立委 腦袋都是支那的形狀 42.74.117.213 03/13 13:58→ EvilSD: 看來只剩廖有唸書 樓上的大多都不懂吧 114.137.249.234 03/13 13:59這樣就叫做有讀書?太好笑了,來我就只
講一個最簡單的邏輯,所謂地端版講白話
一點就是離線使用啦,那我問你啦,你只
要一連線,難道他就「一定」不會回傳資
料到中國的資料庫嗎?放屁
----------------------------------------------
其實我很少發文的,但看到這個有點蝦
deepseek是開源軟體
歡迎你去找哪一行在地端版會回傳資料到中國
找到了PO上來給大家看看,順便發論文新聞警告全世界
那為什麼現在很多人都用DS
就是因為是目前最強的開源LLM模型呀
就不需要付費給OpenAI,只有要硬體設備就能本地部屬
之前大家都用Meta的llama,但地端版能夠執行的小尺寸版本效果都太差
現在DS出來,就直接有接近OpenAI最新模型的能力,還開源所以可以放地端
我從一開始用OpenAI 到 Meta llama,以及現在的DS(其他就不說了)
也部屬建立過離線(地端)與連線型(OpenAI)應用
歡迎你去找哪一行程式碼,哪一個封包會外傳
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.77.153 (臺灣)
※ PTT 網址
40
Re: [閒聊] DeepSeek是不是真的很強?這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普18
Re: [問卦] DeepSeek成本這麽低的原因是啥?因為DeepSeek本質上是優化,而不是從頭幹一個LLM。 他是拿Meta的開源模型當基底,然後用OpenAI去產訓練資料, 再加上創新的Fine Tuning技巧去進行優化的, 並不是真的用5%的成本跟算力就可以完成OpenAI走過的路徑。 的確DeepSeek(以及近期中國各家公司爭先恐後發表的模型)模型上提出了創新的方法12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,8
Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對openai只有開源好幾年前的模型 現在meta google m$ 的開源模型都屌打好幾條街了 用過deepseek的人都知道,deepseek是蒸餾上面那幾個開源模型 況且deepseek也有把自己的模型和程式碼都公布出來 開源的精神不就是這樣嗎?6
[轉錄] 事實盛於雄辯:廖先翔質詢DeepSeek逐字1.轉錄網址︰ ※ 請附上有效原文連結或短網址 ※ 2.轉錄來源︰ ※ 推特/FB 須為 FB人物名稱、FB粉絲團名稱 ※6
Re: [問卦] DeepSeek是真貨,版圖會不會大改?Deepseek真正改變的是讓開源生態系注入了新的活水,過去半年其實大家都是被OpenAI的生 態系越玩越死,新創很怕自己做出的服務馬上就被閉源的chatGPT直接取代,然後要做出服 務還要付出大筆服務費,要自己搭還需要大量計算能力。 但DeepSeek R1直接告訴你要讓語言模型有推理能力根本不需要真的做大,要訓練推理能力 也不需要讓人去轉出人類的思考過程(TTT模式),直接拿好的基礎我們去蒸餾再去給他環4
[問卦] openai google meta也抄來抄去怎不吵?現在出現一堆陰謀論和梗圖在吵deepseek抄襲 怪了 當初各家AI不就是互抄 怎不見網路上這麼嘲諷? 整個gpt起點來自於google的transformer 然後堆疊算力 google可以笑所有人抄作業 所有人都走pre-trained transformer meta llama, google gemini, ms phi 經典的國外一開源國內就自研 llama一公開就有千問和零一萬物
Re: [閒聊] Deepseek的角色扮演Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1