Re: [新聞] 日本AI研究第一人這樣評價Deepseek
https://i.imgur.com/Y6gj6VU.jpeg
我不懂ai
想問從無到有都自己做的話
那紅框裡的文字是正常的嗎?
deepseek說自己是基於gpt 3.5或gpt 4的架構,並且核心模型是gpt 3.5/4
gpt3.5/4是openai的商品
請問這樣他是蒸餾opanai的開源還是自己從無到有開發的?
※ 引述《enunion (回來囉)》之銘言:
: 三民治以及蟾蜍網紅
: 很喜歡用北一女筆記這個比喻去打DS
: 應該是當時候收錢
: 給的文案就是這樣寫的吧
: 但是對AI有一點概念的人
: 看了真的覺得在瞧不起人民智商
: 根本是在亂噴
: 對AI有興趣的
: 強烈推薦台大李宏毅老師的頻道
: https://youtu.be/cCpErV7To2o?si=fhemvtkydilYOMwt
: AI的成形分三階段
: 比較好的比喻是
: 第一階段是生一個小朋友(pretrain)
: 第二階段是讓他學校上課學習(督導式學習)
: 第三階段則是對這位小朋友的回答提供反饋(RLHF), 告訴他哪一個回答比較好
: 很明顯第一步要生出小朋友是比較困難的
: 要花很多的資源去train一個模型
: 打造他的樣子 捏他的臉型 膚色 外型比例之類的
: 這也是為什麼OpenAI 和meta花了這麼多錢的原因
: 而台灣乃至美國的學校所謂的發展AI
: 大部分都是拿這些Meta開源的模型(小朋友)
: 去用他們自己的資料去微調參數
: 有點像是讓這些Meta生的小朋友
: 去不同學校上課
: 培養出不同個性和學識的小朋友
: 這個就相當簡單
: 簡單到幾個禮拜就可以做完
: 也不用花什麼錢
: 所以當你看到新聞
: 說什麼哪個學校或哪個機構發展自己的AI
: 花的時間少 成本還很低
: 你可以看看就好
: 沒什麼稀奇的
: 而 Deepseek 呢?
: 他是和那些學校和機構一樣
: 拿別人已經生出來的小朋友去上學
: 就說自己發展出AI了嗎?
: 人家可不是這樣
: 他跟OpenAI 和Meta一樣
: 都是從頭開始
: 自己捏出一個自己的小朋友
: 生出這個小朋友的成本還極低
: 而且在運作時
: 這位小朋友消耗的能量也少
: 生的時候花的力氣少
: 生出來後吃的東西也少
: 這是什麼神仙寶寶
: 這才是各界震驚的原因
: Deepseek的確是讓人類在AI發展邁進一大步
: 並不是三民治在那邊造謠就可以抹滅
: 有良知的媒體和政府
: 應該讓人民認知我們自己目前的不足
: 然後砥礪大家前進
: 而不是拿一塊布把大家眼睛遮住
: 一直騙說別人只是作弊
: 我們沒有很差
: 把時間浪費在造謠和口水
: 倒不如把時間花在了解和學習
: 人家跑在前面又怎樣
: 努力跟上去就有機會反超
: 而不是自欺欺人
: 導致永遠地落後
: -----------------
: 附上懶人包
: 簡單介紹AI成形三階段
: 再次感謝李宏毅老師的貢獻
: http://i.imgur.com/6KO6GvX.jpg
: : 我的理解啦~
: : 這就好像一個北一女的筆記本出售,
: : 有人去讀那個筆記,
: : 可以在考試上接近不錯的分數,
: : 後來又再出售自己的筆記,賣得很便宜,
: : 然後呢讀書方法這種事真的還是講興趣跟天份的吧,
: : 有興趣的話,可以融會貫通,
: : 跨領域聯想,可以一直舉一反三,
: : 再來,也有底蘊底氣的不同,
: : 西方國家如果做比喻的話就像三代文人家族,
: : 從祖父開始是哪裡的狀元在哪裡當官,
: : 有什麼門生人脈再到父輩;
: : 然後中國就像寒窗苦讀,
: : 不是鬥不起,
: : 是資源掌握跟運用的問題,
: : 幾十幾百個寒窗苦讀的人,
: : 讓他們都考上狀元榜眼探花舉人秀才,
: : 全部加起來,也很難比過三代文人望族世家貴族階層;
: : (例如被限制取得先進光刻機)
: : 再來,個性決定命運,
: : 這話也能套用在國家民族特性,
: : 如果將美國跟中國各看成一個人,
: : 一個是擅長創新而且鼓勵自由發展,
: : 一個是偷竊邀功欺上瞞下,鼓勵不公平競爭個性的人,
: : 這兩個人會有什麼發展,其實不難推斷,
: : 回到現實面,科技的發展取決於晶片,
: : 晶片的IC設計-美國矽谷跟以色列最強,
: : 晶片的製造-先進製程-台灣台積電最強,
: : 目前deepSeek 就像剛剛舉例抄筆記,
: : 可以達到AI運算,
: : 但是實際比較運算能力跟速度,
: : DeepSeek 還是比不上chatgpt.
: : DeepSeek 對比 chatgpt
: : 就像比亞迪追趕特斯拉,每當追上了硬體或軟體,
: : 特斯拉又去研究新的領域,
: : 無人駕駛技術或機器人發展或太空領域探索。
--
大家都研究一個月了你還在那邊
AI會說謊 AI hallucination 你居然當真= =
時空旅人?你那裡還來得及買四星電選四倍十期
全部人都有用Google跟OpenAI技術 沒人是從無到有的
opanai並沒有開源 是closeAI 你要跟大家同步還很遠
沒看到OpenAI去告耶?我是蠻希望Altman去告一告啦!
可是人家縮了,呵呵!
GPT是一個模型架構啊 transformer 的decoder部份
你懂地球是圓的,是你自己發現的嗎?
笑死 還在
還在撥接真可憐
你去問問deepseek阿
你那邊還來得及 快買台積電
你那邊還來得及 台股開盤記得買台指
1X
我的理解啦~ 這就好像一個北一女的筆記本出售, 有人去讀那個筆記, 可以在考試上接近不錯的分數, 後來又再出售自己的筆記,賣得很便宜,26
三民治以及蟾蜍網紅 很喜歡用北一女筆記這個比喻去打DS 應該是當時候收錢 給的文案就是這樣寫的吧 但是對AI有一點概念的人![Re: [新聞] 日本AI研究第一人這樣評價Deepseek Re: [新聞] 日本AI研究第一人這樣評價Deepseek](https://img.youtube.com/vi/cCpErV7To2o/mqdefault.jpg)
X
的確講得不好,自刪囉 -- 全書贈閱 《推背圖諰:中國國運與人類命運之預言憂患》全書PDF檔 免費流通 詮釋《推背圖》,反省過去,展望未來,自二十一世紀浩劫後重建人類文明,X
中國有deepseek 美國有chatGtp , 台灣有你們兩位AI大師+那台大什麼很屌的教授, 疑? 怎麼台灣什麼都沒有?? 好了啦AI大師們,
沒辦法啊 巧婦難為無米之炊 研究機構或大學院校 學生一邊要讀書 還要一邊開發系統 然後沒什麼錢賺 怎麼可能弄得出像樣的東西 新創公司經費有限 花不起這麼大的錢
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
54
[閒聊] 中國AI下西洋棋造假規則騙GPT上當通常ACG作品 都會描述機器人AI是理性的 不會說謊 依照指令給出正確答案或動作 比方底特律變人這種![[閒聊] 中國AI下西洋棋造假規則騙GPT上當 [閒聊] 中國AI下西洋棋造假規則騙GPT上當](https://i.imgur.com/XLp8B6xb.jpeg)
9
Re: [閒聊] 顯然DeepSeek沒什麼料從以前GPT的時候就覺得很奇怪,AI可以回答很多詳細的問題 但是一些直接GOOGLE就有答案的東西卻回答錯誤 GPT DeepSeek![Re: [閒聊] 顯然DeepSeek沒什麼料 Re: [閒聊] 顯然DeepSeek沒什麼料](https://i.meee.com.tw/JpovuIP.jpg)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
10
[問卦] deepseek會刺破ai泡沫嗎?原來訓練ai並沒有那麼昂貴, 中國Deepseek 公司用低成本就能訓練媲美OpenAI的gpt 中國低價策略根本讓高成本美國巨頭無法招架 Deepseek 會刺破ai泡沫嗎?有台積股票的會顫抖嗎? 有卦?3
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我用簡單說法看你有沒有辦法理解 首先中國很多ai研究都跳出來講了 這件事大有問題 沒錯,很多業者都用蒸餾法 但DS的原始模型感覺是拿gpt結果拿去背答案的6
[討論] 日本AI領域權威評DeepSeek的表現跟風險日經中文網翻譯採訪報導,找來日本專門研究AI模型的權威討論DeepSeek 日本AI研究第一人這樣評價Deepseek l 簡單做個結論,就是光以資料會被利用這點用哪家都一樣,看你能接受給誰用3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI4
[問卦] 語言模型用蒸餾是不是要寫上純度?大家都說deepseek蒸餾gpt來的 廣義上來說 GPT也是蒸餾整個網路資料來的 然後李飛飛用50美金重現deepseek的論文 算不算二次蒸餾三次蒸餾 那這樣以後語言模型是不是都要標註純度? --