Re: [討論] 搞半天中國高潮一天有沒有可能是抄的?
※ 引述 《signm》 之銘言:
: 靠腰,還一邊吹天才少女研發程式
: 結果老美嚇到把工程師都叫回來
:
: 怎麼跟我家長的有點像
: 遠看deepseek
: 近看是deep-gpt
:
: 反而deepseek越查越奇怪
: 現在連設備都被懷疑走私來的
知識蒸餾的技術解說在此,我用一個簡要的方式講給大家
https://www.find.org.tw/index/knowledge/browse/7353378d7b72bcf0722141f77c121cd4/
老師上了十幾年的課程,花了十幾小時編撰講義,告訴學生哪些題目比較容易考、哪些解題模式必考。
這套授業模式是不是很像課後補習班的考前題庫班?
AI模型訓練也是如此,一個完成的大模型當作老師來訓練小模型,已有實證比小模型從1+1=2 來學成效要好
學生學兩年就能考會考。但老師學兩年的數學教育能當老師嗎?
看到這裡和還能吹捧Deepseek算力不重要沒有前人的學習推理。連老師都不存在。
藍白的「智慧殖民」充其量就是上個補習班題庫班。還以為自己能考奧林匹亞數學了?
Deepseek吹捧的低算力需求,就是有老師在補習班「知識蒸餾」
國民黨立委還什麼「智慧殖民」?「智慧竊取」吧(政黑點)
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.199.49 (臺灣)
※ PTT 網址
噓
講一堆屁話。台灣兩百億數發部搞不出來
噓
狀世代小草最會講屁話
推
別說數發部,藍白連中研院跟國科會的錢
→
都刪了,再酸你做研究怎麼老是不如人
推
因為數發部要遵守智財權法律,土匪不用
→
啊
8
首Po靠腰,還一邊吹天才少女研發程式 結果老美嚇到把工程師都叫回來 不到一天越看越奇怪 怎麼跟我家長的有點像 遠看deepseek![[討論] 搞半天中國高潮一天有沒有可能是抄的? [討論] 搞半天中國高潮一天有沒有可能是抄的?](https://i.imgur.com/M4DQIGtb.jpeg)
7
: : ---- : Sent from BePTT on my Samsung SM-S9260 當美國開源後中國的原創就出現了 從最早的Linux到美國波士頓動力機器狗1
這幾天有一些人想辦法讓它講出64天安門或是台灣是一個國家, 其實就足以證明這個AI的訓練過程有問題了吧。 口國自己搞的AI,怎麼會搞到最後生成結果才屏蔽關鍵字呢? 根本不應該餵這種極度辱華的政治不正確資料啊。 先不說是不是抄襲,就算美其名你站在巨人肩膀上。2
有啊 便宜治百病沒聽過嗎 只要便宜堪用該有都有就好 就算性能不怎麼樣也沒關係 對得起它的價錢就好
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
7
Re: [問卦] deepseek會刺破ai泡沫嗎?有人問deepseek是什麼模型 deepseek回答是chatgpt 不過這不確定是不是最新版 而且不是每次都回答chatgpt7
Re: [問卦] 國中補習班教理化時薪應該要多少嘿嘿 肥肥我以前在補習班走跳一陣子了 以前都會覺得自己教書很值錢 出去外面打工教書 憑著114的學歷 大家都要給我高薪6
[心得] 112資管所正取心得有鑑於備考期間受到許多幫助,自己也來分享一下心得。 我有補習,是商管最大的那一間,學校是政大社科院的學系,有報暑假正課跟題庫班。 考試結果: 1.台大資管 正取 2.清大資應 正取1
[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣剛看了DeepSeek R1原始文件 Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv preprint arXiv:2501.12948. 看完結論就是![[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣 [問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣](https://i.imgur.com/jY9j0u3b.jpg)
4
Re: [請益] 曾瑞君老師的Java課程加油,堅持下去,熱愛下去,不須去管部分人的負能量,也不需跟他們多往來打交道 上課是非常好的一件事,除了技術上的學習外,可以重新找到志同道合的朋友 也建議把自己碰到的問題記錄下來,剖析後,跟老師們分享,讓他們有教學相長的感覺。 這類課程的老師通常教了很久,學生橫跨多個產業,也會有些優質的學生成長為主力 那些學生通常成為主力之後,都需要一些人,讓老師有信心推薦。2
[心得] 109政大財管正取心得(代Po)一、 前言 之前推甄發過一篇心得文,由於後來考試考上更好的,所以再發一次,分享讀書方法及規 劃。畢竟受ptt研究所版的幫助極大,來回饋一下! 二、 背景 國立大學財金系2
[心得](代po)清大通訊考試心得台聯大考試心得建議: 背景114電機 系排大約80%左右 考試成績: 清大通訊甲組 正取,其餘不分發 有補習 考科為: 工數B(線代、機率),通訊原理1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平