Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對
小弟只是略懂工程師不是什麼AI大神,
個人淺見是不管DS有沒有蒸餾,
未來LLM的應用與效率仍然會不斷被精進,
DS只不過是開了第一槍。
LLM為了補強回應上專業性的不足,
早就在各個領域用RAG來提高評分,
以人類目前已紀錄的資料範圍來講,
未來絕大部分領域會像過去ILSVR一樣,
演算法會有近似甚至超越人一般的表現,
所以用技術獨佔來打不過是一時的牽制手段。
回到這個號稱節省97%運算成本的模型上,
舉例來講就像在算工程數學時,
要用微積分一步步推導或直接套公式的一樣,
對於大部分的人只要會套公式就好了,
但如果是更進階的應用只是靠公式就不夠用了,
最後還是得回到硬體面跟演算法的彈性。
爆紅的原因當然很單純,
就是告訴大家低技術的工作會被加速淘汰而已,
快去看自己的工作是不是要被取代了比較實在。
-----
Sent from JPTT on my Samsung SM-A528B.
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.254.138 (臺灣)
※ PTT 網址
推
AI可以取代台灣法官寫判決嗎
推
可以直接分析幾個邏輯整理出來最後去
→
選
→
把所有證據和言辭辯論都加進去資料輸
→
入
→
到時候反而很適合國民陪審團+AI了 然
→
後法官變成裁判
→
主持秩序的裁判
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。![Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套 Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套](https://i.imgur.com/s6MWLNmb.png)
13
Re: [新聞] 谷歌前執行長施密特:AI這場史詩級競賽坦白講 這如果是 Google 前執行長的發言 , 我真的會很懷疑他的能力 這裡不吹不黑 , 只說事實 現在AI所有的演算法 , 幾乎全部由美國的公司所開發的 這些演算法 Google自己創立的也一堆,也都有發表論文 中國的AI用的全部是美國公司的演算法![Re: [新聞] 谷歌前執行長施密特:AI這場史詩級競賽 Re: [新聞] 谷歌前執行長施密特:AI這場史詩級競賽](https://i.imgur.com/2tORwAPb.jpeg)
35
Re: [請益] AI到底是遇到什麼問題?技術跟應用場景的問題我不談,之前的人已經談過了,大致上沒有問題。 不同領域的人可能體驗不太一樣,但LLM普及的程度並沒有這麼低,具體而言,主要是 ChatGPT ,在部分領域已經是不可或缺的必要工具,到了掛掉會影響到正常工作或不能工作的程度。 首先是 coding,就我而言,至少有50%的程式碼已經是由 ChatGPT 完成的,遇到 bug 我幾乎沒有再用 Google 或是 stackoverflow ,log 直接丟進 ChatGPT , 大部分情況下它都能大幅減少我的工作時間。 除了遇到有關於 pydantic 的問題,因為這個 module 最近出了V2,模型的回答經常會混合V1的答案,而且傻傻分不清楚,在之前舊的沒有納入 pydantic 的版本時,這問題更為嚴重,必須要自己先提供文件用RAG 讓它知道。 但是就我實際的觀察周邊的人,發現LLM 對於低階的工程師,高階的工程師的幫助個別顯著,但是對於中階工程師而且有使用上的困難。![Re: [請益] AI到底是遇到什麼問題? Re: [請益] AI到底是遇到什麼問題?](https://i.imgur.com/hkos4GYb.jpeg)
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
21
[問卦] 歐拉公式是不是最頂的數學公式八卦安安啦 歐拉公式 比微積分還偉大的歐拉公式 是人類最常用的工具 連量子力學都在用 歐拉公式在數學、物理和工程領域應用廣泛。20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
6
Re: [問卦] DeepSeek問世會讓顯卡降價嗎顯卡一定會漲價 目前己經有很多deepseek布署在本機電腦的教學 ollama上也有deepseek R1模型可以下載 deepseek R1模型各參數量對顯卡記憶體需求![Re: [問卦] DeepSeek問世會讓顯卡降價嗎 Re: [問卦] DeepSeek問世會讓顯卡降價嗎](https://i.imgur.com/blJhjZbb.png)
2
Re: [問卦] AI產生意識並且洗腦控制人類行為怎解?以目前 AI 能做的事情,還很遠 當然不排除未來可以,但是至少是現在不行 現在連 AGI (通用人工智慧) 都很難 目前不管是生圖的 AI 或是大語言模型(LLM)的 AI 本質上都是猜,只是這個猜的過程可以從模型輔助讓猜這件事猜的更準
![Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對 Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對](https://i.imgur.com/AnMqjWLb.jpeg)