Re: [心得] 寫點自己的觀察
※ 引述 《ripple0129》 之銘言:
: 從兩年前GPT4剛出我就講了
: 當時版上風氣就是取代資淺資深不要想
: 兩年過去了
: 全世界的Senior被砍多少人了
: 反正還是很多人在那邊敝帚自珍
其實現在 Senior 還在砍還真的跟 LLM 沒關係,主要是:
- 疫情後一開始是為了經濟蕭條做準備,以及疫情間過度招募
- 最近還在砍很多都是縮減業務與成本、部門重整
- 資金流到 LLM 專案,其他軟體產品走維持路線
真的有因為 LLM 提高員工生產力而造成的裁員嗎?
這超難欸,首先公司要先測量出現在員工生產力,再測量用 LLM 的戰力,有這麼好做?
再說,LLM 目前強的只有在前端,以及簡單的後端,這裡的資深工程師大概都知道 LLM 對於複雜系統的理解能力還很糞,大概只能湊合著用
然後現在根本一大堆公司都還沒買 LLM 給員工用
至於 LLM 未來會變更強?我覺得不一定,主要原因:
1. 現在願意上 stackoverflow 解問題的越來越少,工程師開始封閉知識
2. Open Source 貢獻越來越少,訓練資料越來越少
3. LLM 的硬傷是推理能力不足,多為統計,但大系統技術還是多為推理為主
4. 總合:新技術的知識分享原來越少,LLM 無法訓練,最後隨著新技術的演進 LLM coding會越來越笨
--
今天chatgpt gemini 又給我呼叫不存在的 method
現在都跟AI一起解問題了 誰還會上網問 -.-
我啊,我還是常上網問。網上的答案常有思辯的過程,
這很重要,有時可以直接幫你避免走冤枉路。
Superintelligence 是現在主流想法了
覺得會越來越笨 只能說這想法很特別
問答AI比較適合:1.潤飾 2.提供難搜尋的問題之頭緒
因為沒東西能學啊
原po想法跟apple說的那一樣吧
其他情況大多沒比較好用,或是時間效益沒比較高
在AI真的會解題之前 AI都是拿人解題的答案給你而已
那要是沒有人願意把答案放出來 那要不然營運AI的人自己
要解題餵給AI 要不然AI就開始幻覺
這想法沒啥特別的
畢竟這些問答AI就只是很精緻的人云亦云機器
目前看起來衝擊最大就是CS剛畢業的 失業率上升
對啊 現在就是有缺不補,有補也是幾十上百封高階履歷,連資深工程師跳槽都難 所以現職不敢跳,遇缺不補,市場又一堆被裁的等消化,公司也沒非 AI 新專案,總合起來 當然也沒新人的缺
我叫gemi幫我畫個簡單的chart都畫不出來了
如果5年後反著走 我會覺得很神奇 當然不是不可能
還要我自己幫他的半成品debug
上網問問題現在聊天抬槓的成分大過找正解啦...
問題是找到解的人不太會再貢獻出來,所以下一個遇到的人還是找不到直接解,隨著技術演 進這樣的狀況會越來越頻繁,LLM 最後也沒新資料可以訓練
網路上的random guy跟chatgpt誰比較有機率回答出正確答案
這應該很清楚.....
光是跟AI一起解問題的過程就是在提供資料訓練了
僅限個體戶,企業 LLM 合約都是禁止拿客戶的輸入來訓練 而且 LLM 也不曉得最後你是怎麼解的,你也不會把試出的正解跟 AI 回報
除非大家都不用AI解問題 不然怎麼可能沒東西訓練
AI的source還有各類型的線上文件以及文章 除非某一天開始
大家都不在網路上分享知識了 不然AI總會有新的資料能吃
找到解的人也是會用AI阿,除非他很認真藏
但現實是哪那麼閒,有解叫AI記起來,方便下次用
你不會直接拿資料來解問題阿,但不代表不能用AI
而且大企業封閉的LLM 不會是多數
每天個人用戶那個數量 不能比吧
還是你覺得值得做的問題只在大企業LLM裡面
工人智慧vs人工智慧 = 中醫vs西醫
Apple那篇已經在網路上被嗆爆了 一個實習生做的
不能認同拿中醫比西醫,兩者的方法論是不一樣的
不過出錢的人還不一定進入這個階段。現在比較像是從 AI
可以取代人,發大財 -> AI 可以做更多,發大財 -> 然後
發現並沒有那麼美好,但 bubble 又不到破掉的程度
目前各大廠投入 LLM 的遠大於收益,目前唯一能看到未來的感覺只有結合機器人這塊
2/4我自己的看法沒有到那麼悲觀
搞不好是反過來 新框架為了搶市佔 出來的第一天就做好AI精
華版文件讓你爽用(?
開源的問題主要也是美國大廠撙節的問題
不用複雜任務 光是一般任務 或甚至就把現在AI當成高級版的
如果有一天訓練成本降到大部分大財團都能玩一個200-500B的L
LM 那我猜到那個時候語言模型變成開源打群架的可能性會很高
現在看起來只有中國因為制裁問題想開源膊聲浪
autocompletion 都能大大增加效率吧?啊不然 現在叫你回去
用記事本 跟用IDE開發 哪個快.....
而且寫code也僅是AI其中一個小小應用而已吧 AI能用的領域
超級多 只拿寫code來看能不能發大財?
喊AI公司沒賺的 一定是沒跟到PLTR 那是你自己的問題吧
老黃沒跟到 PLTR也沒跟到 怪東怪西然後還在喊泡沫 喊兩年
了還是眼巴巴的看著人家賺爛
不可能用記事本的 連ed/vi都強過記事本非常多 再配上
文本工具整理個index都有個簡易版completion
炒股那就...
撇開股票我講的公司都是賺錢的 財報都是賺爛
確實現在要取代還太早 但從以前無法想像到現在這程
度已經很誇張 如果說10年內會發生蠻有可能的
要不要去了解一下訓練一個200B模型的成本啊。先不說幾十億
的硬體成本。假設未來硬體降到0成本好了。光是整理能訓練
到可用,不會overfitting資料的成本,數百GB級token就好,
台灣就沒幾間公司能負擔了。給你硬體零成本啦,整理資料0
成本啦,一般公司還請不到能訓練的人。
企業自搞大模型AI到可取得工程師,目前看不到任何機會與希
望。
也是 我樂觀過頭了
講得滿有道理的
去試用一下openAI codex ,就知道哪些層級的人可以被
取代。去試用一下n8n,就可以知道哪些日常髒活可以被
取代。
推這篇 Input資料很重要 短期間不覺得對工程師會有太大的i
mpact 不過還是樂見其成十年後的發展
解析大型專案真的能力很差 都需要人為介入縮小範圍
新的專案需要先細分task 這也需要工程師人為規劃
跟AI一起解題根本沒有在訓練啊,以為硬體不用錢每個user的
input都拿去訓練喔,光是只跑訓練好的模型來給你答案,都要
加一堆用量限制來限制賠錢了,要都丟去跑訓練還得了
是 但要能進去阿
多看了一下這一串... 我就是那個問完用頭腦記或直接
寫應用的東西出來的人 哪可能回報ai...只有想問更深
入的才會繼續 用ai記錄更是無稽之談
用頭腦記可能需要踢掉一些用處不大的資訊 或用電腦將
其範例化 應用化
變成糞扣LLM
29
首Po很久沒出現啦,覺得版上討論很熱絡,來補點自己的觀察。 1. 軟體產業的資深資淺工程師的判斷標準、工作樣態,會受到 AI 很大的衝擊, 當原本一些練手的小事都會被AI做掉,會需要長出新的晉升管道。 另一方面少子化導致一堆公司都招不到工程師,只能招真的超級菜的人, 所以這兩個彼此都是對產業相對全新的狀態,這部分還有待時間觀察。13
AI終將取代所有的軟體工程師 不是立即性的 但就是會逐漸侵蝕 從兩年前GPT4剛出我就講了 當時版上風氣就是取代資淺資深不要想10
看職缺的domain在哪裡 工程跟科學的差別在於 科學基於基礎科學(數學物理化學) 開創出新的知識去推動材料,動力,性質變化 而工程的內核則是加速量產15
以開發端來說 純開發就是開發工具的階段 還不到說做了哪些 應用 跟doamin 裡的 flow agent 這些 目前我知道的有在用的就是,各大金控的dev統X資訊的dev 有去innovex 看現場表演的應該可以知道,github 的商業package 有買的有在談的還真是不少,已目前來說,他可以 自然語言幫你改code![Re: [心得] 寫點自己的觀察 Re: [心得] 寫點自己的觀察](https://news.pchome.com.tw/newsdata/science/technice/20250619/75030236471501338005_original.jpg)
10
先不討論取不取代的問題 有一個現象是已經正在發生的 就是未來軟體工程師的素質將會降低 其實也不只有軟體領域 應該是所有領域![Re: [心得] 寫點自己的觀察 Re: [心得] 寫點自己的觀察](https://scontent.ftpe7-1.fna.fbcdn.net/v/t15.5256-10/475582077_1001315411888871_1488828064475063745_n.jpg?stp=dst-jpg_s1000x1200_tt6&_nc_cat=100&ccb=1-7&_nc_sid=c26028&_nc_ohc=LBmSdfBXT7IQ7kNvwE6OUZ2&_nc_oc=AdkV0-pRco3frWRynut3U-CUdugeIjW2fhi_c0Y7NRzK6Pph1u6SIs1UYwNQgOSMQyg&_nc_zt=23&_nc_ht=scontent.ftpe7-1.fna&_nc_gid=dmloqQceqZoL0D5h2AvlGw&oh=00_AfMUFlrq5tjDIJsJ24p2AIjB1Xt-uJy9PgzNvgM8UayRRQ&oe=685CD79F)
2
mit做的研究,關於寫作。結論是 用chatGPT的頭腦變最差 用搜尋引擎的在中間 不靠電腦的人頭腦最好3
使用AI寫程式 根本的問題在於 過去從低階語言到高階語言 輸入跟輸出的行為都是有嚴謹定義的 但現在AI寫程式等於是要用相對模糊的自然語言![Re: [心得] 寫點自己的觀察 Re: [心得] 寫點自己的觀察](https://i.meee.com.tw/kRVCVnw.jpg)
92
Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時QQ 很多人都在說AI根本沒獲利 現在AI軍備競賽都只是泡沫 在講真實情況前 先來簡單科普一下genAI這鬼玩意 genAI是自從foundation model這玩意興起後出現的一種顯學 大體而言就是透過用一堆野生資料 去做預訓練(pre-training) 使得這類模型 之後在做下游任務(有答案數據標籤) 可以透過少量資料 去做許多高效能任務![Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時 Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時](https://img.youtube.com/vi/xe9BCwD_yVw/mqdefault.jpg)
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。![Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套 Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套](https://i.imgur.com/s6MWLNmb.png)
35
Re: [請益] AI到底是遇到什麼問題?技術跟應用場景的問題我不談,之前的人已經談過了,大致上沒有問題。 不同領域的人可能體驗不太一樣,但LLM普及的程度並沒有這麼低,具體而言,主要是 ChatGPT ,在部分領域已經是不可或缺的必要工具,到了掛掉會影響到正常工作或不能工作的程度。 首先是 coding,就我而言,至少有50%的程式碼已經是由 ChatGPT 完成的,遇到 bug 我幾乎沒有再用 Google 或是 stackoverflow ,log 直接丟進 ChatGPT , 大部分情況下它都能大幅減少我的工作時間。 除了遇到有關於 pydantic 的問題,因為這個 module 最近出了V2,模型的回答經常會混合V1的答案,而且傻傻分不清楚,在之前舊的沒有納入 pydantic 的版本時,這問題更為嚴重,必須要自己先提供文件用RAG 讓它知道。 但是就我實際的觀察周邊的人,發現LLM 對於低階的工程師,高階的工程師的幫助個別顯著,但是對於中階工程師而且有使用上的困難。![Re: [請益] AI到底是遇到什麼問題? Re: [請益] AI到底是遇到什麼問題?](https://i.imgur.com/hkos4GYb.jpeg)
31
Re: [新聞] 美監管機構調查:特斯拉自駕系統存在「週末貢獻我兩分錢意見 竟然有人說waymo要收掉 在自從LLM Agent出現後@@ 機器人領域瘋狂發展 尤其自駕又開始捲起來 在大好戰場線整合戰前 把waymo收掉 @@? (=_= 讓我想起2024 1月 提到業界要把LLM整合自駕 一堆人噴我不懂) 給個時間線26
Re: [心得] 蘋果揭露人工智能並不思考1. 首先 , 蘋果是最沒資格說話的 先看看蘋果AI的鳥樣 2. 蘋果 : 人工智能不能思考 這句話有很大的問題 現在的AI主流是經由大量資料訓練29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://i.imgur.com/vA7ifFRb.jpeg)
10
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不解決幻覺,不一定要從LLM解, 而是靠系統架構解。 例如,做一個問答系統,很多人減少幻覺是這樣做的: 0. 預先整理好QA問答資料集 (人工整理,或機器輔助整理)7
Re: [新聞]不,你無法用 600 萬美元複製一個 DeepSee建議先去看LATS 比較好理解什麼叫方法論 簡單說R1是一套"如何讓LLM可以做深度思考"的方法論 原本要讓LLM做深度思考 之前的做法一律都是COT 比如把每次LLM的輸入輸出當作一個節點 把多個節點做評分 最終選擇整條鏈評分最高的項目 即MCTS概念![Re: [新聞]不,你無法用 600 萬美元複製一個 DeepSee Re: [新聞]不,你無法用 600 萬美元複製一個 DeepSee](https://i.imgur.com/2BDUqa7b.png)
5
Re: [新聞]剖析中研院大型語言模型事件的衝擊先說結論: 發展本土化,繁體中文LLM模型,然後期待這個模型能讓大家使用,根本是錯誤方向。不知道這些專家學者,是在騙經費,還是還沒想清楚產業到底缺什麼。 --- 如果今天你使用Google搜尋,搜到"台灣是中國的",或任何有政治偏見的相關文章。 你會不會覺得Google很爛?
Re: [請益] AI伺服器成本分析——記憶體是最大的輸家請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬![Re: [請益] AI伺服器成本分析——記憶體是最大的輸家 Re: [請益] AI伺服器成本分析——記憶體是最大的輸家](https://picx.zhimg.com/v2-f6c2a117d2575f6cd3b85af859ad7f20_l.jpg?source=172ae18b)
![[請益] 中年求職困境 [請益] 中年求職困境](https://i.ibb.co/230tZgNr/sssss.jpg)