Re: [問卦] ChatGpt為什麼開始變笨了?
※ 引述《gindisergo》之銘言
: 最近許多ChatGPT使用者發現ChatGPT變懶變笨了
: 目前OpenAI也坦承了這種狀況
: https://www.ctwant.com/article/303569
: 難道ChatGPT也學習會了躺平
: 然後就變懶了
: 有沒有AI達人來解釋一下原因?
正好半夜看到這篇無聊來回一下
GPT4能力下降大概5月多開始就有人注意到了
但你要怎麼定義能力衰退這件事而且量化他?
於是七月就有一篇論文在討論這件事
https://arxiv.org/abs/2307.09009
證明了gpt4能力隨時間下降這件事
但真正的原因除了OpenAI,沒有其他人知道
版本沒更新所以變笨更是屁話中的屁話
模型又不是人類會變老 腦子老化後會變笨
模型參數在部署的時候跟訓練時完全一模一樣
就是他媽固定在那邊了一輩子不會變
而且LLM的訓練成本高到一個幹破你娘
更不存在直接拿使用者答案onsite訓練這種事
所以大家在猜的幾個原因
1. 為了防範回答危險問題過度限制提問
2. 為了成本考量偷偷蒸餾模型換成較小參數模型
3. 用多個小模型組裝照問題分類各自回答模擬gpt4
總之OpenAI當初沒Open Source模型
背後要省成本換了啥模型也沒人知道 死無對證
LLM光query一次成本就超高
減少模型reasoning的成本也是目前主流研究方向
但像GPT4這種全面菁英級LLM
在不犧牲性能的前提下costdown根本是天方夜譚
加上現在光是開源的LLaMa就能擋很多初階應用場景了
所以懷疑到OpenAI濫竽充數也是很合理的事情
--
之前好像有看到新聞說openAI把效能調低省錢
真的變很笨 而且變得很愛鬼打牆
之前會自己寫程式,最近感覺直接貼網路上
的。
前陣子連簡單的用vba 打開其他excel
檔案都寫不出來 鬼打牆好久
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。25
Re: [閒聊] ChatGPT Plus跟一般版更新一下資訊,今天半夜OpenAI釋出了GPT-4模型了,ChatGPT plus可以搶先體驗 最大更新應該是AI可以辨識圖片了,其他的我沒有Plus所以不清楚 這是官方幾小時前的現場直播 隨後微軟也宣布他們的Bing的AI模型也跟著更新到GPT-4,剛好Edge瀏覽器今天更新可以20
Re: [討論] ChatGPT的思維是甚麼?阿肥外商碼農阿肥啦! 剛好看到這篇文章就回覆一下,這次大型語言模型(LLM)表現出來的是語言模型的湧現能 力,我其實不贊同LeCun說的LLM是歪路,畢竟雖然我們可以直覺知道加大網路連接數可能 是實踐人類大腦的一個重要步驟(畢竟人腦的連結數量跟複雜性在生物醫學上都有驗證), 但科學上不去驗證你沒辦法證明某些事情的。10
Re: [請益] 為什麼有人說AI會讓資工人失去工作?阿肥外商碼農阿肥啦! 我只能說當前甚至往後十幾年都很難完全取代,除非真正的AGI實現了,那取代的可能不 止資工人,而是整個人類社會了,想想看AGI都有人類智慧了,那鎖螺絲、自己修理自己 或是檢測同類機器人都是很簡單的,那幹嘛還找人類黑手? 先說說像GPT-4即便是大成功的當下,很多企業要復現這樣的模型難度也是跟登天一樣X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。6
Re: [問卦] ChatGPT改變了什麼行為模式?行? : : 業都發揮著重要作用,對許多人的生活產生了深遠影響。我想請問各位前輩,究竟Ch at : : T改變了哪些行為模式呢? : : 希望大家能分享一些寶貴的經驗和看法,讓我對ChatGPT及其對社會行為模式的影響5
Re: [新聞]剖析中研院大型語言模型事件的衝擊先說結論: 發展本土化,繁體中文LLM模型,然後期待這個模型能讓大家使用,根本是錯誤方向。不知道這些專家學者,是在騙經費,還是還沒想清楚產業到底缺什麼。 --- 如果今天你使用Google搜尋,搜到"台灣是中國的",或任何有政治偏見的相關文章。 你會不會覺得Google很爛?2
Re: [問卦] AI機器人的信度和效度?阿肥外商碼農阿肥啦!在下鍵盤研究員回答一下你的問題, 1. 先說統計檢驗部分,一般而言在傳統研究領域小數據上都會要你做一些傳統的統計檢驗, 例如你加了某個方法以後會更好,你要跟讀者證明A優於B,要避免模型有隨機性那做了可以 證明你是對的。不過現在大部分NLP訓練都是基於巨量數據像GPT-3有45TB的文本,這麼大的 數據情況下我們都會假設數據服從中央極限定理符合常態分佈,那做假設檢驗就有點多餘。1
Re: [問卦] 為什麼人工智慧在這今年炸開了這一波是十年前的AlexNet才開始讓ML實用化 以往都只是研究 AlexNet橫空出世 GPU+大型CNN 辨識率高 忽然讓一堆人想到 啊幹 原來GPU能幹那麼複雜的事情 所以從2012年之後 ML/AI的研究如同雨後春筍呈現爆炸性的增長 ML從事的人多 想法就多 推出的模型多 成功的總會有幾個- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
Re: [新聞] 擋3大法案? 柯建銘稱「不急」:藍白委6289
[問卦] 新北耶誕城是不是退燒了???56
Re: [問卦] 中共打來是誰要去面對?50
[問卦] threads上面因為建中放女學生立牌吵翻了爆
[問卦] 為什麼8+9都可以穿名牌、開雙B?爆
Re: [新聞] 卓榮泰:天災來時 地方要自己面對50
[問卦] 蔡依林為什麼要把香爐穿在身上==48
[問卦] 以前班上不念書的8+9長大後真的撿角了嗎?44
Re: [新聞] 民眾黨版財劃法遭藍營丟包 黃國昌喊可接39
[問卦] 一樣宣傳魷2 為何差別待遇呢?31
[問卦] 1000萬房貸 壓力有多大?42
[問卦] 蹦闆為什麼不敢提到增重失敗爆
[問卦] 為什麼日本有辦法讓89變成過街老鼠?34
[問卦] 8+9是都有割胃才這麼瘦嗎?45
[問卦] 每年中央少的錢 就撤掉數發部 不就好了78
[問卦] 政黑:財劃法 台北拿那麼多錢幹嘛用27
[問卦] 人力費上漲 未來長照怎麼辦?26
[問卦] 高雄人一直看造型氣球不會膩嗎22
[問卦] 大安國小是天龍小學嗎8
[問卦]八又翻? 現實風向一面倒 根本不挺統神?爆
[問卦] 為什麼高雄人覺得北中在搶他的錢36
[問卦] 如果超哥 蹦闆打起來要選一邊?20
[問卦] 曼谷觀光是怎麼打造那麼強的19
Re: [新聞] 抵制傅崐萁!苦苓:只要他還活著絕不踏進17
Re: [新聞] 元旦起禁止旅宿提供「一次性盥洗用品」13
[問卦] 每年給你23萬,你願意搬到一個小島嗎?18
[問卦] 台灣傳產老闆為什麼不給員工加薪呢?38
[問卦] 鍾培生 threads 第二回 直指裁判不公18
[問卦] 雞蛋太便宜了吧18
Re: [新聞] 民眾黨版財劃法遭藍營丟包 黃國昌喊可接