Re: [討論] 當初想得到ai進化得這麼神速嗎?
https://t.co/aHUvcp71Hx
https://pbs.twimg.com/media/Gqu7luybcAAt5I6.jpg
OpenAI前陣子發表了o3 o4mini模型的問題:幻覺比例增加
所謂的幻覺就是把不存在的資訊當成真的在輸出
這個問題在比較以前的o1比較少,但新模型的o3 o4mini幻覺增加
雖然新模型有推論能力強化、提高速度、減少成本等優點
但幻覺是個令人無法忍受的缺陷
畢竟如果是個法律事務所使用你的AI,卻跑出無中生有的法條或證據的話
那對整個營業是很重大的障礙
目前幻覺增加的原因還不是很清楚
專家們的假設是就是因為推理能力變強,變得更勇於回答,才會出現這麼多幻覺
可能是為了強化推理能力而讓幻覺的現象惡化
也就是說這是AI的邏輯能力跟創造力強化之後必然面對的問題
其中一個解決方式是讓AI去探索外在的世界
如果AI可以用網路搜尋功能,回答的精度可以達到非常高的程度
但如果網路世界也被AI生成的文字塞滿的話,這個問題可能反而會讓AI崩潰就是了
你各位最近有在用生成式AI嗎?
--
網路搜尋功能不是一直都有?
事實上就是不開網路搜尋,事實類的東西問AI都很危險
創作類的東西也是開網路搜尋比不開好
所以googl股票不知道在跌什麼
明明搜尋對LLM來說還是很重要
只知道谷歌的圖片搜索不知道怎樣開始有夠難用
ai不是早就在用網路資料回答你了嗎?
只是沒辦法完全觸及到而已,畢竟網路上每個資料來源不可
能都搜得到
ai未來要做的應該是和現實時間點同步回答
我覺得是沒設定不知道就回答不知道的關係 一定要給你掰
個答案
這表示AI懂怎麼唬爛了吧(X
有的有開網路搜尋功能,幻覺還是蠻嚴重的
沒什麼,就只是到了中二的年紀罷了
再過一陣子就會社會化了
對於寫論文來說 無中生有的論文也很白爛 找不到出
處
網路搜尋的其中一個問題是……有些資料,假的多過真的。
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
92
Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時QQ 很多人都在說AI根本沒獲利 現在AI軍備競賽都只是泡沫 在講真實情況前 先來簡單科普一下genAI這鬼玩意 genAI是自從foundation model這玩意興起後出現的一種顯學 大體而言就是透過用一堆野生資料 去做預訓練(pre-training) 使得這類模型 之後在做下游任務(有答案數據標籤) 可以透過少量資料 去做許多高效能任務![Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時 Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時](https://img.youtube.com/vi/xe9BCwD_yVw/mqdefault.jpg)
56
Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大剛推出出來的時候我拿了幾題邏輯題出來考他 正確率很高我很驚喜覺得太神啦 剛剛看到下面推文 說他答不出來9.9跟9.11誰比較大 我想說不可能這麼簡單的答不出來吧![Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大 Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大](https://img.youtube.com/vi/4EayaPNo6pk/mqdefault.jpg)
46
Re: [新聞] ChatGPT的「幻覺」根本無法解純論AI的話 這個問題是一定可以被解決的 討論chatGPT肯定是無解 頂多提升準確度 提升到你認知不到「錯覺」 我自己是覺得用錯覺這個詞來闡述這個問題 好像滿奇怪的 簡單思考一下就知道了 假設AI是個人 他肯定會有他自己的認知![Re: [新聞] ChatGPT的「幻覺」根本無法解 Re: [新聞] ChatGPT的「幻覺」根本無法解](https://i.imgur.com/6C7jFzQb.jpg)
17
Re: [請益] 為什麼有人說AI會讓資工人失去工作?先講結論, 後面再從AI原理開始解釋. 1. AI會不會取代人類? 就目前人類技術所產生的AI不會取代人類, 但是不會使用AI的人會被懂AI的人取代. 2. AI極限在哪裡? 他的潛力在哪裡? AI的潛力: 將人類的抽象思考或概念轉換成與讓機械實際執行步驟的介面,![Re: [請益] 為什麼有人說AI會讓資工人失去工作? Re: [請益] 為什麼有人說AI會讓資工人失去工作?](https://i.imgur.com/3677Fwjb.jpeg)
14
[爆卦] 50美元訓練出媲美DeepSeek R1李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe![[爆卦] 50美元訓練出媲美DeepSeek R1 [爆卦] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
10
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不解決幻覺,不一定要從LLM解, 而是靠系統架構解。 例如,做一個問答系統,很多人減少幻覺是這樣做的: 0. 預先整理好QA問答資料集 (人工整理,或機器輔助整理)1X
Re: [新聞] ChatGPT的「幻覺」根本無法解我快笑死了 語言學教授連發言資格都沒有,你懂AI嗎? AI 的模型有幾種 ? 光是目前就有數10種以上 例如最早的 線性迴歸 決策樹 分群 分類 類神經網路![Re: [新聞] ChatGPT的「幻覺」根本無法解 Re: [新聞] ChatGPT的「幻覺」根本無法解](https://i.imgur.com/GtDcZYBb.jpg)
5
Re: [問卦] 呂捷的影片是不是很多內容都在誤導觀念?01 : 看到這個用AI來反駁的,我剛不禁噴笑出來。 : : 一. : 其實我對於自己完全不熟的議題,為了快速了解,我也會用AI,這我承認,![Re: [問卦] 呂捷的影片是不是很多內容都在誤導觀念? Re: [問卦] 呂捷的影片是不是很多內容都在誤導觀念?](https://i.imgur.com/OOJAfzsb.png)
1
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不借版問 小弟目前為前端工程師 受益於 Copilot 跟 ChatGPT 開發上真的輕鬆非常非常多 已經把按 tab 當作開發的一環了XD 不過之前就一直對生成式 AI 有個疑問 就是"幻覺"到底有沒有根本上的解決方法?![Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不 Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不](https://i.meee.com.tw/Gk7IjRH.png)
爆
[Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況![[Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況 [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況](https://img.youtube.com/vi/KJeMC4BKvoA/mqdefault.jpg)
爆
Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況![Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況 Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況](https://i.mopix.cc/OgUnxH.jpg)
爆
[鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12![[鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12 [鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12](https://img.youtube.com/vi/nNyot7KuDQE/mqdefault.jpg)
爆
[閒聊] 如果是bilibili被封鎖會怎麼樣?爆
[閒聊] 男女粉比例出乎你意料的作品?![[閒聊] 男女粉比例出乎你意料的作品? [閒聊] 男女粉比例出乎你意料的作品?](https://i.imgur.com/wSnRZsnb.jpeg)
爆
[討論] 欸!泡泡瑪特怎麼在大跌價了?![[討論] 欸!泡泡瑪特怎麼在大跌價了? [討論] 欸!泡泡瑪特怎麼在大跌價了?](https://img.youtube.com/vi/QBPEpPblwcw/mqdefault.jpg)
爆
Re: [閒聊] 小紅書成為美國App Store下載第一![Re: [閒聊] 小紅書成為美國App Store下載第一 Re: [閒聊] 小紅書成為美國App Store下載第一](https://i.imgur.com/T8vEV7xb.jpeg)
89
[Vtub] 虹VS齁 卡比賽車對抗賽87
Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾![Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾 Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾](https://img.youtube.com/vi/KJeMC4BKvoA/mqdefault.jpg)
73
Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾71
[閒聊] 最跌落神壇的公司是育碧嗎?![[閒聊] 最跌落神壇的公司是育碧嗎? [閒聊] 最跌落神壇的公司是育碧嗎?](https://i.imgur.com/71OHyzZb.png)
73
[閒聊]定義上幾歲才應該被叫「大叔」?![[閒聊]定義上幾歲才應該被叫「大叔」? [閒聊]定義上幾歲才應該被叫「大叔」?](https://i.imgur.com/0M6qX7Wb.jpeg)
65
[閒聊] 美國一名11歲幼童靠模仿達爾撐過危機![[閒聊] 美國一名11歲幼童靠模仿達爾撐過危機 [閒聊] 美國一名11歲幼童靠模仿達爾撐過危機](https://i.imgur.com/5kdUABnb.jpeg)
58
[閒聊] 被宣判是醜男該怎麼辦?![[閒聊] 被宣判是醜男該怎麼辦? [閒聊] 被宣判是醜男該怎麼辦?](https://i.mopix.cc/bVDkpu.jpg)
57
[蔚藍] 百花繚亂圍毆能打贏若藻嗎![[蔚藍] 百花繚亂圍毆能打贏若藻嗎 [蔚藍] 百花繚亂圍毆能打贏若藻嗎](https://i.imgur.com/dlSBA7yb.jpeg)
40
Re: [閒聊] 小紅書成為美國App Store下載第一53
[閒聊] 現在少前2是完全塵白化了喔52
[閒聊] 巨人的OP跟ED算很強嗎??52
[鳴潮] 怎辦?這計畫根本一點屁用也沒有!49
[妮姬] 小遊戲好難![[妮姬] 小遊戲好難 [妮姬] 小遊戲好難](https://i.mopix.cc/k7reSC.jpg)
45
Re: [閒聊] 小紅書成為美國App Store下載第一48
[Vtub] Vivi自爆性癖是被搔腳底XDDD![[Vtub] Vivi自爆性癖是被搔腳底XDDD [Vtub] Vivi自爆性癖是被搔腳底XDDD](https://i.imgur.com/l9An5yXb.jpeg)
49
[情報] 黑白妹1重製 插圖進度正式200% (全體50%)![[情報] 黑白妹1重製 插圖進度正式200% (全體50%) [情報] 黑白妹1重製 插圖進度正式200% (全體50%)](https://i.imgur.com/ZzNmHMBb.gif)
48
[閒聊] 統神會怎麼評論yoro騷擾事件!?47
[閒聊] 哪一種恐怖比較讓人不舒服?![[閒聊] 哪一種恐怖比較讓人不舒服? [閒聊] 哪一種恐怖比較讓人不舒服?](https://i.imgur.com/e8dN5uAb.png)
47
[閒聊] 新妹魔王 這樣算是黑奴嗎?![[閒聊] 新妹魔王 這樣算是黑奴嗎? [閒聊] 新妹魔王 這樣算是黑奴嗎?](https://pbs.twimg.com/media/FdMJRYGaEAAl0zi.jpg)
爆
[魔物]荒野總監發言惹議 將世界稱前作掀玩家反感![[魔物]荒野總監發言惹議 將世界稱前作掀玩家反感 [魔物]荒野總監發言惹議 將世界稱前作掀玩家反感](https://image.gameapps.hk/images/202512/05/1764898511_762582_jpg_r_result.jpg)
爆
[閒聊] 一晚9發現實中做得到嗎?![[閒聊] 一晚9發現實中做得到嗎? [閒聊] 一晚9發現實中做得到嗎?](https://i.imgur.com/U8Ejehhb.jpg)
41
[閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉![[閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉 [閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉](https://img.youtube.com/vi/it0V4iBGq18/mqdefault.jpg)
41
[星塔] 旅人介紹 『夏花』 CV.伊藤静![[星塔] 旅人介紹 『夏花』 CV.伊藤静 [星塔] 旅人介紹 『夏花』 CV.伊藤静](https://i.imgur.com/nK8rcORb.jpeg)
![[討論] 當初想得到ai進化得這麼神速嗎? [討論] 當初想得到ai進化得這麼神速嗎?](https://i.imgur.com/QMxns9ub.png)
![Re: [討論] 當初想得到ai進化得這麼神速嗎? Re: [討論] 當初想得到ai進化得這麼神速嗎?](https://i.imgur.com/cmBzDbwb.jpeg)