Re: [心得] 蘋果揭露人工智能並不思考
目前與論是這篇測試方法有問題... @@ 旁邊吃瓜中
https://hao.cnyes.com/post/176278
不過作者裡面有Samy Bengio 是AI三巨頭 Yoshua Bengio的弟弟
他們蘋果在去年底之前也發過類似風格一篇 說LLM推里有問題
https://finance.sina.com.cn/roll/2024-10-12/doc-incshnvf0502180.shtml
貌似他們這幾個作者喜歡找一堆會失敗的場景.....
關鍵作者Iman Mirzadeh 已經發了好幾篇反LLM 文章
這部分也是一堆人的吐嘲
認為其他大廠都在讓AI變聰明 你們果家就喜歡測試別人模型 說這玩意哪裡不好哪裡爛
這樣子果家的AI怎追上別人? 而測試方法又是各種千奇百怪
像這次測試方法最近還因為模型token限制翻車
--
因為這樣我有陣子想反向操作 買點果家股票 想知道會發生怎樣情況@@
※ 引述《huabandd (我是阿肥巴你頭)》之銘言:
: https://is.gd/U7lWC8
: 看到一個影片,非新聞報導,僅創作者想法
: 討論蘋果揭露關於人工智能當中的最大謊言
: 之前也看過一個影片指出
: AI無法產出指針在10:10以外的手錶
: (網路手錶圖片通常指針停留在10:10)
: 自己嘗試過幾次確實是這樣
: 因為AI的訓練是基於現有大量資料
: 去產生一個與大量資料相似的產物給你
: 無法產生未曾有過資料的產物
: (以上為個人猜測,若錯誤請指正)
: 雖然現在已有研究嘗試將AI接入人類神經元
: 未來思考的方式有可能因此改變
: 不再只是記憶,而是真正的推理
: (但是這好像也是一件滿恐怖的事情?)
: 如果說給AI一個圍棋組,但不教他玩法
: 也不讓他參考棋類玩法,讓他自行摸索
: 就像嬰兒拿到玩具後自己亂玩那樣
: AI能夠自行生成玩法是不是就算是成功?
: 中文翻譯
: 蘋果剛剛揭露了人工智慧中最大的謊言,即「思考」的假象,證明了像 Claude、Deepseek-
: R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問
: 題,而是創造了這些模型從未見過全新謎題。結果令人震驚。
: 對於簡單問題,標準 AI 模型表現優於昂貴的推理模型,同時消耗更少的資源。對於中等複
: 雜度問題,推理模型顯示出一些優勢,但對於模擬現實世界情境的高複雜度問題,兩種類型
: 的模型都崩潰到 0% 的準確度。
: 這是確鑿的證據:蘋果給予 AI 模型逐步的演算法,就像給某人食譜一樣,但它們仍在相同
: 的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據,得
: 出結論認為其行為最好用複雜的模式匹配來解釋。
: 簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔(Tower of Hanoi)謎題,模型
: 在超過 100 步的移動中成功了,但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶
: 模式,而不是進行邏輯推理。
: 隨著問題變得越來越難,「思考」模型使用的 token 越來越少,放棄得更快,而不是更深
: 入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤
: 前提上的。
: 公司將複雜的模式匹配宣傳為真正的推理,誤導消費者對 AI 能力的認知。我們離通用人工
: 智慧(AGI)的距離並沒有大家想像的那麼近;我們正在處理的是非常複雜的自動完成系統
: 。當先進的 AI 推理模型連遵循簡單指令都失敗時,我們是否正生活在一個建立在幻想之上
: 的 AI 炒作泡沫中?
: 英文原文
: Apple just exposed the biggest lie in AI with the illusion of "thinking," provin
: g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act
: ually think. Instead of recycling math problems, Apple created brand new puzzles
: these models had never seen. The results were shocking.
: For simple problems, standard AI models outperformed expensive reasoning models
: while using fewer resources. For medium complexity, reasoning models showed some
: advantage, but for high complexity problems that mirror real-world scenarios, b
: oth types collapsed to 0% accuracy.
: Here's the damning evidence: Apple gave AI models step-by-step algorithms, like
: giving someone a recipe, and they still failed at the same thresholds. This prov
: es they can't follow logical instructions. The study found no evidence of formal
: reasoning, concluding behavior is better explained by sophisticated pattern mat
: ching.
: Simply changing names and problems degraded performance dramatically. Apple test
: ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed
: at novel river crossing puzzles after just 4 moves. They memorized patterns rat
: her than reasoned logically.
: As problems got harder, "thinking" models used fewer tokens and gave up faster i
: nstead of thinking deeper. Even unlimited computational resources couldn't help.
: This exposes that billions in AI investment are based on false premises.
: Companies market sophisticated pattern matching as genuine reasoning, misleading
: consumers about AI capabilities. We are not as close to AGI as everyone thinks;
: we're dealing with very sophisticated autocomplete systems. When advanced AI re
: asoning models fail at following simple instructions, are we living in an AI hyp
: e bubble built on illusions?
--
逢低買進aapl?因為iPhone是AI最好的載體?
老巴也沒賣光 不會怎樣吧
有過圖靈測試就表示有在思考
思考 是 幻覺 就像一隻鸚鵡 聽人類講話 它學習了
但不代表他理解語言了 河內塔 river cross 會這麼
差 有可能是OOD 就是訓練模型沒接雛過這個資料 不
是啥token問題 用菜雞的語言來講 就是 鸚鵡沒聽過
一句完整的句子 只是學了 句子裡的詞 它不懂應用
但是他知道什麼時候說什麼
現在的AI 碰到完全沒有數據訓練的東西 會直接擺爛
即便 將 解法寫給它 它不會去應用 作者也沒否定A
I 只是認為這不是AGI 會成爲人類輔助工具 而不是取
代人類
這篇最近被很多人嘲笑
沒啥好嘲笑的 當一件新事情沒人懷疑時 才奇怪 現在
一堆人 抱著LLM 會成為AGI 只是過於樂觀的想法
沒錯,鸚鵡是好例子,牠有在思考和學習,但智商離人
類還很遠
他被嘲笑的原因不是他的動機阿 是他做實驗的方式
他用這兩個方法測試 是因為他認為這是可控的?pap
er有點長 好像有三種條件 記得很難找到其它數學方
式去測試
大半夜的 很懶得開電腦去找
要AI用十個字回答100個字才能講完答案的問題 說他答
不出來不會思考 這算重新定義思考嗎
的確算思考呀,只是AI智商低答不出來而已
先貶後面就可以在重新定義
現在ai頂會裡面能重現結果的有10%就算高了
一堆灌水文章發完就跑
聽起來類似AI領域的資安議題啊,針對弱點/短版去研究
這是個低級錯誤...
有過圖靈測試不代表有在思考好嗎
我也覺得llama模型不夠好啊 但我不敢空meta
這就是要peer review的原因
大家已經開始用爽爽 阿婆還在出怪聲…
思考也是有分等級的 透過文字去揣摩上意也是在思考
只是比人類笨而已
這就像現代人批評古代人大遷徙怎麼不坐飛機有效率
多了同樣的意思
的弟弟也能成為頭銜…
但這隻鸚鵡能解1秒解出你可能花一年學都解不出來的
數學題或程式題 也畫得出你可能學十年也畫不出來的
圖 做出你音感天份不好的人一輩子也做不出來的音樂
另外 雖然只是模仿 當知識淵博 態度永遠良好 先不論
牠是不是智能 這商業價值夠大了
然後說它只是在模仿 啊不然 你行你模仿看看啊.....
人類喔 大概99%的事連模仿都做不到勒
思考的定義是什麼?
推樓上,蘋果重新定義思考
爆
首Po看到一個影片,非新聞報導,僅創作者想法 討論蘋果揭露關於人工智能當中的最大謊言 之前也看過一個影片指出 AI無法產出指針在10:10以外的手錶![[心得] 蘋果揭露人工智能並不思考 [心得] 蘋果揭露人工智能並不思考](https://p16-sign-va.tiktokcdn.com/tos-maliva-p-0068/o4LfaEAbvSdAleefUAAA4aFxvfTANdCxALQihf~tplv-photomode-video-share-card:1200:630:20.jpeg?dr=14555&refresh_token=e9192c61&x-expires=1781535600&x-signature=Q%2FzWQ3Qk0Uwsbisl4NOj8U%2BEB%2BE%3D&t=4d5b0474&ps=13740610&shp=55bbe6a9&shcp=9dfa7f7f&idc=my2&ftpl=1)
59
大語言模型(LLM)它的原始目的是要「模仿人類回答出人類看得懂的答案。」 但跟人類的語言不同,你我使用的與言語表達會是一系列的文字規則, 例如「主詞,動詞,受詞」的SVO結構。 但模型本身並不是這樣學習的,它是把你看到的字,拆成詞素(token) 然後將這些詞向量化,變成一系列數列:9
這不是常識嗎??? 你用LLM最常看到的不就免責條款 你有沒有想過 為什麼那些免責條款需要存在 僅僅是因為現在技術力不足???![Re: [心得] 蘋果揭露人工智能並不思考 Re: [心得] 蘋果揭露人工智能並不思考](https://i.ibb.co/KxjdpPQS/Screenshot-2025-06-16-05-59-00-273-com-openai-chatgpt.jpg)
26
1. 首先 , 蘋果是最沒資格說話的 先看看蘋果AI的鳥樣 2. 蘋果 : 人工智能不能思考 這句話有很大的問題 現在的AI主流是經由大量資料訓練4
發完原文之後,我嘗試讓gemini模擬自己是嬰兒 一個一歲的嬰兒,他什麼都不懂 然後我把圍棋組放到他眼前,他會做出什麼反應? 首先他用狀聲詞咿咿啊啊搭配敘述構成畫面 我提示他並沒有溫度、軟硬、數量、大小任何概念5
蘋果要讓AI變強當然是難 不然siri早變強了 蘋果要找AI毛病當然是容易的多 其實改進AI的人也常常發現各種毛病 只是不一定會針對毛病作為研究成果發表 發表側重點不一樣罷了1
問題是人類大腦難道就不是這樣思考的嗎? 大腦也是區分語言模組 負責特殊功能的區塊受損 可能導致聽得懂 說不出來 看到懂 卻聽不懂4
我覺得大家對AI要求過多了 設想一個情況 中餐的廚師 他們如何學習廚藝? 答案是21
是這樣的 蘋果這一步棋其實是下對的 只專注在用戶體驗上 從10年前開始 從電動車 元宇宙 到AI4
我是覺得固然當前系統基礎上有一些問題存在,但不妨礙它仍舊具有一定基礎能力 反正都是演進階段,不如說只是先理解缺陷然後嘗試解決的過程(當然蘋果怎麼想我不知道) 就當前階段來說就已經略具破壞性了,啊如果還"更有能力"... 反正我是跟不上 以下偏題,一些感想![Re: [心得] 蘋果揭露人工智能並不思考 Re: [心得] 蘋果揭露人工智能並不思考](https://i.meee.com.tw/Z7DOmvi.png)
58
Re: [新聞] 蘋果AI為何限制iPhone 15 Pro以上機型?極客灣: 在WWDC的現場,跟蘋果的同學稍微了解了一下AI(Apple Intelligence)的細節。 蘋果AI有手機平板電腦本機計算的,也有用雲端伺服器的 (蘋果官方叫Private Cloud Compute),蘋果會有一套演算法來判斷用本機還是用雲端。 比如像AI畫圖,生成表情包,模型只有3b參數非常小,就是調用本機硬體。而筆記摘要修飾![Re: [新聞] 蘋果AI為何限制iPhone 15 Pro以上機型? Re: [新聞] 蘋果AI為何限制iPhone 15 Pro以上機型?](https://i.imgur.com/bHT63M2b.jpeg)
46
[情報] 隨著蘋果發布新AI模型,這表示iPhone 16隨著蘋果發布新AI模型,這表示iPhone 16將成為軟硬體都具AI支援的首個產品 【情報來源】 原網址: 短網址: 【情報/優惠內容】![[情報] 隨著蘋果發布新AI模型,這表示iPhone 16 [情報] 隨著蘋果發布新AI模型,這表示iPhone 16](https://iknow.stpi.narl.org.tw/Post/Figures/2024/market/telecomm_20666_20240429.png)
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,![[情報] 蘋果會將生成式AI帶入其生態體系嗎? [情報] 蘋果會將生成式AI帶入其生態體系嗎?](https://iknow.stpi.narl.org.tw/Post/Figures/2023/analysis/analysis_15963_20230214.png)
19
[問卦] 庫克會變成蘋果AI的罪人嗎?2023年6月,蘋果執行長就已經知道ChatGPT非常好用。 2年過去了,微軟、谷歌、臉書都已經推出AI相關產品了。 全世界的大公司,都會自己訓練AI模型,蘋果可能用授權的嗎?不自己訓練。 蘋果會在AI時代,脫隊嗎?![[問卦] 庫克會變成蘋果AI的罪人嗎? [問卦] 庫克會變成蘋果AI的罪人嗎?](https://imgpoi.com/i/BHQLD5.md.jpg)
6
[討論] iPhone 16整合生成式AI2023-12-08 12:51 中央社/ 台北8日電 邊緣運算人工智慧(Edge AI)在智慧型手機應用備受矚目,分析師預期,蘋果(Apple)明年iPhone 16系列將整合生成式AI(AIGC)功能,麥克風規格升級將是關鍵之一。 邊緣AI應用在個人電腦和手機裝置發展備受關注,蘋果明年iPhone 16系列整合AI功能進展,也成為市場焦點。 郭明錤7日在社群平台X貼文表示,蘋果今年第3季改組Siri團隊,目標整合生成式AI功能和大型語言模型(LLM)。 郭明錤指出,手機的語音輸入功能是生成式AI和LLM應用的關鍵介面,蘋果強化Siri軟硬體功能與規格,是推廣生成式AI應用的關鍵。3
Re: [閒聊] 用AI生成哈利波特剛剛看到其他人也用AI畫哈利波特, 相較於原篇(引用這篇)的90風跟上一篇的柯南風, 這篇的風格應該就比較接近我們印象的現代日本動畫風格了, 不過這作者不知道有沒有打算畫(?)女角XD![Re: [閒聊] 用AI生成哈利波特 Re: [閒聊] 用AI生成哈利波特](https://images.plurk.com/2KUPoh84rXPIGiTIC6n2dk.png)
X
[討論] 分析師:明年iPhone 16整合生成式AI郭明錤7日在社群平台X貼文表示,蘋果今年第3季改組Siri團隊,目標整合生成式AI功能和大型語言模型(LLM)。 郭明錤指出,手機的語音輸入功能是生成式AI和LLM應用的關鍵介面,蘋果強化Siri軟硬體功能與規格,是推廣生成式AI應用的關鍵。 強化Siri使用體驗。他認為,蘋果預計整合Siri更多生成式AI功能,可能是iPhone 16主要賣點的證明之一。 觀察邊緣AI手機裝置應用趨勢,美系外資法人報告分析,重點在哪種關鍵零組件明顯升級,以及哪個手機製造商帶領科技革新浪潮之一。 From 中央社2
Re: [問卦] AI產生意識並且洗腦控制人類行為怎解?以目前 AI 能做的事情,還很遠 當然不排除未來可以,但是至少是現在不行 現在連 AGI (通用人工智慧) 都很難 目前不管是生圖的 AI 或是大語言模型(LLM)的 AI 本質上都是猜,只是這個猜的過程可以從模型輔助讓猜這件事猜的更準X
Re: [問卦] 現今 AI 只是 Artificial Imitation ?我們知道以往關於 AI ,Turing圖靈曾提出有名的圖靈測試以作鑑定標準。 現在這個大語言模型的對話反應,幾乎就會使人以為實有其人在對話,而通過圖靈測試。 所以圖靈測試已經不足以判斷AI程度,那麼是否在科學上能夠提出更好的測試方法, 可以判斷只是 Artificial Imitation ,還是達到真正 Artificial Intelligence? 換言之,就是在語言應對上,科學上是否可以提供一種典型方法可以判斷
爆
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
爆
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
68
[情報] 台灣2025年11月份CPI 1.23%![[情報] 台灣2025年11月份CPI 1.23% [情報] 台灣2025年11月份CPI 1.23%](https://i.imgur.com/pLLp0M0b.jpeg)
96
[情報] 114年12月05日 三大法人買賣金額統計表![[情報] 114年12月05日 三大法人買賣金額統計表 [情報] 114年12月05日 三大法人買賣金額統計表](https://i.imgur.com/roBWXt2b.png)
91
[情報] 2317 鴻海 2025年11月營收75
[情報] 2344 華邦電 114年11月營收![[情報] 2344 華邦電 114年11月營收 [情報] 2344 華邦電 114年11月營收](https://i.mopix.cc/JF4BB2.jpg)
63
[情報] 00631L 預估分割17倍決議表決![[情報] 00631L 預估分割17倍決議表決 [情報] 00631L 預估分割17倍決議表決](https://imgpoi.com/i/6GBH1D.jpg)
55
[情報] 1205 上市外資買賣超排行![[情報] 1205 上市外資買賣超排行 [情報] 1205 上市外資買賣超排行](https://i.imgur.com/cvoXoMub.jpeg)
48
[請益] 說AI會跟.com一樣泡沫化是假議題吧?![[請益] 說AI會跟.com一樣泡沫化是假議題吧? [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/e0CJBzGa0hQ/mqdefault.jpg)
56
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
38
[情報] 0050、0056等成分股調整33
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/QUlaRGZb.jpg)
31
[情報] 3443 創意 11月營收31
Re: [請益] 0056可以這樣操作嗎![Re: [請益] 0056可以這樣操作嗎 Re: [請益] 0056可以這樣操作嗎](https://i.imgur.com/QUlaRGZb.jpg)
38
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
22
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/5f96blgb.gif)
16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預18
[請益] 第一金最近有什麼大事要發生嗎?![[請益] 第一金最近有什麼大事要發生嗎? [請益] 第一金最近有什麼大事要發生嗎?](https://i.mopix.cc/vMDTOu.jpg)
15
[情報] 2383 台光電 11月營收15
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
14
[情報] 2891 中信金 11月自結 0.36 累計 3.7614
[情報] 日本兩年期公債收益率升至1.03%11
[情報] 1205 上市投信買賣超排行8
[情報] 2885 元大金 11月自結 0.24 累計 2.509
Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?![Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧? Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/XwG3w4jL0wM/mqdefault.jpg)
9
Re: [情報] 2317 鴻海 2025年11月營收8
[情報] 2498 宏達電 114年11月營收7
[情報] 3167 大量 114年11月營收6
[情報] 2545 皇翔 買台積電 210張,均價:1469.414
[情報] 8054 安國 114年11月營收 歷史新高