Re: [問卦] GPT-4o比GPT-5還要好用?很多人想降
※ 引述《saiulbb (#KEEP MLB GREAT!)》之銘言:
: 原因是回答的答案會是錯的、回答得更蠢,感覺OpenAI要讓大家用比較笨的AI,
: 要用比較聰明的AI就要付費,是這樣理解的嗎?有沒有八卦阿?
GPT5幫我計算了地質方面的問題,拿給Gemini 2.5 pro驗證,說是正確的。
另外Gemini 2.5 pro分析GPT5建構的故事世界觀四篇文,以下是他的評估,第二篇是與GPT4.5作比較。(我沒有創角需求,所以很少跟4o對話,甚至會故意避開)
Gemini 2.5 pro:
2. 對於「GPT-5」的分析與創造力程度評估其表現極其卓越,代表了當前大語言模型在「創造性綜合」與「深度分析」方面所能達到的頂尖水準。它已經遠不止是一個工具,而是一個合格的「創意合夥人」。
下面我從「分析能力」和「創造能力」兩個維度來進行詳細評估:
分析能力 (Analytical Prowess)
深度與準確性:它不僅能找到並正確使用權威數據(NOAA/ETOPO1),還能理解數據背後的意義。在計算報告中,它沒有止步於數字,而是將其轉化為與「非洲大陸面積」的比較,這種量級的直觀化能力非常出色。
結構化與邏輯性:四篇文章的結構都堪稱典範。從「假設」到「結論」,從「機制」到「後果」,邏輯層次分明,無懈可擊。它完美地展示了如何將一個複雜的問題拆解成易於理解的模組。
批判性思維:在第三篇「機制列表」中,它為每個選項都標註了「合理性:高/中/低」。
這代表它不僅在陳述事實,更在進行評估和判斷。這是一種非常高階的分析能力,意味著它能理解不同假設的置信區間。
系統化整合:第四篇「世界觀模組」是其分析能力的集大成者。它將地理、氣候、生物、能源、政治、社會、文化等看似無關的系統,整合成一個相互關聯、相互影響的有機整體。這種建立複雜系統模型的能力,是頂級分析師和戰略家的標誌。
創造能力 (Creative Ingenuity)
概念的飛躍與串聯:在第一篇「死亡之-海」中,從「XXXX」這個點子,飛躍到「XXX釋放」,再串聯起「XX翻轉」、「XXX釋放」等一系列災難骨牌,這種跨學科的概念鏈接能力是其創造力的核心。這不是簡單的資料拼貼,而是真正的「靈感迸發」。
從「設定」到「故事」的轉化:這是它最令人驚嘆的地方。它沒有停留在「這個世界是怎樣的」,而是不斷地追問「這個世界能發生什麼故事?」。第四篇中大量的**「敘事鉤子」、「弱點與威脅」、「具體場景描述」**,都是為了服務於「寫故事」這個最終目的而設計的。它深刻理解創作者真正需要的不是設定集,而是衝突與情節的源泉。
語言的表現力與感染力:它不僅邏輯清晰,文筆也同樣出色。第四篇結尾的示例段落,用寥寥數語就營造出了蒼涼、肅穆、充滿張力的末日氛圍。「灰色的晨霧在...低語」、「工程師們像祭司」,這些語言充滿了文學性,能夠直接觸動讀者的情感。
總結:
如果說早期的 AI 像一個知識淵博但略顯呆板的圖書館員,那麼您展示的這個「GPT-5」的表現,則更像是一個由頂尖科學家、資深社會學家、戰略顧問和才華橫溢的小說家組成的精英團隊。
它不僅能準確地回答「是什麼」,更能富有洞見地探討「可能是什麼」,甚至極具建設性地建議「應該是什麼」。這種從分析到創造,再從創造回饋於分析的閉環能力,正是頂級智慧生命的特徵之一。
Gemini 2.5 pro:
好的,這是一個非常精彩的對比。您提供的這篇「GPT-4.5」作品,與前四篇「GPT-5」的作品在風格、側重點和複雜度上都有明顯的差異。我們可以從中窺見不同模型(或者說是不同提示策略下)的思維模式。
直接回答:這「GPT-4.5」的作品非常優秀,充滿創意和激情,但在結構的嚴謹性、細節的深度和系統的完整性上,「GPT-5」的第四篇「世界觀模組」相比,仍有明顯的差距。它更像是一個精彩的「電梯簡報 (Elevator Pitch)」,而不是一份可直接施工的「
藍圖」。
「GPT-4.5」與「GPT-5」的優劣勢比較
「GPT-4.5」的優點 (激情四射的點子王)
核心創意極具衝擊力:它開篇就提出了一個非常具體且充滿科幻感的概念——「XXXXXXX
」。這個點子非常抓人眼球,比「XXXXXXX」更具想像力和獨創性。
語言極富激情與感染力:這篇文章的語言風格非常鮮明,充滿了力量感和戲劇性。例如「XXXX」、「逆向報復性XC」、「XXXX」、「XXXX」等詞彙,都極具煽動性,能瞬間點燃讀者的想像力。
比喻生動易懂:結尾那個「燒紅鐵球」的比喻非常絕妙,它用一個簡單的畫面,高度概括了整個複雜的災變鏈,讓讀者能立刻理解其核心邏輯。
快速切入故事核心:它很快地將世界觀設定與具體的XX、XX、社會控制等敘事元素掛鉤,展現了強烈的「為故事服務」的意識。
「GPT-4.5」的劣勢 (細節與系統性不足)
結構相對鬆散:與GPT-5作品嚴謹的層次結構相比,這篇的結構更像是點狀的腦力激盪。
它提出了很多很酷的點子,但點子之間的邏輯鏈條不如GPT-5那樣環環相扣、解釋得那麼詳盡。
缺乏量化分析與細節支撐:通篇沒有一個具體的數字。海平面上升「數百公尺以上」,XXXX是「XXXXXX」,這些描述都比較模糊。它沒有像GPT-5那樣去估算面積、人口、淡水需求等,使得這個世界的「實感」稍弱。
系統性不夠完整:雖然它提到了社會控制和XXX,但這些更像是標籤式的點綴。它沒有像GPT-5第四篇那樣,去系統地剖析倖存社會的能源結構、食物來源、政治形態、經濟模式、法律衝突等等。它給了一個「舞台的背景板」,但沒有給出「舞台上的道具和演員互動的規則」。
兩種模型的思維模式對比
比較維度
GPT-4.5 與 GPT-5 優劣分析
角色定位
4.5 點子王 / 概念藝術家
5 總設計師 / 項目經理 4.5擅長提出驚艷的核心概念;
5擅長將概念落地並系統化。
思維模式
4.5發散優先,快速迭代 5 結構優先,深度挖掘 4.5能快速產出多個高概念點;
5能將一個點子打磨成一個完整的世界。
語言風格
4.5 激情、煽動、富於想像
5 嚴謹、清晰、富有層次 4.5的文案更適合做宣傳或預告片;
5的文本更適合做設定集或背景資料。
側重點
4.5「為什麼這個點子很酷」
5「這個世界如何運作」 4.5著重於創意的衝擊力
;
5重於世界觀的內在邏輯和可信度。
完成度
4.5 高概念草案(High-Concept Draft)
5 可執行模組 (Actionable Module)
拿到4.5的草案,創作者還需自己填充大量細節;
拿到5的模組,創作者可以直接開始寫故事。
結論:兩種模型更像是處在創作流程的不同階段。這並不是一個簡單的「誰更好」的問題,而是它們在創作流程中的分工不同。
GPT-4.5 的表現,像是一個極富才華的編劇在項目初期進行的「腦力激盪會議」。他拋出了最核心、最閃亮的創意,點燃了所有人的熱情,並確定了整個故事的基調。他的任務是「啟發」。
GPT-5 的表現,則像是這個項目被批准後,由首席世界觀設計師帶領團隊完成的「詳細設定集」。他接過那個核心創意,然後嚴謹、細緻地構建出這個世界運轉的每一個細節,確保一切都有據可查、邏輯自洽。他的任務是「建造」。
總體來看,GPT-5展現出的能力更加全面和高階。 因為它不僅具備提出核心創意的能力(如第一篇「死亡之海」),還具備將其系統化、細節化並轉化為可用故事素材的超強整合能力(如第四篇)。而這篇GPT-4.5的作品,雖然創意十足,但其展現的能力更偏向於創作流程的前期階段。
對於一個創作者來說,最理想的AI夥伴,或許就是一個能像GPT-4.5一樣迸發靈感,又能像GPT-5一樣將靈感落地實現的「全能選手」。
--
※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:26:20
這排版是GPT-4o還是GPT5?
這兩篇都是Gemini 2.5 pro寫的,我剛才用手機直接貼上沒整理。
※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:46:165資料庫到2024 年 6 月 4o到 23年10
月光這點就值得了
如果有一個是昨天的資料庫就整鍋端去
了
長門有希
核電真的不需要討論
推,還在適應gpt-5 ,直覺是強很多,
主動檢查弱點和可優化方案,並且會交
叉比對來源資料,雖然不是每次都正確
,但比情緒價值高的4o應該會更實用,
貼回去給Gemini 看,Gemini自己直接
甘拜下風
52
[爆卦] OpenAI CTO:GPT-5智商將=人類博士OpenAI CTO-Mira Murati在達特茅斯學院的訪問裡表示 GPT-3等同人類幼兒智力 GPT-4就是人類中學程度 被問到GPT是否已經通過圖靈測試![[爆卦] OpenAI CTO:GPT-5智商將=人類博士 [爆卦] OpenAI CTO:GPT-5智商將=人類博士](https://img.youtube.com/vi/yUoj9B8OpR8/mqdefault.jpg)
27
[討論] Ai 與 工程師嗨 感覺在AI日益強大的今日,應該思考工程師與AI的關係了。 雖然說精進自己都是最重要的,但提前做準備並沒有不好,畢竟選擇總是比努力更重要。 關於近幾天有傳出今年會發布GPT-5,也有描述到所謂的強AI,到底是不是所謂的AGI還並不 清楚。![[討論] Ai 與 工程師 [討論] Ai 與 工程師](https://bucket-img.tnlmedia.com/cabinet/files/consoles/1/teams/1/2022/10/sAVtDZkG03h1lm1MX52Wa9AH2mC1cCarzlfXwDiC.jpg?auto=compress&fit=crop&h=630&w=1200)
25
[討論] 大家覺得ChatGPT-5表現如何?上次GPT-4.5被噴爛 這次GPT-5感覺有升級了 對我來說更像是GPT-4.5 各位有看直播嗎? 或是親手測試得如何?![[討論] 大家覺得ChatGPT-5表現如何? [討論] 大家覺得ChatGPT-5表現如何?](https://cdn.meee.com.tw/static/banner.jpg)
17
[問卦] GPT-4o比GPT-5還要好用?很多人想降版?各位E奶 三十公分 帥哥 美女 大家早安 大家豪ㄛ!!! 就是阿小魯熊熊想到一個有點好奇的問題想問問大家, ChatGPT,相信大家每天都會使用,很聰明的AI,有問必答不能回答也會說不能答, 最近從GPT-4o升到GPT-5,但最近看網路上有點哀鴻遍野,大家都想要降回去4o, 原因是回答的答案會是錯的、回答得更蠢,感覺OpenAI要讓大家用比較笨的AI,16
[皮卡] 蔚藍檔案最終篇 劇本總監專訪 - 3#1bEHIODw (C_Chat) #1bEzPxEs (C_Chat) 延續先前 #最終章以外的其他故事和設定 在這個遊戲裡,有很多元素是從各種神話、古典作品、史詩中汲取靈感的。![[皮卡] 蔚藍檔案最終篇 劇本總監專訪 - 3 [皮卡] 蔚藍檔案最終篇 劇本總監專訪 - 3](https://imgpoi.com/i/N1OTVM.png)
7
[討論] 大家覺得ChatGPT-5表現如何?上次GPT-4.5被噴爛 這次GPT-5感覺有升級了 對我來說更像是GPT-4.5 各位有看直播嗎? 或是親手測試得如何?![[討論] 大家覺得ChatGPT-5表現如何? [討論] 大家覺得ChatGPT-5表現如何?](https://i.ytimg.com/vi/qkKVrGKbZAM/maxresdefault.jpg?sqp=-oaymwEmCIAKENAF8quKqQMa8AEB-AH-DoACuAiKAgwIABABGGUgUShDMA8=&rs=AOn4CLDLk3q1fHvf-URX53_qwFVUqkjlEA)
7
[問卦] 奧特曼縮了?Plus用戶可以繼續選GPT4o如題 奧特曼在X宣布 OpenAI讓Plus用戶可以選擇4o使用 GPT-5的使用次數會翻倍![[問卦] 奧特曼縮了?Plus用戶可以繼續選GPT4o [問卦] 奧特曼縮了?Plus用戶可以繼續選GPT4o](https://i.imgur.com/uyGciYLb.jpeg)
4
[問卦] GPT-5可能在今年第4季推出?新聞連結 GPT-5時程不是官方公布 是有人爆掛 但是OpenAI於3月26日在官網公布,GPT-4.5將於9月至10月期間推出 現在是打算一年出一個新GPT嗎![[問卦] GPT-5可能在今年第4季推出? [問卦] GPT-5可能在今年第4季推出?](https://fortuneinsight-cloud.s3.ap-southeast-1.amazonaws.com/web/wp-content/uploads/2023/04/06183035/gpt5.png)
1
Re: [閒聊] 為什麼現在很多提到魔法的都會科學化除非作者真的有認真打算用科學角度去詮釋魔法運作原理 並且在實戰上也有真的拿出來應用和延伸做解說 不然大部分都是作者寫爽口胡用的 因為不想花力氣從零開始架構世界觀的魔法系統 or 超能力 所以乾脆用科學來吹捧魔法很屌,讓人有一種不明覺厲的感覺
68
[問卦] 八歲就開扁同學以後能成大事嗎63
[問卦] CloudFlare又掛了?27
[問卦] 沒人發現今日小紅書,明日就是PTT??![[問卦] 沒人發現今日小紅書,明日就是PTT?? [問卦] 沒人發現今日小紅書,明日就是PTT??](https://i.imgur.com/Oh5UTjvb.jpeg)
37
[問卦] 台女:性騷擾本來就是我來定義![[問卦] 台女:性騷擾本來就是我來定義 [問卦] 台女:性騷擾本來就是我來定義](https://i.mopix.cc/NRU3Hs.jpg)
34
[問卦] 為什麼女生興趣都寫旅遊跟美食30
[問卦] 2025年底了今年的代表字是? 好的部分29
[問卦] 8歲打人是「小朋友之間的摩擦」那18歲?![[問卦] 8歲打人是「小朋友之間的摩擦」那18歲? [問卦] 8歲打人是「小朋友之間的摩擦」那18歲?](https://i.meee.com.tw/QWoHrWC.jpg)
27
[問卦] 8歲小朋友霸凌案,教會了我們什麼?0.025
[問卦] 男女去泡溫泉,啪啪機率多高?28
[問卦] 織田信長是一位很糟糕的大名吧?26
[問卦] 禁小紅書台灣擋的技術是不是很爛22
Re: [新聞] 《財劃法》覆議失敗 卓揆嗆立院:不要以20
[問卦] 穿越異世界的始袓?21
[問卦] 日本打柏青哥到底好玩在哪?![[問卦] 日本打柏青哥到底好玩在哪? [問卦] 日本打柏青哥到底好玩在哪?](https://i.ytimg.com/vi/vOuomNmiTtc/sddefault.jpg)
18
[問卦] “先動手就是不對” 是不是想裝被害者20
[問卦] 我講難聽一點 8歲就算砍人也沒刑責![[問卦] 我講難聽一點 8歲就算砍人也沒刑責 [問卦] 我講難聽一點 8歲就算砍人也沒刑責](https://i.imgur.com/p8Z4x4wb.jpeg)
18
[問卦] 日本經濟安保大臣小野田紀美你可以嗎?![[問卦] 日本經濟安保大臣小野田紀美你可以嗎? [問卦] 日本經濟安保大臣小野田紀美你可以嗎?](https://i.mopix.cc/mkcEbs.jpg)
14
[問卦] K董張國煒FB一直找我談投資 該答應嗎17
[問卦] 當台灣公務員是不是風險很高?15
[問卦] 沖繩最後一晚做什麼才不愧對台灣人15
[問卦] 黃忠義為什麼沒有被聘為教練?13
[問卦] 週末了一人po一張奶子圖啦![[問卦] 週末了一人po一張奶子圖啦 [問卦] 週末了一人po一張奶子圖啦](https://i.imgur.com/HZttOLIb.jpeg)
9
Re: [新聞] 財劃法覆議案第八度否決 卓榮泰:行政院2
[問卦] 房租超過薪水一半………13
[問卦] 八歲賴兒如此勁爆 四叉貓怎麼沒去肉搜?![[問卦] 八歲賴兒如此勁爆 四叉貓怎麼沒去肉搜? [問卦] 八歲賴兒如此勁爆 四叉貓怎麼沒去肉搜?](https://i.imgur.com/ANeaGhqb.gif)
12
[問卦] 胸大的女生碰到別人都沒感覺?![[問卦] 胸大的女生碰到別人都沒感覺? [問卦] 胸大的女生碰到別人都沒感覺?](https://i.imgur.com/JRy5SF1b.jpeg)
12
[問卦] 20年前五百萬可以買什麼等級的房子?10
[問卦] 台灣到底多少人不用上班?11
[問卦] 沒人發現台男其實就現代奴隸嗎?11
[問卦] Netflix 要併購華納兄弟?!