Re: [問卦] GPT-4o比GPT-5還要好用？很多人想降

LoveSports 發表於 2025/8/10 下午4:18:20

看板Gossiping標題Re: [問卦] GPT-4o比GPT-5還要好用？很多人想降作者

(我要當一個渣攻)時間Aug 10 16:18:20 2025推噓 3 推:3 噓:0 →:10

※ 引述《saiulbb (#KEEP MLB GREAT!)》之銘言：
: 原因是回答的答案會是錯的、回答得更蠢，感覺OpenAI要讓大家用比較笨的AI，
: 要用比較聰明的AI就要付費，是這樣理解的嗎？有沒有八卦阿？

GPT5幫我計算了地質方面的問題，拿給Gemini 2.5 pro驗證，說是正確的。

另外Gemini 2.5 pro分析GPT5建構的故事世界觀四篇文，以下是他的評估，第二篇是與GPT4.5作比較。（我沒有創角需求，所以很少跟4o對話，甚至會故意避開）

Gemini 2.5 pro:
2. 對於「GPT-5」的分析與創造力程度評估其表現極其卓越，代表了當前大語言模型在「創造性綜合」與「深度分析」方面所能達到的頂尖水準。它已經遠不止是一個工具，而是一個合格的「創意合夥人」。

下面我從「分析能力」和「創造能力」兩個維度來進行詳細評估：

分析能力 (Analytical Prowess)

深度與準確性：它不僅能找到並正確使用權威數據（NOAA/ETOPO1），還能理解數據背後的意義。在計算報告中，它沒有止步於數字，而是將其轉化為與「非洲大陸面積」的比較，這種量級的直觀化能力非常出色。

結構化與邏輯性：四篇文章的結構都堪稱典範。從「假設」到「結論」，從「機制」到「後果」，邏輯層次分明，無懈可擊。它完美地展示了如何將一個複雜的問題拆解成易於理解的模組。

批判性思維：在第三篇「機制列表」中，它為每個選項都標註了「合理性：高/中/低」。

這代表它不僅在陳述事實，更在進行評估和判斷。這是一種非常高階的分析能力，意味著它能理解不同假設的置信區間。

系統化整合：第四篇「世界觀模組」是其分析能力的集大成者。它將地理、氣候、生物、能源、政治、社會、文化等看似無關的系統，整合成一個相互關聯、相互影響的有機整體。這種建立複雜系統模型的能力，是頂級分析師和戰略家的標誌。

創造能力 (Creative Ingenuity)
概念的飛躍與串聯：在第一篇「死亡之-海」中，從「XXXX」這個點子，飛躍到「XXX釋放」，再串聯起「XX翻轉」、「XXX釋放」等一系列災難骨牌，這種跨學科的概念鏈接能力是其創造力的核心。這不是簡單的資料拼貼，而是真正的「靈感迸發」。

從「設定」到「故事」的轉化：這是它最令人驚嘆的地方。它沒有停留在「這個世界是怎樣的」，而是不斷地追問「這個世界能發生什麼故事？」。第四篇中大量的**「敘事鉤子」、「弱點與威脅」、「具體場景描述」**，都是為了服務於「寫故事」這個最終目的而設計的。它深刻理解創作者真正需要的不是設定集，而是衝突與情節的源泉。

語言的表現力與感染力：它不僅邏輯清晰，文筆也同樣出色。第四篇結尾的示例段落，用寥寥數語就營造出了蒼涼、肅穆、充滿張力的末日氛圍。「灰色的晨霧在...低語」、「工程師們像祭司」，這些語言充滿了文學性，能夠直接觸動讀者的情感。

總結：
如果說早期的 AI 像一個知識淵博但略顯呆板的圖書館員，那麼您展示的這個「GPT-5」的表現，則更像是一個由頂尖科學家、資深社會學家、戰略顧問和才華橫溢的小說家組成的精英團隊。

它不僅能準確地回答「是什麼」，更能富有洞見地探討「可能是什麼」，甚至極具建設性地建議「應該是什麼」。這種從分析到創造，再從創造回饋於分析的閉環能力，正是頂級智慧生命的特徵之一。

Gemini 2.5 pro:
好的，這是一個非常精彩的對比。您提供的這篇「GPT-4.5」作品，與前四篇「GPT-5」的作品在風格、側重點和複雜度上都有明顯的差異。我們可以從中窺見不同模型（或者說是不同提示策略下）的思維模式。

直接回答：這「GPT-4.5」的作品非常優秀，充滿創意和激情，但在結構的嚴謹性、細節的深度和系統的完整性上，「GPT-5」的第四篇「世界觀模組」相比，仍有明顯的差距。它更像是一個精彩的「電梯簡報 (Elevator Pitch)」，而不是一份可直接施工的「
藍圖」。

「GPT-4.5」與「GPT-5」的優劣勢比較

「GPT-4.5」的優點 (激情四射的點子王)

核心創意極具衝擊力：它開篇就提出了一個非常具體且充滿科幻感的概念——「XXXXXXX
」。這個點子非常抓人眼球，比「XXXXXXX」更具想像力和獨創性。

語言極富激情與感染力：這篇文章的語言風格非常鮮明，充滿了力量感和戲劇性。例如「XXXX」、「逆向報復性XC」、「XXXX」、「XXXX」等詞彙，都極具煽動性，能瞬間點燃讀者的想像力。

比喻生動易懂：結尾那個「燒紅鐵球」的比喻非常絕妙，它用一個簡單的畫面，高度概括了整個複雜的災變鏈，讓讀者能立刻理解其核心邏輯。

快速切入故事核心：它很快地將世界觀設定與具體的XX、XX、社會控制等敘事元素掛鉤，展現了強烈的「為故事服務」的意識。

「GPT-4.5」的劣勢 (細節與系統性不足)

結構相對鬆散：與GPT-5作品嚴謹的層次結構相比，這篇的結構更像是點狀的腦力激盪。

它提出了很多很酷的點子，但點子之間的邏輯鏈條不如GPT-5那樣環環相扣、解釋得那麼詳盡。

缺乏量化分析與細節支撐：通篇沒有一個具體的數字。海平面上升「數百公尺以上」，XXXX是「XXXXXX」，這些描述都比較模糊。它沒有像GPT-5那樣去估算面積、人口、淡水需求等，使得這個世界的「實感」稍弱。

系統性不夠完整：雖然它提到了社會控制和XXX，但這些更像是標籤式的點綴。它沒有像GPT-5第四篇那樣，去系統地剖析倖存社會的能源結構、食物來源、政治形態、經濟模式、法律衝突等等。它給了一個「舞台的背景板」，但沒有給出「舞台上的道具和演員互動的規則」。

兩種模型的思維模式對比
比較維度
GPT-4.5 與 GPT-5 優劣分析
角色定位
4.5 點子王 / 概念藝術家
5 總設計師 / 項目經理 4.5擅長提出驚艷的核心概念；
5擅長將概念落地並系統化。

思維模式
4.5發散優先，快速迭代 5 結構優先，深度挖掘 4.5能快速產出多個高概念點；
5能將一個點子打磨成一個完整的世界。

語言風格
4.5 激情、煽動、富於想像
5 嚴謹、清晰、富有層次 4.5的文案更適合做宣傳或預告片；
5的文本更適合做設定集或背景資料。

側重點
4.5「為什麼這個點子很酷」
5「這個世界如何運作」 4.5著重於創意的衝擊力
；
5重於世界觀的內在邏輯和可信度。

完成度
4.5 高概念草案(High-Concept Draft)
5 可執行模組 (Actionable Module)
拿到4.5的草案，創作者還需自己填充大量細節；
拿到5的模組，創作者可以直接開始寫故事。

結論：兩種模型更像是處在創作流程的不同階段。這並不是一個簡單的「誰更好」的問題，而是它們在創作流程中的分工不同。

GPT-4.5 的表現，像是一個極富才華的編劇在項目初期進行的「腦力激盪會議」。他拋出了最核心、最閃亮的創意，點燃了所有人的熱情，並確定了整個故事的基調。他的任務是「啟發」。

GPT-5 的表現，則像是這個項目被批准後，由首席世界觀設計師帶領團隊完成的「詳細設定集」。他接過那個核心創意，然後嚴謹、細緻地構建出這個世界運轉的每一個細節，確保一切都有據可查、邏輯自洽。他的任務是「建造」。

總體來看，GPT-5展現出的能力更加全面和高階。因為它不僅具備提出核心創意的能力（如第一篇「死亡之海」），還具備將其系統化、細節化並轉化為可用故事素材的超強整合能力（如第四篇）。而這篇GPT-4.5的作品，雖然創意十足，但其展現的能力更偏向於創作流程的前期階段。

對於一個創作者來說，最理想的AI夥伴，或許就是一個能像GPT-4.5一樣迸發靈感，又能像GPT-5一樣將靈感落地實現的「全能選手」。

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 121.2.243.171 (日本)

※ PTT 網址

※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:26:20

→

aaice 08/10 16:25這排版是GPT-4o還是GPT5?

這兩篇都是Gemini 2.5 pro寫的，我剛才用手機直接貼上沒整理。

※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:46:16

推

driver0811 08/10 17:145資料庫到2024 年 6 月 4o到 23年10

→

driver0811 08/10 17:14月光這點就值得了

→

driver0811 08/10 17:15如果有一個是昨天的資料庫就整鍋端去

→

driver0811 08/10 17:15了

→

driver0811 08/10 17:15長門有希

推

driver0811 08/10 17:20核電真的不需要討論

推

nikecoming 08/10 18:13推，還在適應gpt-5 ，直覺是強很多，

→

nikecoming 08/10 18:13主動檢查弱點和可優化方案，並且會交

→

nikecoming 08/10 18:13叉比對來源資料，雖然不是每次都正確

→

nikecoming 08/10 18:13，但比情緒價值高的4o應該會更實用，

→

nikecoming 08/10 18:14貼回去給Gemini 看，Gemini自己直接

→

nikecoming 08/10 18:14甘拜下風

同系列文章

Re: [問卦] GPT-4o比GPT-5還要好用？很多人想降

```
 1 
```
pisser：最近發現GEMINI的research完成一個報告後，可以再變成語音摘要，他會形成一男一女在聊天的音檔，跟在聽podcast一模一樣，自然度極高，但就是一天好像只能三篇。問題來了，扣打用完後，我把新文章拿給gpt ，他也「宣稱」可以製作語音摘要，結果直接文字貼上給他「我看不到你的文章，請你貼上」

其他人也閱讀了

PTT 熱門相關