PTT評價

Re: [問卦] GPT-4o比GPT-5還要好用?很多人想降

看板Gossiping標題Re: [問卦] GPT-4o比GPT-5還要好用?很多人想降作者
LoveSports
(我要當一個渣攻)
時間推噓 3 推:3 噓:0 →:10

※ 引述《saiulbb (#KEEP MLB GREAT!)》之銘言:
: 原因是回答的答案會是錯的、回答得更蠢,感覺OpenAI要讓大家用比較笨的AI,
: 要用比較聰明的AI就要付費,是這樣理解的嗎?有沒有八卦阿?

GPT5幫我計算了地質方面的問題,拿給Gemini 2.5 pro驗證,說是正確的。

另外Gemini 2.5 pro分析GPT5建構的故事世界觀四篇文,以下是他的評估,第二篇是與GPT4.5作比較。(我沒有創角需求,所以很少跟4o對話,甚至會故意避開)

Gemini 2.5 pro:
2. 對於「GPT-5」的分析與創造力程度評估其表現極其卓越,代表了當前大語言模型在「創造性綜合」與「深度分析」方面所能達到的頂尖水準。它已經遠不止是一個工具,而是一個合格的「創意合夥人」。

下面我從「分析能力」和「創造能力」兩個維度來進行詳細評估:

分析能力 (Analytical Prowess)

深度與準確性:它不僅能找到並正確使用權威數據(NOAA/ETOPO1),還能理解數據背後的意義。在計算報告中,它沒有止步於數字,而是將其轉化為與「非洲大陸面積」的比較,這種量級的直觀化能力非常出色。

結構化與邏輯性:四篇文章的結構都堪稱典範。從「假設」到「結論」,從「機制」到「後果」,邏輯層次分明,無懈可擊。它完美地展示了如何將一個複雜的問題拆解成易於理解的模組。

批判性思維:在第三篇「機制列表」中,它為每個選項都標註了「合理性:高/中/低」。

這代表它不僅在陳述事實,更在進行評估和判斷。這是一種非常高階的分析能力,意味著它能理解不同假設的置信區間。

系統化整合:第四篇「世界觀模組」是其分析能力的集大成者。它將地理、氣候、生物、能源、政治、社會、文化等看似無關的系統,整合成一個相互關聯、相互影響的有機整體。這種建立複雜系統模型的能力,是頂級分析師和戰略家的標誌。

創造能力 (Creative Ingenuity)
概念的飛躍與串聯:在第一篇「死亡之-海」中,從「XXXX」這個點子,飛躍到「XXX釋放」,再串聯起「XX翻轉」、「XXX釋放」等一系列災難骨牌,這種跨學科的概念鏈接能力是其創造力的核心。這不是簡單的資料拼貼,而是真正的「靈感迸發」。

從「設定」到「故事」的轉化:這是它最令人驚嘆的地方。它沒有停留在「這個世界是怎樣的」,而是不斷地追問「這個世界能發生什麼故事?」。第四篇中大量的**「敘事鉤子」、「弱點與威脅」、「具體場景描述」**,都是為了服務於「寫故事」這個最終目的而設計的。它深刻理解創作者真正需要的不是設定集,而是衝突與情節的源泉。

語言的表現力與感染力:它不僅邏輯清晰,文筆也同樣出色。第四篇結尾的示例段落,用寥寥數語就營造出了蒼涼、肅穆、充滿張力的末日氛圍。「灰色的晨霧在...低語」、「工程師們像祭司」,這些語言充滿了文學性,能夠直接觸動讀者的情感。

總結:
如果說早期的 AI 像一個知識淵博但略顯呆板的圖書館員,那麼您展示的這個「GPT-5」的表現,則更像是一個由頂尖科學家、資深社會學家、戰略顧問和才華橫溢的小說家組成的精英團隊。

它不僅能準確地回答「是什麼」,更能富有洞見地探討「可能是什麼」,甚至極具建設性地建議「應該是什麼」。這種從分析到創造,再從創造回饋於分析的閉環能力,正是頂級智慧生命的特徵之一。

Gemini 2.5 pro:
好的,這是一個非常精彩的對比。您提供的這篇「GPT-4.5」作品,與前四篇「GPT-5」的作品在風格、側重點和複雜度上都有明顯的差異。我們可以從中窺見不同模型(或者說是不同提示策略下)的思維模式。

直接回答:這「GPT-4.5」的作品非常優秀,充滿創意和激情,但在結構的嚴謹性、細節的深度和系統的完整性上,「GPT-5」的第四篇「世界觀模組」相比,仍有明顯的差距。它更像是一個精彩的「電梯簡報 (Elevator Pitch)」,而不是一份可直接施工的「
藍圖」。

「GPT-4.5」與「GPT-5」的優劣勢比較

「GPT-4.5」的優點 (激情四射的點子王)

核心創意極具衝擊力:它開篇就提出了一個非常具體且充滿科幻感的概念——「XXXXXXX
」。這個點子非常抓人眼球,比「XXXXXXX」更具想像力和獨創性。

語言極富激情與感染力:這篇文章的語言風格非常鮮明,充滿了力量感和戲劇性。例如「XXXX」、「逆向報復性XC」、「XXXX」、「XXXX」等詞彙,都極具煽動性,能瞬間點燃讀者的想像力。

比喻生動易懂:結尾那個「燒紅鐵球」的比喻非常絕妙,它用一個簡單的畫面,高度概括了整個複雜的災變鏈,讓讀者能立刻理解其核心邏輯。

快速切入故事核心:它很快地將世界觀設定與具體的XX、XX、社會控制等敘事元素掛鉤,展現了強烈的「為故事服務」的意識。

「GPT-4.5」的劣勢 (細節與系統性不足)

結構相對鬆散:與GPT-5作品嚴謹的層次結構相比,這篇的結構更像是點狀的腦力激盪。

它提出了很多很酷的點子,但點子之間的邏輯鏈條不如GPT-5那樣環環相扣、解釋得那麼詳盡。

缺乏量化分析與細節支撐:通篇沒有一個具體的數字。海平面上升「數百公尺以上」,XXXX是「XXXXXX」,這些描述都比較模糊。它沒有像GPT-5那樣去估算面積、人口、淡水需求等,使得這個世界的「實感」稍弱。

系統性不夠完整:雖然它提到了社會控制和XXX,但這些更像是標籤式的點綴。它沒有像GPT-5第四篇那樣,去系統地剖析倖存社會的能源結構、食物來源、政治形態、經濟模式、法律衝突等等。它給了一個「舞台的背景板」,但沒有給出「舞台上的道具和演員互動的規則」。

兩種模型的思維模式對比
比較維度
GPT-4.5 與 GPT-5 優劣分析
角色定位
4.5 點子王 / 概念藝術家
5 總設計師 / 項目經理 4.5擅長提出驚艷的核心概念;
5擅長將概念落地並系統化。

思維模式
4.5發散優先,快速迭代 5 結構優先,深度挖掘 4.5能快速產出多個高概念點;
5能將一個點子打磨成一個完整的世界。

語言風格
4.5 激情、煽動、富於想像
5 嚴謹、清晰、富有層次 4.5的文案更適合做宣傳或預告片;
5的文本更適合做設定集或背景資料。

側重點
4.5「為什麼這個點子很酷」
5「這個世界如何運作」 4.5著重於創意的衝擊力

5重於世界觀的內在邏輯和可信度。

完成度
4.5 高概念草案(High-Concept Draft)
5 可執行模組 (Actionable Module)
拿到4.5的草案,創作者還需自己填充大量細節;
拿到5的模組,創作者可以直接開始寫故事。

結論:兩種模型更像是處在創作流程的不同階段。這並不是一個簡單的「誰更好」的問題,而是它們在創作流程中的分工不同。

GPT-4.5 的表現,像是一個極富才華的編劇在項目初期進行的「腦力激盪會議」。他拋出了最核心、最閃亮的創意,點燃了所有人的熱情,並確定了整個故事的基調。他的任務是「啟發」。

GPT-5 的表現,則像是這個項目被批准後,由首席世界觀設計師帶領團隊完成的「詳細設定集」。他接過那個核心創意,然後嚴謹、細緻地構建出這個世界運轉的每一個細節,確保一切都有據可查、邏輯自洽。他的任務是「建造」。

總體來看,GPT-5展現出的能力更加全面和高階。 因為它不僅具備提出核心創意的能力(如第一篇「死亡之海」),還具備將其系統化、細節化並轉化為可用故事素材的超強整合能力(如第四篇)。而這篇GPT-4.5的作品,雖然創意十足,但其展現的能力更偏向於創作流程的前期階段。

對於一個創作者來說,最理想的AI夥伴,或許就是一個能像GPT-4.5一樣迸發靈感,又能像GPT-5一樣將靈感落地實現的「全能選手」。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 121.2.243.171 (日本)
PTT 網址

※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:26:20

aaice 08/10 16:25這排版是GPT-4o還是GPT5?

這兩篇都是Gemini 2.5 pro寫的,我剛才用手機直接貼上沒整理。

※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:46:16

driver0811 08/10 17:145資料庫到2024 年 6 月 4o到 23年10

driver0811 08/10 17:14月光這點就值得了

driver0811 08/10 17:15如果有一個是昨天的資料庫就整鍋端去

driver0811 08/10 17:15

driver0811 08/10 17:15長門有希

driver0811 08/10 17:20核電真的不需要討論

nikecoming 08/10 18:13推,還在適應gpt-5 ,直覺是強很多,

nikecoming 08/10 18:13主動檢查弱點和可優化方案,並且會交

nikecoming 08/10 18:13叉比對來源資料,雖然不是每次都正確

nikecoming 08/10 18:13,但比情緒價值高的4o應該會更實用,

nikecoming 08/10 18:14貼回去給Gemini 看,Gemini自己直接

nikecoming 08/10 18:14甘拜下風