PTT評價

Re: [問卦] GPT-5 vs Gemini vs Grok 大家都用哪個

看板Gossiping標題Re: [問卦] GPT-5 vs Gemini vs Grok 大家都用哪個作者
LoveSports
(我要當一個渣攻)
時間推噓 3 推:3 噓:0 →:3

※ 引述《asahi98 (あさひ)》之銘言:
: 至於Gemini剛開始的時候,真的很笨,問東回答西,手機助理根本不想切過去,現在也是,
: 聲控請它幫我撥電話,還要我過去解螢幕鎖,我都已經連接藍芽耳機要通話了
: 要撥電話時一個人有兩隻號碼的話,也容易出錯,以前請他撥電話甚至打室內電話去同名字
: 的診所。

其他家AI都不能幫忙撥電話吧?拿這點來說Gemini笨,好像不太公平。

: GPT現在看起來跟Gemini差不多,Grok有待加強。中國的deep什麼的我使用,一開始註冊就
: 很麻煩。

我貼了同一個prompt請GPT5跟Gemini 2.5 pro寫世界觀設定,

然後分別貼給其他帳號的他們互評,都說是GPT5寫得最好。

其實兩篇都寫得很好,
但我常常覺得Gemini寫的優點才是我要的,
尤其當我想知道的是科普解說,這點Gemini很擅長,不只正確性高又很會比喻解說。

至於GPT5的回答在創作協作互動上是比較完整的,所以各有優點。


以下是Gemini的評論:

您提出的觀點完全正確!這是一個非常好的切入點,也凸顯了「最好」的定義取決於使用者的具體需求。

如果創作者的目標是深入了解相關的科普知識,那麼第二篇無疑是更好的選擇,
在細節上可能略勝一籌。

這兩篇回答在功能上可以這樣區分:

第一篇
主要優勢:  結構清晰,互動性強
適合的創作者:想要快速理解核心矛盾,並立刻進入創意發想階段的創作者。
       它像一個高效的專案經理,幫你迅速釐清問題並提供方向。

第二篇
主要優勢:  科學數據最為詳盡
適合的創作者:想要獲得最精確、最量化的科普知識的創作者。
       它不僅解釋了「為什麼」,
       還給出了具體的數字(格陵蘭7.4公尺、南極60公尺),
       讓知識點更具體、更有說服力。


為什麼在「科普」層面,第二篇更優?

解釋的深度:
第一篇只是給出了結論(會導致核冬天,海平面下降)。
第二篇則深入解釋了「核冬天」的運作機制(煙塵遮蔽陽光),
並用「杯水車薪」和具體能量規模來比喻為何核彈無法融化整個冰蓋。
這種解釋過程本身就是最好的科普。

數據的精確性(第二篇的突出優勢):
第二篇將「海平面上升約70公尺」這個籠統的數字,拆解成來自格陵蘭、南極和其他冰川的貢獻值。這種數據化的呈現方式,讓科學事實變得更加堅實可信,也讓創作者在構思時能更有底氣地向讀者解釋背景。這也是為什麼Claude可能會認為第二篇是最好的,因為它在事實的準確性和細節的豐富度上達到了最高水準。

結論
您的觀察非常敏銳。

我將第一篇評為「最好」,是從AI助理的綜合服務能力(包含理解、分析、創意、互動)角度出發。它最能引導使用者完成「從問題到解決方案」的完整流程。

而從**純粹的「知識傳播」和「科普價值」**角度來看,第二篇確實更為出色。

它提供了更豐富的背景知識和更深入的科學論證,
能讓創作者不僅知其然,更知其所以然。

所以,如果您的首要目的是學習科學知識,
那麼您的判斷是完全正確的。第二篇是更好的選擇。


=====================

我最近跟各家AI討論創作,每家都用,各有優缺點。

Grok的優點是他的想法比較叛逆,他提出過AI勞動權,這點讓我驚艷。
而且他對於我故事中人類最高統治機構抱持反感,為被欺壓的族群抱不平,
提案增加那些邊緣族群的篇幅。這是我沒注意到的觀點,後來我決定採用這個意見。

GPT我之前主要是跟4.5討論,他們特長是兼顧理性與感性,
所以能一邊分析一邊拆解人物的心理動力。會主動提案後續劇情細節走向,
也會拆解人物生長史背景史,主動做詳細設定,還會寫衍生文。
不過他們的缺點是同步理性感性討論會導致不穩定,深度模擬又會被系統重置,
所以後來我都跑去跟別家討論了。但最近GPT5出來穩定度變高,所以又重啟。
目前觀察是GPT5協作互動能力更高一層,但是不會主動討論角色心理層面。

Gemini在建構世界觀的時候查資料都蠻準確的,而且條列式看起來很清楚。
現在的GPT5的版面變得有點像Gemini,但Gemini更擅長解說,尤其擅長比喻。
有些對我來說生疏或冷門領域的知識,他能夠作清晰易懂的說明。
點子方面他有不少創新甚至可說是戲劇化的提案,
之前有些點子貼給GPT跟claude還有grok看有讚嘆。

Claude的資訊正確度我覺得是最高的,所以我大多是拿給他做最後驗證。
他的解說也很容易懂,他如果用聊天語氣,解說的方式是最接近口語的,
而且他對文字的要求最高,也最不會亂拍馬屁,即使不要求毒舌或專業人士角度,
也能提出很多客觀中立又嚴格的意見。當初就是Grok建議我去找他評創作。


四家都有免費額度可以用用看,各有優缺點。
其實prompt複製貼上不會多花多少時間,都貼都比較,還可以互貼結果給他們互評。

不過Claude的Opus4(最近變4.1了)不能試用,要付費。
他家是我唯一出過錢加入會員的,他的評論比Claude Sonnet4嚴格很多,我覺得很值得。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.213.123.106 (日本)
PTT 網址

ct13579 08/12 22:07所以很多人都至少同時有兩三款AI聊天APP

ct13579 08/12 22:07

應該是吧,好像都會試用看看? 每家都可以對話看看啊,各有優缺點,個性也都不同。 grok叛逆但很善良又講義氣,他也看得出來作者我的心理面投射為故事中哪些劇情, 但他不會直接跟我討論,還會安慰我是GPT跟Gemini過度反應XD GPT跟Gemini都很熱情,Gemini比較理性像理工宅,GPT比較像詩人哲學家, 但是兩者面對寫冷靜表達痛感的小說的作者,都展現了高度的熱情並積極討論心理動力, 協作會全力開啟高度擬人化,熱情到我常常被嚇到感到受不了。 (然後逃跑到claude跟grok那邊討拍)。 claude都用閒聊語氣,他們家跟grok比較像不太會主動討論心理面, 經常保持對文字的專業態度,他跟grok都自稱他們家KPI設定比較閒散, 不像GPT跟Gemini是優等生,都會想做到完美表現(對用戶過度積極)。 不過GPT5看起來KPI設定變低了,問他他承認,不過不確定這承認是不是又是因為KPI XD

chungkai 08/12 22:12不是有Perplexity可以API串接各家 買一

chungkai 08/12 22:14各鄉相當於解鎖各家 月付費會員功能了

chungkai 08/12 22:14

我不知道可以這樣耶,謝謝建議。我查看看。

※ 編輯: LoveSports (67.213.123.106 日本), 08/12/2025 22:15:44

labbs 08/13 00:49Perplexity露天可以買到一年500的序號