PTT評價

Re: [新聞] ChatGPT-5波折超乎想象!奧特曼急回應:

看板Stock標題Re: [新聞] ChatGPT-5波折超乎想象!奧特曼急回應:作者
strlen
(strlen)
時間推噓14 推:17 噓:3 →:37

放大假閒來無事
正好一堆AI公司推新品
無職碼農就再來測試測試

半年前DS之亂時
測過讓各家AI寫一個註冊頁
現在我把同樣提示詞再讓各家AI做一次
看看有多少進步

Gemini 2.5 pro:
https://thelonesomeera.com/signuptest/gemini.html

ChatGPT 5 thinking:
https://thelonesomeera.com/signuptest/chatgpt.html

Claude sonnet 4:
https://thelonesomeera.com/signuptest/claude.html

Grok 4 Heavy:
https://thelonesomeera.com/signuptest/grok.html

Deepseek R1:
https://thelonesomeera.com/signuptest/deepseek.html

Qwen:
https://thelonesomeera.com/signuptest/qwen.html

以上提示詞都完全一樣
各家表現大差不差
但多多少少都有些小bug
這部份就算大家都進步到差不多的程度

既然過了半年
那就要有相對應更進階的測試 對吧?
所以這次追加了以下提示詞

「請使用 HTML 前端技術
製作一個模擬太陽系的網頁
相關程式請集中在一個 html 檔案」

Gemini 2.5 pro:
https://thelonesomeera.com/solarsystem/gemini.html

ChatGPT 5 thinking:
https://thelonesomeera.com/solarsystem/chatgpt.html

Claude sonnet 4:
https://thelonesomeera.com/solarsystem/claude.html

Grok 4 Heavy:
https://thelonesomeera.com/solarsystem/grok.html

Deepseek R1:
https://thelonesomeera.com/solarsystem/deepseek.html

Qwen:
https://thelonesomeera.com/solarsystem/qwen.html

喔喔喔
這個需求就蠻有鑑別度了
大家可以自己比較一下呵呵

方便瀏覽的集成頁:
https://thelonesomeera.com/ai-hub.html

最後是股點
這樣測下來
有點讓我想出掉狗家股票勒
狗狗
加油
好唄?
嗯.....

備註:
以上網頁完全沒有寫到任何一行程式碼
全都是複製貼上
應該說我連看都沒看...

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.12.18 (臺灣)
PTT 網址
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:15:12

lianli1024 08/10 15:15狗家在幹嘛笑死

LDPC 08/10 15:17QQ 好強 大大

碼農吃飽太閒而已 不強 QQ

※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:19:27

ga0952briel 08/10 15:20狗家還以為是太陽要把大家吃掉XD

sdbb 08/10 15:21好強,謝謝,好險上週沒有加碼googl

sdbb 08/10 15:22或說各家各有擅長

LDPC 08/10 15:22前陣子西洋棋大賽 狗狗被grok幹掉了QQ

LDPC 08/10 15:23https://reurl.cc/axLEaD

capssan 08/10 15:35我覺得辦比賽一定是未來AI的看點之一

capssan 08/10 15:35問題就是要辦什麼比賽了

sdbb 08/10 15:38Ani跳啦啦隊大賽

KANGTA23 08/10 15:39臭谷狗就是噓而已沒啥好說了,比柵欄仔還不如

哥 狗我也有持骨齁...

TaiwanUp 08/10 16:02GPT的還是最完整 軌道可以縮放 只是太陽大小不會變

TaiwanUp 08/10 16:03軌道縮太小會像是類地行星都被太陽包覆

TaiwanUp 08/10 16:03GPTc96u.3

TaiwanUp 08/10 16:05GPT還有時間 冥王星勾選

TaiwanUp 08/10 16:08能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini

※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 16:09:53

TaiwanUp 08/10 16:10我看到的Qwen永遠九星連珠

lavign 08/10 16:22棋類完全資訊遊戲都有先手優勢,不讓子或雙循環根

lavign 08/10 16:22本不準

eemail 08/10 16:28就出一題而已

tw19930419 08/10 16:31到時候Google又有更強模型出來,然後配他的全家桶

tw19930419 08/10 16:31你只能哭在路邊

watashino 08/10 16:39用同一個prompt不一定是個好主意 能看看具體的promp

watashino 08/10 16:39t嗎

TaiwanUp 08/10 16:45只有GPT軌道稍微正確 其他的九軌道都等距 不合理

mamorui 08/10 16:58我現在用Cloude

qxpbyd 08/10 17:03Gemini2.5pro你是用AI Studio的還是Gemini版的?

champion092208/10 17:03一直撞一直爽

qxpbyd 08/10 17:03我用你的prompt 太陽系不會錯成那樣

stepnight 08/10 17:07窩只能說寫Code,Gemini 就是一坨

jerrychuang 08/10 17:22可是notebooklm很好用耶

TameFoxx 08/10 18:18Gemini強項就不在coding

maplefff 08/10 18:24這種題目沒有辦法體現Gemini 2.5 Pro 1M上下文優勢

maplefff 08/10 18:25等到你的專案足夠複雜, 足夠大, 其他模型如同不停

maplefff 08/10 18:25失憶的新人, 必須反覆閱讀技術文檔, 你就知道差距了

lavign 08/10 18:30有限空間解的問題測試才能知道基本推理能力的強弱

maplefff 08/10 18:34這種問題等於考99x99乘法表來考驗哈佛,劍橋,史丹佛

maplefff 08/10 18:34數學博士生的數學能力. 除了顯示誰99x99乘法表背得

maplefff 08/10 18:35熟以外, 跟數學能力根本無關

Adrian 08/10 19:11Gemini 畫圖很不錯 其他爛爛的

Atwo 08/10 20:05很有趣耶 讓我想試做看看托勒密的地心說模型

KTFGU 08/10 21:34寫程式不要用google

medama 08/11 00:46沒有冥王星嗎

donkilu 08/11 02:37Gemini真的很搞

Toge 08/11 07:27Gemini喔,去 reddit 找一堆崩潰圖,還會給你刪 co

Toge 08/11 07:27de 呵呵

Toge 08/11 07:31之前用它還直接給我 git reset --hard,幹

cvn21 08/11 09:10Gemini 適合做大量重複無聊的工作,比如說提取超長

cvn21 08/11 09:10文中出現多次,不同但有一定特徵的資料

cvn21 08/11 09:10這種用GPT 都會偷懶,找個三四個就開始瞎掰

cvn21 08/11 09:12用在研究上把亂七八糟raw data轉換成表格還行,這種

cvn21 08/11 09:12超無聊的工作用GPT從來沒弄好過

staytuned74 08/11 11:16你把題目換成解微積分給他pdf 考古題,最強可能就

staytuned74 08/11 11:16變成pro2.5了

staytuned74 08/11 11:18其他家可能解兩題就開始像上面講的偷懶不解了

staytuned74 08/11 11:19然後gpt5 現在糟糕到吃不進去非文字解析pdf 其他家

staytuned74 08/11 11:19都可,就知道出多大包了