PTT評價

Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

看板Stock標題Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預作者
strlen
(strlen)
時間推噓11 推:11 噓:0 →:25

很多人看著benchmark多高多高吹滿天
如果你也是個老電腦玩家
就知道評測基本只能當參考

老黃前陣子在大會上拿出新的遊戲顯卡5070說對標4090
新玩家們個個目瞪口呆
老玩家們則是
https://i.imgur.com/Sxb1f15.jpeg

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

評測數據嚇死人
實跑遊戲笑死人
然後再來怪優化不佳
這種我們中老年都看多了
講那摸多
不用不用
實際動手玩
就知道惹

反正大過年的
閒著也是閒著
就來實地評測AI

也不用拿什麼多複雜難解的數學題
就拿前端碼農拿到設計圖要切版就好
最實際在工作上會用到

https://i.imgur.com/sLl860H.jpeg

這是網路上找到的一個簡單的註冊網頁設計圖
目標是把圖丟給AI
叫它照著圖寫程式
然後要有基本的驗證輸入欄位功能
像是你email沒填
或是密碼格式不對要檢查之類的

我的提示詞如下:

使用html css javascript網頁前端技術
請完全依照設計圖
製作一個註冊頁面
網頁裡各項欄位必須在驗證是否留空
密碼欄位需驗證是否至少含有一個大寫字母及一個特殊符號
驗證未通過在欄位右方加入提示方塊

接著各家AI產出的結果如下:

Gemini 2.0 Flash Thinking Experimental
https://thelonesomeera.com/signuptest/gemini/

ChatGPT o1
https://thelonesomeera.com/signuptest/chatgpt/

Claude 3 Haiku
https://thelonesomeera.com/signuptest/claude/

DeepSeek R1
https://thelonesomeera.com/signuptest/deepseek/

大家可以自己進去玩一玩比較一下
這些都是AI產出的我一行程式碼都沒有改完全複製貼上
然後也沒有串接後端程式和資料庫所以你真的點Sign Up也不會紀錄任何資料
懂程式的可以自己右鍵檢查看code或直接下載回去研究

結論是我想我還是繼續用ChatGPT好了
Gemini那個新模型四天前剛出
總算是有進步了
然後皮皮鬼也有去給川皇下跪
GOOG現在可以考慮進場...吧?

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.31.248 (臺灣)
PTT 網址

MoonCode 01/25 17:44你倒是講一下差異

itwt 01/25 17:46差異自己測一下就知道吧...

iaminnocent 01/25 17:52CHATGPT 跟Claude是真的有規則的,沒有達成規則會

iaminnocent 01/25 17:52跳出提示,Chatgpt填寫完成還有註冊成功訊息XD

iaminnocent 01/25 17:54deepseek的R1我剛剛也有跟ChatGPT o1進行同問題測

iaminnocent 01/25 17:54試,在路徑規劃問題上O1推理得到正確路徑,R1則是

iaminnocent 01/25 17:54完全錯誤,另外毒藥問題上也是O1回答比R1好

Lenon4561 01/25 18:10聽君一席話 如聽

silveriii 01/25 18:46Claude Sonnet比較強 Haiku是來聊天的

karcher 01/25 19:34Gemini連切版都會,感覺web前端快失業

karcher 01/25 19:37看來要找工程師直接找全端了

INIKS 01/25 20:16功能普通,不支援圖形語音,這種文字模型不是到處都

INIKS 01/25 20:16是嗎?

INIKS 01/25 20:16一看價格.....真香!

newyorker54 01/25 20:38你不要這麼專業好不好,中吹會崩潰

ohha0221 01/25 21:02但價錢差很大 一分錢一分貨 XD

ActionII 01/25 21:16這個就是對岸擅長的啊,雖然你的比較好,但我的巨

ActionII 01/25 21:16便宜

ActionII 01/25 21:18這種東西落地就是要看成本,這東西只有一半好用但

ActionII 01/25 21:18成本差了幾個數量級

ActionII 01/25 21:19那些meta 的人恐懼的不就是這樣嗎

ImHoluCan 01/25 21:28小米蘇7是保時捷沒錯

yumumu 01/25 21:35推,不過你Claude怎麼拿Haiku,應該拿Sonnet吧

它說現在流量太高免費仔暫時停用 等開放再測一次

TaiwanUp 01/25 22:12一拳超人 美中的差距就在這裡

ken85 01/25 22:21飛彈很精準好用 但是決定戰場的是便宜的無人機吧~~

※ 編輯: strlen (118.169.31.248 臺灣), 01/25/2025 22:23:13

doubi 01/25 23:46Claude 寫程式一定要選 Sonnet, 真心不騙

doubi 01/25 23:47成功率比 ChatGPT 好很多

doubi 01/25 23:47Deepseek 的 Code 我沒有一次採用 ...

doubi 01/25 23:47但是文書處理 DeepSeek 蠻好用的

AudiA4Avant 01/25 23:52Deepseek的降本架構拿去改良Meta的Model,不會讓meta

AudiA4Avant 01/25 23:53更強嗎?

TaiwanUp 01/25 23:58DS證明偷工減料果然行不通 仍須更多基礎設施投資

ActionII 01/26 00:04無人機是超乎想像好用,但傳統精準武器還是決定戰

ActionII 01/26 00:04場啊

TaiwanUp 01/26 00:12電詐好用 要牆內外買單訂閱還是免了