[心得] ChatGPT and DS 數學問問
想不到他們都有一樣的錯誤跟邏輯脈絡呢~
deepseek是我中午看到別人測試,我從網路抓下來的圖。ChatGPT是我剛剛拿第二隻手機測試的。
後面的故事耐人尋味啊
https://i.imgur.com/w2sdwx0.jpeg
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.64.120 (臺灣)
※ PTT 網址
噓
這舉例慘不忍睹
推
開啟r1就不一樣了
→
完全正確的回答http://i.imgur.com/
→
qcdPlj7.jpg
→
可惜來不及註冊r1,不然我也想試試
推
延伸Lexicographic order看看?
→
這個吵很久了,就問法的問題
噓
真的是廢文
推
剛剛試R1,是對的但太話撈,GPT是錯
→
的
推
如果是版本號的話這邏輯沒錯啊
推
r1 要和 o1 比才公平吧
推
ds r1要對標o1,o1的回答是對的且完
→
整(不過花1分鐘左右),甚至o1mini
→
也對而且只要1秒
噓
又來了
→
還是先教會那些模型大小跟加減乘除
→
的意義吧,明顯不懂大小跟減法關聯
推
如果是版本,不會用‘大’這個詞形
→
容
→
不要連中文基本語法都ooxx
噓
我問ChatGPT 是 3.9 > 3.11
噓
柵欄壞了
推
老梗錯誤了 早期很多模型都有這種
→
錯,chatgpt3.5 ,o1回答正確,cha
→
tgpt4o錯誤
爆
[問卦] ChatGpt 跟DeepSeek 互吹的文章大家比較如題啦 卡唬我用了ChatGpt跟DeepSeek互寫吹捧對方的文章 生成的結果如下 1.ChatGpt59
Re: [新聞] DeepSeek低成本破壞價格 恐讓AI產業血流又是我 大過年無聊的AI測試碼農 有人說到解決問題 是吧? 然後deepseek r1![Re: [新聞] DeepSeek低成本破壞價格 恐讓AI產業血流 Re: [新聞] DeepSeek低成本破壞價格 恐讓AI產業血流](https://g0v.hackmd.io/images/media/HackMD-og.jpg)
11
[問卦] 這樣算Deepseek贏chatgpt嗎?以上 chatgpt![[問卦] 這樣算Deepseek贏chatgpt嗎? [問卦] 這樣算Deepseek贏chatgpt嗎?](https://i.imgur.com/LfmcTbpb.jpeg)
11
[問卦] 為什麼我的deepseek不能問Taiwan ?看到版上說deepseek的強大功能後, 馬上就來測試幾個問題, 速度明顯高於chatgpt一個層次 但是當我輸入Taiwan後, 出現了幾行英文字好像提到了PRC and ROC 然後..... 就答案不見了 隨即出現![[問卦] 為什麼我的deepseek不能問Taiwan ? [問卦] 為什麼我的deepseek不能問Taiwan ?](https://i.imgur.com/XAdc1pZb.jpeg)
6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI![[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt [爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt](https://i.imgur.com/Zo1PKXwb.jpg)
6
Re: [問卦] 青鳥:DeepSeek就是盜版的ChatGPT!也許是盜版,但是我很確定deepseek比chatgpt更適合華人使用 我每隔半年都會用一個問題測試chatgpt訓練的效果 "請解釋如來神掌是什麼" 每次chatgpt都回答錯誤,即使到剛剛我去測試,答案都是 源自於香港漫畫家倪匡(本名曹達華)畫的漫畫,5
[問卦] chatgpt o3會打爆deepseek嗎?OpenAI執行長上週 在DeepSeek R1論文發表的隔天 宣布一月底要公開o3和免費仔用的o3-mini 連比DeepSeek R1強的chatgpt o1都被打得好慘 這是不是圖窮匕現的殺招![[問卦] chatgpt o3會打爆deepseek嗎? [問卦] chatgpt o3會打爆deepseek嗎?](https://i.imgur.com/evm3YQlb.jpeg)
1X
Re: [請益] Deepseek v3 對台積電有影響嗎deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦 Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的 而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的 你以爲這兩個小例子能推翻什麽嗎XD 由於低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未來非常可期。4
[問卦] 天啊!Deepseek的數學解題力真的比較強!我隨便丟了張網路上抓的數學題給Gemini ChatGPT Deepseek 結果Deepseek好快就連計算過程都有的解出來了!而且正確! 相對Google的Gemini...什麼爛東西! 以後作業作不出來就丟給Deepseek! 哈哈!爽死你們這代學生了!![[問卦] 天啊!Deepseek的數學解題力真的比較強! [問卦] 天啊!Deepseek的數學解題力真的比較強!](https://i.imgur.com/8AJa2mgb.png)
4
Re: [閒聊] 顯然DeepSeek沒什麼料[恕刪] 我覺得比較奇怪的一點, 就是DeepSeek的相關測試, 都會提到DeepSeek擅長中文, 而且對詩詞造詣頗高,在這兩點上勝過ChatGPT![Re: [閒聊] 顯然DeepSeek沒什麼料 Re: [閒聊] 顯然DeepSeek沒什麼料](https://i.imgur.com/KxEVOCFb.jpg)