[討論] OpenAI GPT o1模型

NTHUlagka 發表於 2024/9/17 上午10:14:50

看板Tech_Job標題[討論] OpenAI GPT o1模型作者

NTHUlagka

(拉卡)時間Sep 17 10:14:50 2024推噓38 推:38 噓:0 →:33

PTT評價

https://openai.com/index/learning-to-reason-with-llms/
上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1
宣稱模型有更強大的思考能力
o1在回答之前會深入思考產生內部的推理練

結果就是o1模型在各個人類頂尖領域獲得相當好的成績

o1數學方便相當於美國奧林匹克AIME前500名的選手

程式方面位居Codeforce前11%
上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranking/
以12分鐘通關

在物理生物化學領域(GPQA)已經超過人類博士的程度

對科技業比較相關的是看來以後線上面試考白板題
可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊但如果是OA好像就無法可防了

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣)

※ 文章網址:

https://www.ptt.cc/Tech_Job/E.TCIP1DD0pjVQ

推

mydear3310 09/17 10:22太興奮了看成OL模型

推

hips 09/17 10:29現在可以解3.11vs3.9哪個大了嗎？

推

koushimei 09/17 10:42但是沒辦法貼圖片或者附檔比較麻煩

→

somerabbit 09/17 11:23搭配cursor使用 ng立刻變senior level

推

lemonsheep 09/17 11:29不用防吧以後就不用考白板題啦

→

lemonsheep 09/17 11:29Gpt 已經比99%的面試者強了

→

lemonsheep 09/17 11:29以後只剩know how比較重要了

這樣看來白板題八股文是不是要走入歷史了以後也不用刷題了只是是說這些know how未來也會被GPT取代吧現在都已經能達到這個程度了 SWE以後可能就是負責下指令然後幫gpt review吧

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:35:00

推

HiHiCano 09/17 11:45軟工刷題仔逝去

→

HiHiCano 09/17 11:46還好台灣大部分是不用刷題的硬體工作

推

musashi023 09/17 11:46leetcode這種陋習早該下去了

推

Wishmaster 09/17 11:51gpt的知識量真的屌虐,自己研究個東西可能要兩三小

→

Wishmaster 09/17 11:51問一下答案直接套用,雖然不能每次都work也夠了

推

HiHiCano 09/17 11:52軟工的知識在網路上太多了很容易訓練

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:58:58

推

reprobate 09/17 12:04看什麼時候能讓我當甲方直接開需求就把軟體含UI都

→

reprobate 09/17 12:04寫好

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 12:08:38

推

NTUCS5566 09/17 12:41好像網頁製作可以正確產生 bilibili有人測試

→

NTUCS5566 09/17 12:41直接提需求 code直接寫完成品網頁直接產生

→

NTUCS5566 09/17 12:42但我走FW的看不懂他們在幹嘛感覺有點厲害就是了

推

darkangel11909/17 12:43先拿台灣學測的數學戳戳看

推

MAGICMCGRADY09/17 12:45刷題其實不算陋習

推

MAGICMCGRADY09/17 12:49台廠聊天面試比較像陋習

推

yoyoyolin 09/17 13:03以前就說了，現場考實作題比較有鑑別度。考那個leet

→

yoyoyolin 09/17 13:03code 還不如直接挑本科系人選就好。

→

yoyoyolin 09/17 13:05考實作題本科系還不一定答的出來。

推

MAGICMCGRADY09/17 13:07還好啦，面試還會考系統設計那才是定級的關鍵

→

MagicMomo19 09/17 13:42是說還真的把整份需求丟上去過，寫是寫的出來但是畫

→

MagicMomo19 09/17 13:42面醜爆，有資安檢測也不可能過的那種，頂多就是單一

→

MagicMomo19 09/17 13:42功能能跑能動，可是串不起來整個流程這樣

推

lemonsheep 09/17 13:43系統設計大部分人也都是唸書本上的再想辦法兜啊只

→

lemonsheep 09/17 13:43要是套現成系統性的知識99%的人都贏不了gpt 的只

→

lemonsheep 09/17 13:43剩最後1%真的能做開創性東西的人才還有一席之地

推

sy2es6404 09/17 13:50https://reurl.cc/OrRqaX 新智元這篇報導說o1 門薩

→

sy2es6404 09/17 13:50測驗IQ超過120

推

ejnfu 09/17 13:53刷題慢慢式微也不錯，本來太偏重刷題也不太正確

→

yunf 09/17 13:55沒差吧他們應該會調整難度

→

yunf 09/17 13:57畢竟真的問題他解不了

→

yunf 09/17 14:06上次有個門薩的說pchome會倒閉後來也沒有

推

yueayase 09/17 15:57其實這些工具出來，即使取代了一些功能，總有別的方

→

yueayase 09/17 15:57面可以去努力吧

推

strlen 09/17 16:42還考啥？連職缺都可以關一關了喇

推

rodion 09/17 17:04不能驗證自己說出口的話就依舊只是高級 google搜尋

推

a9101214 09/17 17:54好猛喔拉卡

推

create8 09/17 18:41也進步太快了…

推

andy810306 09/17 19:41雙週賽Q4解法醜到爆，這絕對過不了面試的放心

推

hobnob 09/17 20:10我分享一下我寫1000多題的心得啦，講好聽是單純講

→

hobnob 09/17 20:10難聽是死板，幫你複習大學學過的資結演算法而已，去

→

hobnob 09/17 20:10想我們用的工具哪個不是以資結與演算法為基本的？

→

hobnob 09/17 20:10不知所以然的人還是很多啦，不要說刷題面試是陋習，

→

hobnob 09/17 20:10題刷不好才有問題

推

hobnob 09/17 20:13但是週賽是competitive programming，題目本質跟面

→

hobnob 09/17 20:13試有差

推

dont 09/17 20:32真要防只能回歸疫情前 onsite都進公司考白板題了吧

推

steak5566 09/17 21:47應該會回歸真的on site 然後很多場擠在同一天這樣

推

VScode 09/17 22:01以後應該會優先考system design了

推

shortoneal 09/17 22:10是說copilot最近變好笨，有甚麼方法可以重製嗎

→

shortoneal 09/17 22:10他會auto complete一些別的repo的structure...蝦寫

→

shortoneal 09/17 22:10一波

推

bitcch 09/17 22:22以後測驗大概會變成看你是否能理解除錯AI生成的答案

→

bitcch 09/17 22:23以及如何用最佳的prompt來快速建構出程式碼

推

AudiA4Avant 09/17 22:53說真的,AI寫題這麼強的情況下,以後考算法絕對不是現

→

AudiA4Avant 09/17 22:53在這樣

→

AudiA4Avant 09/17 22:54甚至 system design prompt 下對的情況,也能在很短

→

AudiA4Avant 09/17 22:54時間內透過互動得到一個還行的架構

→

TSMCfabXX 09/17 23:57HTML 碰到特殊字元還是不行

推

dj025258 09/18 07:40聽休學後待業超過10年的人談論努力，真是醍醐灌頂，

→

dj025258 09/18 07:40謝謝開示

推

nxuanr 09/18 09:09ai 會解決一切問題

推

X28338136X 09/18 15:54所以現在會寫verilog 了嗎

推

Izangel 09/18 18:39Nvda內部就有verilog生成器了好嗎

推

aasssdddd 09/19 09:554o 9.11>9.9 o1 9.9>9.11 但明顯算比較久

推

Izangel 09/19 10:31你先提示他9.11跟9.9是純數字，就不會算錯了啦

同系列文章

Re: [討論] OpenAI GPT o1模型

其他人也閱讀了

PTT 熱門相關