PTT評價

Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大

看板Gossiping標題Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大作者
FuYen
(赴宴)
時間推噓 1 推:1 噓:0 →:3

※ 引述《imhan705 (最後也就睡了)》之銘言:
: 剛推出出來的時候我拿了幾題邏輯題出來考他
: 正確率很高我很驚喜覺得太神啦
: 剛剛看到下面推文
: 說他答不出來9.9跟9.11誰比較大
: 我想說不可能這麼簡單的答不出來吧
: 就測試了一下 結果…下面是我的對話
: 真的答不出來 我還試著引導他用程式來解決
: 但完全沒有幫助
: 這代幻覺好像更嚴重了 連你質疑他都不會想改答案
: 我相信未來能解決的 我比較擔心一些人開始依賴他把他當google 他們會逐漸喪失辨別真偽
: 的能力 AI輸出什麼就是什麼 AI犯錯不可怕 可怕的是犯錯了沒人知道他犯錯了
: https://youtu.be/4EayaPNo6pk?si=XPOsISjXtbvi7cQA

AI不只可以考試,現在AI甚至可以當科學家,

會自己訂研究題目、實驗、寫成論文再自己審查。

看看這篇文章:

--

AI 自己寫論文、自己審查?日本 Sakana AI 推出「AI 科學家」

各位鄉民大家好,今天要跟大家介紹一個超酷的東西,就是日本 Sakana AI 公司開發的「AI 科學家」!

你可能會想,AI 科學家?是 AI 穿上白袍做實驗嗎?當然不是啦!其實「AI 科學家」是一個可以自動進行科學研究的 AI 系統,而且厲害的是,它可以用大型語言模型(LLM)自己寫論文,甚至自己審查!

那「AI 科學家」到底是怎麼運作的呢?

首先,它會先從一個研究主題開始「腦力激盪」,探索各種不同的研究方向。
比如說,給它一個關於機器學習的開源程式碼範本,它就可以開始發想各種研究方向。
它還會自動搜尋學術論文,確保它的想法夠新穎!

有了想法之後,它就會開始設計實驗、執行實驗,並把實驗結果用圖表呈現出來。
接下來,它會參考標準的機器學習會議論文格式,自動撰寫論文,還會自己搜尋相
關論文並引用。

更厲害的是,它還會用另一個 LLM 來審查自己寫的論文,給予修改意見,並且找
出有潛力繼續發展的研究方向!

「AI 科學家」真的這麼神?

Sakana AI 公司做了一個實驗,讓「AI 科學家」研究機器學習領域裡面的語言模型、擴散模型和 Grokking。結果「AI 科學家」真的生出了好幾篇論文! 你們可以點下面的連結去看這些論文:

擴散模型:

DualScale Diffusion: Adaptive Feature Balancing for Low-Dimensional
Generative Models

語言模型:
StyleFusion: Adaptive Multi-style Generation in Character-Level
Language Models
Adaptive Learning Rates for Transformers via Q-Learning

Grokking:
Unlocking Grokking: A Comparative Study of Weight Initialization
Strategies in Transformer Models

雖然這些論文還有一些小缺點,像是會把所有做過實驗都放進去,而不是只放最重要的實驗結果,還有時候對實驗成功原因的解釋會有點小錯誤,不過這些論文真的提出了很多新的研究方向,實驗結果也很不錯!

「AI 科學家」有什麼意義?

「AI 科學家」最厲害的地方就是它可以完全自動化,不需要人類介入! 而且成本超級低,一篇論文的成本只要 15 美金(約台幣 465 元)!

Sakana AI 公司相信,「AI 科學家」可以改變未來的科學研究方式。 它可以像人類科學家一樣,不斷產生新想法、累積知識,而且因為成本低,可以讓更多人參與研究,加速科學的進步!

不知道大家覺得「AI 科學家」怎麼樣?會不會以後真的變成科學家的好幫手呢?


--

這篇研究的網址: https://sakana.ai/ai-scientist-jp/

題外話,這篇文章也是AI寫的。我做的只有把上面的網址丟進NotebookLM

然後叫他寫一篇給鄉民看的文章而已。

https://imgur.com/vaUugcy

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.163.64.142 (日本)
PTT 網址

WenliYang 09/17 03:20感覺沒啥意思 終究是拾人牙慧罷了

ragochen 09/17 03:34如果是指程式的版本號的話,9.11 還真

ragochen 09/17 03:34的比9.9 大

darkMood 09/17 03:46先把癌症搞定再說啦,吹牛比賽喔