PTT評價

[爆卦] Mistral Small 3模型發布比OpenAI更快更好

看板Gossiping標題[爆卦] Mistral Small 3模型發布比OpenAI更快更好作者
Sidney0503
(Sidney0503)
時間推噓 8 推:8 噓:0 →:10

Mistral Small 3模型發布 比OpenAI和Google類似產品更快更好

歐洲領先的 人工智慧公司之一 Mistral AI 推出了一款名為 Mistral Small 3 的新模型。這是一個包含 240 億參數的模型,但與 Llama 3.3 70B 和 Qwen 32B 等大型模型相當(至少在 MMLU-Pro 基準測試中)。它不僅運行速度與 Llama 3.3 70B 不相上下,而且速度更快。

ChatGPT 上最常用的模型是 GPT-4o mini,它是使用者用完 GPT-4o 請求後的備用模型
。 Mistral Small 3 的效能比這個 OpenAI 模型更好,據說延遲也更低。

Mistral AI 介紹說:"我們在Apache 2.0 下發布了預訓練和指令調整的檢查點。檢查點可以作為加速進展的強大基礎。需要注意的是Mistral Small 3 既未使用RL 也未使用合成資料進行訓練,因此與Deepseek R1(一項偉大而互補的開源技術!)等模型相比,它在模型製作流程中處於較早階段。採用和定制它。

作為一個偏小型的模型,如果你的電腦配置較高,也有可能在自己的電腦上本地運行它
。 Mistral AI 表示,它可以在單塊NVIDIA RTX 4090 顯示卡或配備 32GB 記憶體的
MacBook 上運行。

雖然該機型在 MMLU-Pro 基準測試中的表現優於上述其他機型,但它並不總是人類評估人員的首選。 Mistral 在一組超過 1k 的專有編碼和通用提示中將其模型與其他模型進行了比較。研究發現,與 Gemma-2 27B 和 Qwen-32B 相比,Mistral Small 3 是首選方案,但與 Llama 3.3 70B 和 GPT-4o mini 相比,Mistral Small 3 的首選度較低。


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.228.105.143 (韓國)
PTT 網址

Kazmier 02/01 04:38一堆人照抄就好

duriamon 02/01 04:39三小啦!呵呵!

HowLeeHi 02/01 04:40AI開源三本柱之一

johnhmj 02/01 04:57法國人做的 只是才剛開始

johnhmj 02/01 05:00而且還不能生成圖片 但是可寫程式

darkMood 02/01 05:03腦殘無能造謠雙標雜種人渣垃圾民進黨

cccict 02/01 05:04如果是生湯婆婆那種圖片的Ai,我寧願人類

cccict 02/01 05:04從未發明

HowLeeHi 02/01 05:05樓上它不是有個生圖按鈕嗎?

HowLeeHi 02/01 05:05john大

IDfor2010 02/01 05:05法國 上次才失敗一個由國家支持投入政

IDfor2010 02/01 05:06府預算資金的 Lucie而已

xoxo8 02/01 05:10遲早會被唐鳳攻破不用怕啦

error405 02/01 05:14歐洲總不會不給問六四吧 需要攻嗎

Iamtitlehgm 02/01 05:55給問納粹嗎?

BrandonMai 02/01 07:53反觀鬼島

bosmin100 02/01 08:27鬼島忙著花幾百億預算大內宣殺豬公呢

bosmin100 02/01 08:27難怪拿錢的甚麼話都敢講