Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」

aPplAus 發表於 2024/4/10 下午8:38:57

看板Stock標題Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」作者

aPplAus

(燦爛)時間Apr 10 20:38:57 2024推噓18 推:19 噓:1 →:11

PTT評價

原文恕刪

小弟剛好最近有跟到一些台灣LLM的發展，可以補充一下關於模型的部分。聯發科的研究單位聯發創新基地，做語言模型有一段時間了，之前有一版Breeze-7B模型，發佈了一篇技術論文放在arxiv：

https://arxiv.org/pdf/2403.02712.pdf

論文提到這個模型是從mistral-7B 繼續訓練而成，花了7000小時的H100，灌了650GB的data。如果有一半是中文，325GB，也灌了超過1000億漢字（3bytes=1word)，其實很多了啦。

然後Breexe是從Mixtral訓練而成，是更大一級的模型，論文好像還沒出，但很多公司都有不同大小的模型，做法應該不會差太多（？）。最近有開放API試用：

https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1

跟ChatGPT的比較，最重要的點應該是，像Breeze-7B這種已經開源的模型，對能架伺服器的公司來說，是用越多越賺；跟token收費的ChatGPT 用越多越貴截然不同。Breexe不知道會不會開源就是了。

達哥的部分，沒有親自用過，但有認識的人用過。基本上就是平台，然後有一些功能，像是讀pdf等等。就把AI推廣給更多人的東西，應該是不錯啦。

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.35.85 (臺灣)

※ PTT 網址

推

stlinman 04/10 20:42開源的 Breeze-7B 我是玩一下過，感覺還不錯!

→

stlinman 04/10 20:43 試

推

tomdavis 04/10 20:43推介紹!

推

addy7533967 04/10 20:48推推

推

xm3u4vmp6 04/10 20:50一看到h100 直接冷掉一半人根本玩不起QQ

推

Sixigma 04/10 20:52做隔壁專業的，好奇這樣子也會有 emerging ability

→

Sixigma 04/10 20:52嗎，其實它變單一語種而且是繁中，和原始模型不能算

→

Sixigma 04/10 20:53同個東西了吧，而且英語的普及度又遠大於繁中，很多

→

Sixigma 04/10 20:54問題會受限吧，那個benchmark和GPT3.5也差一截

噓

damn1120 04/10 21:00可以幫文組翻譯嗎救命-.-

推

stlinman 04/10 21:05重點是企業設置私有AI模型運用，要能合規法循。所以

→

stlinman 04/10 21:06繁中未來還是有一定的市場可以開發。

推

turndown4wat04/10 21:08這樣發哥明天是漲還是跌?

推

avali 04/10 21:15聯發哥2000

推

Morphee 04/10 21:21這東西開發跟上好處很多值得值得

→

Morphee 04/10 21:21受限沒關係啊跟上就好

推

bj45566 04/10 21:29Mistral AI 這家法國新創有前途啊，微軟都要琵琶別

→

bj45566 04/10 21:29抱了

→

bj45566 04/10 21:30發哥有眼光

推

napyang 04/10 21:35個人覺得繁體中文最強的開源就是breeze 7B了，回答

→

napyang 04/10 21:35的都滿好的。

推

fukku100 04/10 21:56特點除了繁體，可以針對臺灣的內容回答得不錯

推

Isopod 04/10 22:00達哥也不是功能啦，大部分就是挑好model然後寫好pro

→

Isopod 04/10 22:00mpt來做各種事情

推

coffee112 04/10 22:04推推

推

Ken52039 04/10 22:05未來股王

推

stevegood 04/10 22:41講實話工作上能用很不錯

推

wayne0530 04/10 23:06繁中最大資料庫，是否能用ptt內的文章來灌進去訓練

推

Surrey00 04/11 00:29推推

推

qwe78971 04/11 01:19果然是拿開源拿來改== 給我一台H100 我也行

→

greatwu 04/11 07:22聞西，要你命3000，訊號來了

同系列文章

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」

```
 2 
```
Arim：說真的，發哥做這種東西，我是一點都不期待，以我試過各種開源的 LLM 的經驗來看，幾乎都稱不上通用，唯一可以稱的上通用的就 gpt-4 跟 claude3，開源的模型基本上跟垃圾沒兩樣你說要收費也還好，你架 server 跑開源的模型難道不用花錢？而且 gpt 的收費有個頃向是越來越便宜了，負載平衡都幫你做好了，說真的現在商用解決方案用開源的模型我真的還沒看過，因為真的用起來的感覺跟 gpt-4 差太多了，不是一直跳針就是答非所問然後 gpt-5 應該也快出來了，gpt -4 大概率又會大降價這東西的霸主應該還有很長一段時間會是 openai 啦，發哥還是專注在本業卡實在 -----

其他人也閱讀了

PTT 熱門相關