Re: [問卦] 聽說中研院AI花300萬?
※ 引述《Fortran (Fortran)》之銘言:
: 如題
: 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: 剩下的經費都....?
: 有卦?
阿肥外商碼農阿肥啦!
推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure又快又好用。
Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練config就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azure 8萬就二十萬不到耶!
三百萬真羨慕,我們政府很有錢吶!
嘻嘻
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.46.126 (臺灣)
※ PTT 網址
推
才300萬難怪那麼差 300萬也只夠拍支30秒廣告
推
沒門路就標不到啊 我也是
推
阿你薪水多少?
阿肥算一算自己的工時在外商一天連一萬都不到,好羨慕
※ 編輯: sxy67230 (101.10.46.126 臺灣), 10/09/2023 22:05:41推
阿你怎麼不去跟唐鳳說
推
哪有可能只用一張A100下去跑
7B的連一張A100都吃不滿
※ 編輯: sxy67230 (101.10.46.126 臺灣), 10/09/2023 22:09:38推
除非他們只訓練7b模型 這樣4090一張就夠了
推
其實30秒廣告也不用100萬
→
300萬是可能是大學lab一年計劃的經費
→
中研院端出這種東西,被噴剛好
89
[情報] 前高層建議微軟應該賣掉Office和Windows前高層建議微軟應該賣掉Office和Windows,專心發展Azure雲端業務 janus janus 發表於 2022年1月14日 09:30 收藏此文 微軟前高層本·斯利夫卡(Ben Slivka)在接受一次採訪時表示,微軟應該賣掉其 Windows和Office業務,以便促進其正在不斷增長的雲端業務。 「(微軟)正確的做法可能是把未來押在雲端運算業務上。」曾擔任微軟消費者和商務部46
[瑟瑟] 看色圖不求人Part2 AI生成色圖全教學古拉鎮樓 (從Discord搬運 非本人生成) Part 1 在這 不重要 過時了 這篇將包含所有你生成色圖需要的資訊 1. 使用者界面 Stable Diffusion Webui35
[情報] NVIDIA安培打破16項世界紀錄:一年半性NVIDIA安培打破16項世界紀錄:一年半性能暴增4倍 NVIDIA宣佈,根據最新發佈的MLPerf基準測試結果,NVIDIA在全球市售商用產品中,具備 全球最快的AI訓練性能,並創造了多達16項的世界紀錄。 其中,在加速器的全部八項MLPerf基準測試中,NVIDIA A100都展現了最快的性能,同時23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機13
Re: [情報] CMA為了否決暴雪收購案,寫了400頁報告沒錯微軟雲端很厲害 微軟雲端服務其實不只是運用在微軟自家的XBOX,連索尼也要跟微軟雲端技術合作 微軟雲端服務技術能運用在PS和XBOX,要是微軟再加動視暴雪遊戲,其他雲端遊戲業者該怎 麼辦? CMA會擔心微軟壟斷雲端遊戲市場,說不定也是有道理6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:4
[情報] ChatGPT點燃AI熱情導致NVIDIA股價大漲52%最近ChatGPT各種刷屏,幾乎每天都是科技媒體網站的頭條 有人早在擔心自己的工作被ChatGPT取代,更多的人及公司是想辦法蹭上ChatGPT熱度 然而說到真正的受益者,NVIDIA這一波可是實實在在吃到了紅利。 ChatGPT火爆出圈之後,不少公司及投資者都加大了對生成式AI的投入 然而ChatGPT的成本不菲,訓練一次的費用在幾百萬到上千萬不等X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答X
[問卦] 雲端供應商面前 超級電腦排行還有意義嗎?像是微軟為了訓練GPT-4 一次可以動用上萬張A100或H100 GPU 這計算能力應該只是Azure中的一小部分 而Azure市占只是第二名 還有更大的AWS 這些雲端供應商的總計算能力遠遠超過任何一台超級電腦 只要有錢 就能從這些服務商獲得超越排行榜的計算能力
爆
[地震] 地震爆
[問卦] 看到爸媽老了 心裡怎麼調適爆
[爆卦] 地震爆
[問卦] 核電廠蓋你家旁邊是不是很ok?82
[問卦] 原來核三廠附近居民每年補助這麼高?爆
[問卦] 發展綠能卻又狂燒化石燃料 邏輯?78
[問卦] 智取櫃明明就很方便,但台灣不流行的八卦?71
[問卦] 有沒有孫女的八卦78
[協尋] 懸賞30萬!彰化秀水協尋走失小狗52
[問卦] 為什麼30年前的人喜歡看包青天36
[問卦] 有房的會抱怨房價高嗎?32
[問卦] 明天台北預估36度 更熱四度33
[問卦] 桂冠義大利麵幾十年都沒對手也太扯了吧29
[問卦] 哪個國家真的不值得去旅遊???33
[問卦] 微博熱搜第一:韓國警告俄羅斯30
[問卦] 地震預警app是不是沒用了啊72
[問卦] 讓你情緒影響最大的電影是哪部?30
[問卦] 空氣清淨機霸主是什麼品牌?30
[問卦] 螞蟻篇的獵人是漫畫神作吧20
[問卦] 剛剛南港有跳電嗎?23
[問卦] 景美女中的制服是不是台北最好看的5
[問卦] 杜奕瑾:澄清綠電假消息(請轉發)27
[問卦] 美國哪一州最沒存在感??27
[問卦] F1有這麼多人在看喔?21
[問卦] 現在搭捷運要自備椅子嗎?24
[問卦] 我剛才是不是有機會?42
[問卦] 汐止是怎樣的地方?22
[問卦] 有沒有人覺得台鐵E3000西部幹線遲早出事?69
[問卦] 為什麼水上樂園一堆刺青的17
[問卦] (G)I-DLE最正的是?