Re: [問卦] 聽說中研院AI花300萬?
※ 引述《Fortran (Fortran)》之銘言:
: 如題
: 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: 剩下的經費都....?
: 有卦?
阿肥外商碼農阿肥啦!
推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure又快又好用。
Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練config就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azure 8萬就二十萬不到耶!
三百萬真羨慕,我們政府很有錢吶!
嘻嘻
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.46.126 (臺灣)
※ PTT 網址
推
才300萬難怪那麼差 300萬也只夠拍支30秒廣告
推
沒門路就標不到啊 我也是
推
阿你薪水多少?
阿肥算一算自己的工時在外商一天連一萬都不到,好羨慕
※ 編輯: sxy67230 (101.10.46.126 臺灣), 10/09/2023 22:05:41推
阿你怎麼不去跟唐鳳說
推
哪有可能只用一張A100下去跑
7B的連一張A100都吃不滿
※ 編輯: sxy67230 (101.10.46.126 臺灣), 10/09/2023 22:09:38推
除非他們只訓練7b模型 這樣4090一張就夠了
推
其實30秒廣告也不用100萬
→
300萬是可能是大學lab一年計劃的經費
→
中研院端出這種東西,被噴剛好
89
[情報] 前高層建議微軟應該賣掉Office和Windows前高層建議微軟應該賣掉Office和Windows,專心發展Azure雲端業務 janus janus 發表於 2022年1月14日 09:30 收藏此文 微軟前高層本·斯利夫卡(Ben Slivka)在接受一次採訪時表示,微軟應該賣掉其 Windows和Office業務,以便促進其正在不斷增長的雲端業務。 「(微軟)正確的做法可能是把未來押在雲端運算業務上。」曾擔任微軟消費者和商務部46
[瑟瑟] 看色圖不求人Part2 AI生成色圖全教學古拉鎮樓 (從Discord搬運 非本人生成) Part 1 在這 不重要 過時了 這篇將包含所有你生成色圖需要的資訊 1. 使用者界面 Stable Diffusion Webui35
[情報] NVIDIA安培打破16項世界紀錄:一年半性NVIDIA安培打破16項世界紀錄:一年半性能暴增4倍 NVIDIA宣佈,根據最新發佈的MLPerf基準測試結果,NVIDIA在全球市售商用產品中,具備 全球最快的AI訓練性能,並創造了多達16項的世界紀錄。 其中,在加速器的全部八項MLPerf基準測試中,NVIDIA A100都展現了最快的性能,同時23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機13
Re: [情報] CMA為了否決暴雪收購案,寫了400頁報告沒錯微軟雲端很厲害 微軟雲端服務其實不只是運用在微軟自家的XBOX,連索尼也要跟微軟雲端技術合作 微軟雲端服務技術能運用在PS和XBOX,要是微軟再加動視暴雪遊戲,其他雲端遊戲業者該怎 麼辦? CMA會擔心微軟壟斷雲端遊戲市場,說不定也是有道理6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:4
[情報] ChatGPT點燃AI熱情導致NVIDIA股價大漲52%最近ChatGPT各種刷屏,幾乎每天都是科技媒體網站的頭條 有人早在擔心自己的工作被ChatGPT取代,更多的人及公司是想辦法蹭上ChatGPT熱度 然而說到真正的受益者,NVIDIA這一波可是實實在在吃到了紅利。 ChatGPT火爆出圈之後,不少公司及投資者都加大了對生成式AI的投入 然而ChatGPT的成本不菲,訓練一次的費用在幾百萬到上千萬不等X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答X
[問卦] 雲端供應商面前 超級電腦排行還有意義嗎?像是微軟為了訓練GPT-4 一次可以動用上萬張A100或H100 GPU 這計算能力應該只是Azure中的一小部分 而Azure市占只是第二名 還有更大的AWS 這些雲端供應商的總計算能力遠遠超過任何一台超級電腦 只要有錢 就能從這些服務商獲得超越排行榜的計算能力
爆
[問卦] Threads:我們是什麼很賤的人嗎?還要上街爆
[問卦] 醫生太棒了吧==爆
Re: [新聞] 釋出3,753億元 財政部:嚴重衝擊中央財政爆
[爆卦] 麥當勞重北一S50前員工遭性侵自殺爆
Re: [問卦] 長大後發現父母原來是89/O麻會怎樣?爆
[問卦] 耶誕城那麼狂的嗎?爆
[爆卦] 愛河71
[問卦] 以前學過的科目哪一個最廢?62
[問卦] 值得買的樂高組合☺50
[問卦] 有什麼工作是簡單 穩定 還能偷閒的?44
[問卦] 人生的意義到底是什麼46
[問卦] 為什麼一定要出國考察44
[問卦] 館長那時候怎麼會答應跟吃屎哥打拳阿爆
Re: [新聞] 柯文哲辭職信全文遭曝光 收信人周榆修「還沒收到」:大41
[問卦] 安卓市場只剩三星手機能打了?爆
[問卦] 兩兆風電算失敗收場嗎?1X
Re: [新聞] 釋出3,753億元 財政部:嚴重衝擊中央財政20
Re: [問卦] 罷免連署需要身分證 你真的OK??34
[問卦] 三惡法講的快亡國但怎麼燒不起來?30
[問卦] 陳沂VS雞排妹又贏了,贏第幾ROUND了?90
Re: [新聞] 「返台爽用健保」掰了!停復保制度今起廢28
[問卦] 讀莊敬高職一律當作8+9可以嗎24
[問卦] 李珠珢這個肚子也太棒24
[問卦] 30歲拿不出五萬塊算很可悲嗎==?26
[問卦] 說到高雄就會想到什麼?94
[問卦] 為何大部分日妹比台女正?21
[問卦] 統神吵到鄰居態度才是正確的吧?25
[問卦] 倉木麻衣的等級有到宇多田跟濱崎步嗎?24
[問卦] 國共內戰結局是南北分治會怎樣?21
[問卦] MMA李育昇打的贏統神教練嗎?