Re: [問卦] 聽說中研院AI花300萬?
※ 引述《sxy67230 (charlesgg)》之銘言:
: ※ 引述《Fortran (Fortran)》之銘言:
: : 如題
: : 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: : 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: : 剩下的經費都....?
: : 有卦?
: 阿肥外商碼農阿肥啦!
: 推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一: 天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,: 放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure: 又快又好用。
: Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練con: fig就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最: 多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azu: re 8萬就二十萬不到耶!
: 三百萬真羨慕,我們政府很有錢吶!
: 嘻嘻
https://ppt.cc/fZf2Sx
中研院聲明專區
本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。
CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。
由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免類似問題產生。
==
原來只值 3 秒鐘啊。
--
套皮就拿30萬也是很好賺啊
30萬就五個月的薪水 差不多啦
從中國抄來的資料庫 嘻嘻 30萬
個人研究發新聞?
欸欸欸 出包了 誰有在研究AI,拿來擋一下
啦
又是個人的問題
55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型5
[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡哥本哈根資訊科技大學(IT University of Copenhagen,ITU)的團隊發表一篇全新論文 及相關的 GitHub 頁面,展示一種運用 AI 和程式產生瑪利歐遊戲的新玩法,他們稱之為 「MarioGPT」。 MarioGPT 以 GPT-2 模型為基礎,儘管名稱向 ChatGPT 致敬,但它並非對話形式的人工 智慧。GPT-2 為大型語言模型(Large Language Models,LLM)無法理解瑪利歐遊戲,研3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3dX
Re: [新聞] 國慶日變10/1!中研院認了「AI語言模型」不知道這個話題有什麼好延燒的,一個數據庫而已。 在中文環境,台灣本就貢獻有限,要研究,就必不可少用到對岸資料,重要的是語言模型的 表現怎麼樣。 至少從實際來看,回答邏輯通順,條例分明,也能準確理解提問的意涵並給出準確的答案, 這不就夠了嗎?2
[討論] 政客真的毋湯中研院、工研院、中科院,傻傻分不清楚 Posted on December 29, 2020 by Ronald 在和許多人聊天的過程當中,發現許多人不了解中研院、工研院和中科院的差別。我爸媽 不了解也就算了,但居然年紀相仿的交大畢業的電子電機博士聽到我說「我在中研院的實
爆
[爆卦] 愛河爆
[問卦] Threads:我們是什麼很賤的人嗎?還要上街爆
[問卦] 兩兆風電算失敗收場嗎?爆
Re: [新聞] 柯文哲辭職信全文遭曝光 收信人周榆修「還沒收到」:大爆
[問卦] 我要學測 你以為我很愛上街頭嗎?74
[問卦] 為何大部分日妹比台女正?90
[問卦] 為什麼89在台灣能成功當人氣網紅?爆
[爆卦] 統神FB72
[問卦] 耶誕城那麼狂的嗎?71
Re: [新聞] 「返台爽用健保」掰了!停復保制度今起廢62
[問卦] 八年不修現在杯葛,怎麼反駁?44
[問卦] 台達新聞鬧成這樣股價還是大漲?!41
[問卦] 國家要完了,結果股市大漲500多點?40
[問卦] 阿北的錢找不到的話 先偷放再查不就好了26
[問卦] 高雄人:只有高雄可以超越高雄25
[問卦] 美式賣場的吸引力31
[問卦] 被詐騙報警後收到傳票,說被告想和解23
[問卦] 說到高雄就會想到什麼?18
[問卦] 統神是輸不起嗎22
[問卦] 打拳,臉面對地板,雙手互護頭,這是無12
[問卦] 統神是做效果吧?15
Re: [問卦] 國家要完了,結果股市大漲500多點?17
[問卦] 做出當下最優解卻導致滿盤皆輸的局面12
[問卦] 女生瑜伽褲配長襪是不是很神秘的穿搭?26
[問卦] 杜魯門炒掉麥克阿瑟是正確決定12
[問卦] 統神這體力是鬼吧?!15
[問卦] 移民美國的朋友說台灣是人間寶地?4
[問卦] 北部的滷肉飯為什麼永遠看不到南部的車尾13
[問卦] 同事問我是不是有吃B群 他怎知道?12
[爆卦] 數學家證明n=4時的高斯質數猜想