Re: [問卦] 聽說中研院AI花300萬?
※ 引述《sxy67230 (charlesgg)》之銘言:
: ※ 引述《Fortran (Fortran)》之銘言:
: : 如題
: : 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: : 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: : 剩下的經費都....?
: : 有卦?
: 阿肥外商碼農阿肥啦!
: 推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一: 天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,: 放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure: 又快又好用。
: Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練con: fig就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最: 多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azu: re 8萬就二十萬不到耶!
: 三百萬真羨慕,我們政府很有錢吶!
: 嘻嘻
https://ppt.cc/fZf2Sx
中研院聲明專區
本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。
CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。
由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免類似問題產生。
==
原來只值 3 秒鐘啊。
--
套皮就拿30萬也是很好賺啊
30萬就五個月的薪水 差不多啦
從中國抄來的資料庫 嘻嘻 30萬
個人研究發新聞?
欸欸欸 出包了 誰有在研究AI,拿來擋一下
啦
又是個人的問題
55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型5
[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡哥本哈根資訊科技大學(IT University of Copenhagen,ITU)的團隊發表一篇全新論文 及相關的 GitHub 頁面,展示一種運用 AI 和程式產生瑪利歐遊戲的新玩法,他們稱之為 「MarioGPT」。 MarioGPT 以 GPT-2 模型為基礎,儘管名稱向 ChatGPT 致敬,但它並非對話形式的人工 智慧。GPT-2 為大型語言模型(Large Language Models,LLM)無法理解瑪利歐遊戲,研3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3dX
Re: [新聞] 國慶日變10/1!中研院認了「AI語言模型」不知道這個話題有什麼好延燒的,一個數據庫而已。 在中文環境,台灣本就貢獻有限,要研究,就必不可少用到對岸資料,重要的是語言模型的 表現怎麼樣。 至少從實際來看,回答邏輯通順,條例分明,也能準確理解提問的意涵並給出準確的答案, 這不就夠了嗎?2
[討論] 政客真的毋湯中研院、工研院、中科院,傻傻分不清楚 Posted on December 29, 2020 by Ronald 在和許多人聊天的過程當中,發現許多人不了解中研院、工研院和中科院的差別。我爸媽 不了解也就算了,但居然年紀相仿的交大畢業的電子電機博士聽到我說「我在中研院的實
爆
Re: [問卦] 綠鬣蜥 抓一隻500元 一晚400隻 比醫生賺爆
[爆卦] 我在台南仁德大甲里抓到綠鬣蜥啦79
[問卦] 綠鬣蜥在屏東/台南肆虐跳過中間高雄是因?爆
[問卦] 綠鬣蜥 抓一隻500元 一晚400隻 比醫生賺59
Re: [新聞] 嘆民進黨欠他很多! 余天:曾說要給華45
[問卦] 楊淑君當年是真的被婊掉還是媒體洗的?38
[問卦] 綠鬣蜥的英文怎麼念34
[問卦] 為什麼天團BP Lisa票價5到6折被拋售啊33
[問卦] 薑母鴨好吃的點是?32
[問卦] 為什麼食藥署一直放有毒食物進來31
[問卦] 綠鬣蜥要怎麼唸啊???34
[問卦] 最好聽的聖誕歌〓〓?31
[問卦] 今晚中國的親戚要來 聊什麼?29
[問卦] 沒人發現楠梓一坪買30萬是在開玩笑嗎!爆
[問卦] 快訊/咖啡廳上錯飲料 新北4煞持球棒猛爆
[爆卦] 廣東工業大學發生砍人事件24
[問卦] 現在台灣是不是「準戰爭狀態」?29
[問卦] 15.6是筆電最划算的尺寸嗎25
[問卦] =.= 奇怪為什麼台灣的拉麵這麼跩這麼貴29
[問卦] 人生除了工作賺錢 還剩下什麼27
[問卦] 綠鬣蜥的破口是哪個縣市?25
[問卦] 國片港片演壞人最經典的是誰21
[問卦] 中華隊去打MLB大概是落在哪個水準?19
[問卦] 新北二哥是誰啊?17
[問卦] 這拉麵給幾分21
[問卦] 被澳州全壘打了 該準備什麼19
[問卦] 哪個國家會限制人民捕捉外來入侵種的?18
[問卦] 薄瓜瓜他爸和張學良他爸 哪個官比較大?2
[問卦] 說真的 跟中國比我們幸福多了吧15
[問卦] 為何要教過馬路不看車?