Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI
※ 引述《Waitaha (行人地獄)》之銘言:
: 1.媒體來源:
: 自由時報
: 2.記者署名:
: 記者吳柏軒/台北報導
: 3.完整新聞標題:
: 台版ChatGPT雛型曝光 國科會用4個月秀TAIDE初階成果
: 4.完整新聞內文:
: 美國Open AI去年秀ChatGPT引發人工智慧(AI)浪潮,我國國科會今年2月宣布要推台版
: 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量,
: 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並首
: 度透露相關計畫經費約2到3億元,年底前希望釋出更大模型,推向商業應用。
: 國科會主委吳政忠表示,今年2月宣布要推動「可信任AI對話引擎」(簡稱TAIDE),集結
: 產官學研、公私協力下,眾人力量紛紛無私奉獻,不少義工加入,加上國網中心超級電腦
: 算力一半拿出來支持,4個月後今公布第一階段成果,相關經費編列2到3億元,雖跟國外
: 相比「小小小小小」,但確是台灣目前重要成果。
: 協助開發的陽明交通大學應用數學系教授李育杰表示,當國科會宣布台灣要有自己的生成
: 式AI,避免過度依賴外國技術,眾人便開始用跑的,打造TAIDE引擎,目前利用臉書公開
: 學界使用的LLaMA模型,投入70億個參數量(7B,AI訓練所需參數),達中模型規模。
阿肥外商碼農阿肥啦!
其實這四個月整個訓練框架大爆發,阿肥自己也有幫公司訓練了一個中文小羊駝(可商用版)給業務單位使用。
包含微軟自己開源的DeepSpeed(把學習人類對話的強化學習(RLFH)訓練框架開源給大家免費用,還有知名開源框架抱抱臉釋出一些模型壓縮方法可以直接無腦調用,整個訓練阿肥訓練130億參數的模型從無到有弄起來真的不用一個禮拜,新手最多兩個禮拜就可以掌握了,真的蠻無腦的。
不過像Llama這種由於參數量其實只有GPT-3(不是ChatGPT跟GPT-4)的1/10不到,所以其實效能也是有限,像小羊駝Vicuna在通用評價測試集上只有GPT-3的92%,不過只需要一張顯卡又傻瓜是真的值得什麼都不懂又只有小需求的訓練一下拿來玩,像阿肥現在會把他拿來做基石做一些有趣的事情微調到自己的領域上省去人工標註的功夫。
差不多4醬
--
李宏毅講過了
人家可以拿政府2~3億
但可以拿來幹嘛= =
弱弱一問可商用的中文語料來源都是哪邊的
阿?
30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務11
Re: [標的] 3443創意 跳水台空Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上 加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別 ?10
[閒聊] 讓黑川茜唱アイドル我不是日文母語者 但是底下日本留言表示聽不出違和感 看起來成品是蠻成功的? 以後不需要用V家唱歌了8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
Re: [閒聊] 用CHATGPT跑團基本上就是記憶力(連結上下文能力)問題, ChatGPT的記憶能力「據說」是4000個token 約= 3000個英文單詞。 無論GPT3 API或者前天的GPT3.5 API也是這樣,超過的連結不到就會跑設定, 就算你自己串API都不會得到比較好的結果,只是據說沒有倫理限制而已。 那真的想這樣玩「可能」可以怎麼做?1
Re: [問卦] 為什麼人工智慧在這今年炸開了這一波是十年前的AlexNet才開始讓ML實用化 以往都只是研究 AlexNet橫空出世 GPU+大型CNN 辨識率高 忽然讓一堆人想到 啊幹 原來GPU能幹那麼複雜的事情 所以從2012年之後 ML/AI的研究如同雨後春筍呈現爆炸性的增長 ML從事的人多 想法就多 推出的模型多 成功的總會有幾個- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[問卦] 林秉文被交保 檢方怎麼不抗告?爆
[問卦] 有人的生活過得比我還清苦嗎爆
Re: [問卦] 其實寫程式才是最低成本的創業方式吧爆
[問卦] 發回重審之後改判的機率有多高?94
[問卦] 200億高雄車站漏水又要重新施工是幹嘛?爆
[問卦] 阿北到底得罪誰86
[問卦] 韓國客機爆炸有可能生還嗎?(內有影片59
Re: [新聞] 快訊/北檢抗告成功!柯文哲交保撤銷89
Re: [新聞] 快訊/柯文哲交保北檢提抗告!高院「明早41
[問卦] 中共給一千萬人民幣願意放棄台灣國籍嗎34
Re: [新聞] 快訊/柯文哲交保44小時!北檢抗告成功50
Re: [新聞] 黃國昌、小草喊1500萬沒金流 律師搬32
[問卦] Threads:終於知道為什麼有些年輕人能買房了28
[問卦] 你們過年還敢搭機出國遊玩嗎!?30
Re: [新聞] 快訊/柯文哲交保44小時!北檢抗告成功27
[問卦] 有沒有他媽就是要弄死你的八卦?32
[問卦] 健康活到80歲才突然離世有算pr90了嗎?28
[爆卦] 濟州航空班機墜毀 目前62人死亡 3人生還18
Re: [新聞] 快訊/柯文哲交保北檢提抗告!高院「明早18
[問卦] 8囧新影片會不會有反效果啊?22
Re: [問卦] 英國BBC開始在攻擊馬斯克?17
[問卦] 九點了21
[問卦] 大谷翔平當爸了20
[問卦] 商務艙和高檔餐廳是不是越來越多8919
[問卦] 一般機場能用航母的阻攔索嗎?8
[問卦] 八炯影片12小時76萬 八是不是又崩了46
Re: [問卦] 八炯影片下集懶人包16
[問卦] 看完八炯影片後、露天拍賣要重新崛起了?15
Re: [新聞] 柯文哲8分鐘籌3000萬有規劃 黃國昌稱「