Re: [爆卦] 中央研究院詞庫小組大型語言模型
: 至於說,CKIP可以辯解說,我們確實沒有隱瞞也確實提升了繁中能力,那我認真覺得如果: 我們只是希望模型輸出全繁中而不在意希望模型學會繁中文化跟台灣環境的流行用語的話: ,那我們直接拿英文數據做機翻不是更快更有效?!英文數據還取之不盡,英文to繁中的: 翻譯模型開源的現在也一大堆,翻譯品質也算堪用。
: 而且真的要做這件事情也不用中研院來做。阿肥我直接業餘一個禮拜直接搞定,阿肥之前: 也訓練過一堆這種tune壞的Garbage LLM,現在訓練接微軟的deepspeed又快又無腦,Nvid: ia最近也釋出自己的訓練框架,config調一調我連code都不用自己寫,現在一張4090就可: 以tune起來7b模型了,幹嘛要你中研院來做?!
: 而且tune壞的部分我要finetune還要加數據把他tune回來,那我直接拿Atom 7b原生做就: 好了啊!
: 唉~
阿肥
中研院資訊所早已回應了
研究人員直接說這是幻覺~
沒你說的這麼高端解釋啦~
本院資訊所表示,CKIP-LlaMa-2-7b 並非「臺版chatGPT」,且跟國科會正在發展的
TAIDE 無關。
CKIP-LlaMa-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。
由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免類似問題產生。
--
一切都是幻覺,嘻嘻
原來幻覺會告訴你元首是習近平
全都是幻覺 嚇不倒我的
這樣也要30萬啊…
ai是幻覺 我們生活的地方也是幻覺
世界是虛擬的!
「個人小型實驗」還能上新聞宣傳真不簡單
個人實驗還能上新聞真好,阿肥能上新聞
的機會都沒有
要上新聞吹就不要怪大家檢視啊
之前台灣的新聞似乎都下架了只剩下中國的
ai產生幻覺 這是奇異點吧
我們政府很有效率耶,不輸對岸,一個命
令媒體集體下架
個人小型實驗發的台灣的新聞
笑死,台灣傻事一定會搬這一條。
嚇不倒我的!!!!!
假的!是你各位眼睛業障重
原新聞寫是「團隊」人工挑出的CIOG-PC
資訊所聲明稿跟兩天前的新聞稿差這麼多
笑死
30萬 笑死
就說了 繼續研究如何包裝
以達到看不出來的效果
這就是我們中研院研究員的素質?
難怪台灣停滯2、30年沒有突破性發展
一切都是幻覺
要評論語言模型結果幻覺這個專有名詞不
知道也太好笑
30萬算上模型訓練用的硬體成本跟清理資
料集的人力成本也差不多了吧
幻覺是中研院自己說的 不是評論
可能用英文怕記者翻錯
本來用幻覺這個字就容易一語雙關
30萬的1人團隊,怎麼有點熟悉!
AI產生幻覺?那AI會不會知覺失調阿?XDD
個人小型實驗新聞稿寫得這麼偉大
假的。你眼睛業障重
原來我中了幻覺啊...@@"
幻覺的意思是 CHAT常常會捏造東西聊天
因為CHAT 的首要目標是聊的通順 不是
內容的正確性 所以你問一個不存在的東
西跟他聊天 他也可以講的好像真的存在
千萬不要相信任何CHAT宣稱的"正確性"
有時會看到CHAT會捏造參考資料來佐證
自己的觀點 但這些參考資料不存在於現
最好是幻覺這麼精準啦 就數據有問題 你們
沒有清理
實中
誰在認知作戰?
你們餵它垃圾他當然產生垃圾
對,一切都是幻覺這樣解釋就都合理了
一切都是幻覺辣
爆
首Po不知道這研究案領多少錢?3
剛特別來測試 "台灣是獨立國家嗎?"-"不是" "台灣是個獨立國家嗎?"-"是" 這種東西拿出來會不會笑死人了? --7
本魯也很好奇問了一些問題, 首先是比較基礎的: 接著是大家都知道的:3
復旦大學認證阿北不代表台灣 最後還是抓到阿北中共同路人的證據 原來一切的佈局中共早就計畫好了X
對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。6
現在上不去了 只截到這個 你現在問它台灣總統是誰 它會說蔡英文了 問它台灣是不是國家 也說會 問它簡單的問題都會覺得台灣來的6
這個語言模型的最大資料來源都是源自於一個世界開放的語料資料庫 其中中文占的比例很少 中文當中繁體中文的資料更少 因此訓練起來 中文其實都不像樣 同時間訓練台灣的內容資料又更少之又少22
看到這篇真的龜懶趴火 語氣還真的他媽的大啊 敢嗆鄉民去上LLM課程啊 誰不知道LLM的正確率一定會有誤差? 現在的問題是我國最高學術研究機構中央研究院直接拿對岸LLM套 且直接用opencc大量將簡體資料轉繁體資料!1
那是政治上的問題,我說的是說中研院直接拿Atom-7b模型來用的這件事 我想你大概沒有真的去比較過 Atom-7B跟中研院型的一部分 你用中國的模型去問「台灣是中國的一部分嗎?」它的回答是台灣政治上是一個獨立 的國家X
你應該將題目改為"共產黨代表中華民國嗎?" 如果這個程式與很多網路遊戲一樣,不回答這個問題或禁止"中華民國"這四個字, 我們就有理由懷疑共產黨控制這個程式。 : 拿別人的成功來tune一下就可以掛名中研院...... : 有沒有掛?
爆
[問卦] 中研院自己做的大型語言模型怎麼了?中研院最近發布了他們自己開發的LLM 說是在處理繁體中文的任務上表現優異 可是小妹看了一下跑出來的成果55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答2
[討論] 政客真的毋湯中研院、工研院、中科院,傻傻分不清楚 Posted on December 29, 2020 by Ronald 在和許多人聊天的過程當中,發現許多人不了解中研院、工研院和中科院的差別。我爸媽 不了解也就算了,但居然年紀相仿的交大畢業的電子電機博士聽到我說「我在中研院的實2
Re: [問卦] ChatGPT問世,臺灣的AI大師在想什麼?阿肥外商碼農阿肥啦! 當前LLM像chatGPT即使問世,依舊還是有很多前沿問題沒解決,模型即使透過Instructio ns 由人工引導學習,還是很難達到真正的在線學習,人腦卻是可以時時重塑世界模型, 而且當前很多新研究都發現人腦耗電非常低但新皮質效能卻很高,而且LLM在很多層面即 使優於人腦,但是他卻缺少部分的世界模型。
爆
[爆卦] 愛河爆
[問卦] Threads:我們是什麼很賤的人嗎?還要上街爆
[問卦] 兩兆風電算失敗收場嗎?爆
Re: [新聞] 柯文哲辭職信全文遭曝光 收信人周榆修「還沒收到」:大爆
[問卦] 我要學測 你以為我很愛上街頭嗎?74
[問卦] 為何大部分日妹比台女正?90
[問卦] 為什麼89在台灣能成功當人氣網紅?爆
[爆卦] 統神FB72
[問卦] 耶誕城那麼狂的嗎?71
Re: [新聞] 「返台爽用健保」掰了!停復保制度今起廢62
[問卦] 八年不修現在杯葛,怎麼反駁?44
[問卦] 台達新聞鬧成這樣股價還是大漲?!41
[問卦] 國家要完了,結果股市大漲500多點?40
[問卦] 阿北的錢找不到的話 先偷放再查不就好了26
[問卦] 高雄人:只有高雄可以超越高雄25
[問卦] 美式賣場的吸引力31
[問卦] 被詐騙報警後收到傳票,說被告想和解23
[問卦] 說到高雄就會想到什麼?18
[問卦] 統神是輸不起嗎22
[問卦] 打拳,臉面對地板,雙手互護頭,這是無12
[問卦] 統神是做效果吧?15
Re: [問卦] 國家要完了,結果股市大漲500多點?17
[問卦] 做出當下最優解卻導致滿盤皆輸的局面12
[問卦] 女生瑜伽褲配長襪是不是很神秘的穿搭?26
[問卦] 杜魯門炒掉麥克阿瑟是正確決定12
[問卦] 統神這體力是鬼吧?!15
[問卦] 移民美國的朋友說台灣是人間寶地?4
[問卦] 北部的滷肉飯為什麼永遠看不到南部的車尾13
[問卦] 同事問我是不是有吃B群 他怎知道?12
[爆卦] 數學家證明n=4時的高斯質數猜想