[討論] iKala 推出 TMMLU+ 驗證集,提升繁體中
iKala 推出 TMMLU+ 驗證集,提升繁體中文大語言模型的精確度與本地化
隨著 AI 持續蓬勃發展,台灣市場對於繁體中文模型的技術需求也在日益增長。iKala 近期推出的繁體中文驗證集「TMMLU+」,正式被 AI 語言模型學術會議 COLM(
Conference on Language Modeling)接受。
COLM 由來自 DeepMind 、 Meta 和 Microsoft 及常春藤等 AI 領域的知名學者共同創立,為極具公信力的 AI 組織。 iKala 所開發的繁體中文驗證集「TMMLU+」在眾多論文審查過程中,獲得前 10% 的高分,展現出 iKala 在 AI 技術上的強大實力。
自生成式 AI 技術崛起,各國都致力於發展與自身語言相關的大語言模型(LLM),台灣亦有不少企業正著手發展繁體中文模型。有鑒於各國語言的差異性,台灣特有的文化和用字習慣,例如「8+9」、「北車」或台語等,使繁體中文大語言模型在建構的過程中,也需要專屬驗證集進行調校,才能獲得更精準的 AI 應用成果。
iKala 內部 AI 團隊基於聯發科所推出的框架 TMMLU,透過社群媒體資料進行更深入的擴展,涵蓋更多台灣本地用語和人文背景,讓新開發出的繁體中文驗證集 TMMLU+ 能更貼近繁體中文的詞語情境和表達方式,加上形式開源,可協助國內眾多企業在開發繁體中文大語言模型時,使用繁體中文驗證集 TMMLU+ 作為模型驗證的工具,更貼近本地需求。
iKala 繁體中文驗證集 TMMLU+ 於全球競爭中脫穎而出
iKala 繁體中文驗證集 TMMLU+ 於2023年10月著手開發,經數月的緊鑼密鼓的工作後在
2024 年春天送審。在 COLM 評審的過程中,iKala 的 AI 團隊特別針對繁體中文的字形及用法等特色進行詳細說明,闡述其價值所在。此舉大大加深評審委員的印象,有效提升繁體中文驗證集 TMMLU+ 的論文評分,使其在來自全球激烈的競爭中脫穎而出。
目前繁體中文驗證集 TMMLU+ 已被多家台廠採用以進行大語言模型評測,為台灣科技業提供可靠且統一的驗證標準。這不僅是業界對 iKala 多年來深耕 AI 技術的肯定,也有助於提升 iKala 在業界的話語權和影響力。
iKala 共同創辦人暨執行長程世嘉表示:「 iKala 作為來自台灣的跨國 AI 公司,致力於解決困難但充滿意義的 AI 難題,並以實際商業價值和應用場景作為最終目標。非常感謝 AI 團隊成員們的努力,讓 iKala 有機會被國際看見,也感謝聯發科引領台灣 AI 開源技術。」
-
老闆最近很高調的在跟LLM的風潮
不過希望也可以提升一下<3卡拉員工的待遇
畢竟是要幹大事的...
https://i.imgur.com/sUbXffZ.png
https://i.imgur.com/YvUdaSN.png
https://i.imgur.com/AI9jiYU.png
https://i.imgur.com/FKZ6Xao.png
--
Appier:
是說這薪水連金融業都給得起了
好好奇能收到什麼等級的人才
台灣軟體業真的很慘 通膨一波了薪資水準還是在疫情前
本業賺不多,薪水當然就高不起來
台灣純軟薪資就這樣啊
人…人才,有能力的剛畢業就領這個薪水了
Staff 160是能找什麼人
staff 這薪資真的不大行,公司有沒有一個賺錢的核心本業
真的重要,否則再大的願景,拿不出錢找適合的人才來實現
也走不長
ptt 的大家真的賺很多..
這個徵才條件 大概只有四大四中碩士菁英才有資格
業務還很多一開始是做啥來著有點忘了
所以看到很多人都刷題去 GG 了
網紅老闆
LangChain 推出還沒滿兩年就要五年經驗喔w
這篇新聞明顯是業配,用買的
主任工程師這薪水
五年 LangChain,有笑有推
要求挺高的
能有5個月RAG/Langchain 經驗就已經是稀有動物了
誰要你學2年的Langchain的開發者,他是要創始人等級的5年
除了科技業還有點雨露均沾外 其他中等收入的行業都一樣卡在
疫情前的收入水準...這就是台灣特有基本工資漲 中間不會太
會跟漲的情況..這機制最終就是隨著基本工資提高 大家一起領
基本工資的概念...
回樓上 應該沒有很稀有之前搞過大概半年LangChain
跟RAG應用 發現蠻多人會的,就又回去寫前後端了
這公司聰明 這樣省錢多了
這家不是常常有(買?)新聞?
是
在商周上面鬼話講蠻多的XD
其實裡面沒什麼四大或國立本科, 畢竟給的 pay 真的很...
行銷公司確實盈利有限 小平台只能喝巨頭不要的湯
sr/staff這薪水 只能祝福你們順利
他們還很挑人呢
LinkedIn 看蠻多四大的啊
ikala給人的印象就是,什麼紅就做什麼,完全不深耕技術。
然後最特別的是什麼都做得很爛。連TMMLU+都是致敬聯發科的
。
短視近利,只能賺小錢。
樓上台商不就這樣...對岸更誇張,直接開網頁叫你照著
搞一套的都聽過
看到這樣我司cp值簡直頂到肺了
嗯 所以本業到底是什麼?
本業就是拚上市櫃 然後套一波走人 看看某動物科技
裡面的4大可能是早年還有在拼自有串流技術時還留著的人
這新聞出來前我對ikala的印象是gcp代理商
樓上提到的自有串流技術指他們的 Straas 產品?今年底要
收攤了耶XD https://straas.io/
需求1沒,其他有應該也是會直接被刷掉
這家就號稱廣告行銷包裝技術啊!
實際上技術沒多少 又喜歡把自己講成軟體公司
之前聽他們老闆講AI 就知道他的公司是什麼鳥樣
哈 台灣哪一間純軟有深耕技術的 說來聽聽
趨勢科技吧
hackmd,heptabase,ragic,portto 隨便想的
真的搞笑
沒技術其實也還好 美國矽谷也一堆crud串api的新創 主
要這家新聞稿狂發然後永遠都是在做跟風的東西
買來的新聞稿也寫得很不吸引人吧。自High, 反差感極大。
五年 LangChain? 那沒人能應徵了
然後這種薪資水準和要求,去券商當IT算了
笑死 這薪水搞不好連銀行的櫃檯中專都比不過
為何仇恨值這麼高 XD
其實趨勢也是差不多這個區間 for Sr./Staff
只是他寫面議,不敢寫出來而已
ikala 應該也是新創等人買一族? 感覺就遙遙無期
感覺過去幾年應該也曾有一些不錯的產品,合作的企業客戶
不乏知名品牌通路,但好像沒能打出核心業務的代表作
這家不就是一直走在 buzzword 上的公司嗎
之前用他們AWS代理商服務,那個後台有夠難用
愛卡拉十年以上了吧 從新創變舊創
爆
[笑死] 台漫如何走向國際? 丁曉菁:AI Can help台漫平台如何走向國際市場? 丁曉菁:AI Can help 毛履兆 2021-05-04 轉寄 列印 更多報導 樂天Kobo電子書平台上的部分日本漫畫,是由AI負責中文的翻譯工作(框線標註處)。Kobo46
[情報] 隨著蘋果發布新AI模型,這表示iPhone 16隨著蘋果發布新AI模型,這表示iPhone 16將成為軟硬體都具AI支援的首個產品 【情報來源】 原網址: 短網址: 【情報/優惠內容】22
[請益] 請益 iKala 愛卡拉朋友錄取iKala 是做AI應用的公司 但在猶豫 搜尋了一下板上沒有太多公司內部資訊 想請問有哪位大大知道這間公司的相關資訊/八卦嗎? (例如:未來發展、團隊氣氛、工作日常、leader同事等等)5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型6
Re: [爆卦] 中央研究院詞庫小組大型語言模型這個語言模型的最大資料來源都是源自於一個世界開放的語料資料庫 其中中文占的比例很少 中文當中繁體中文的資料更少 因此訓練起來 中文其實都不像樣 同時間訓練台灣的內容資料又更少之又少5
Re: [新聞]剖析中研院大型語言模型事件的衝擊先說結論: 發展本土化,繁體中文LLM模型,然後期待這個模型能讓大家使用,根本是錯誤方向。不知道這些專家學者,是在騙經費,還是還沒想清楚產業到底缺什麼。 --- 如果今天你使用Google搜尋,搜到"台灣是中國的",或任何有政治偏見的相關文章。 你會不會覺得Google很爛?4
[問卦] 欸!中研院開發的大型語言模型現況?之前拿國家補助, 用國家運算資源訓練, 號稱用Hugging face公開程式碼, 打造出全世界地表上第一個繁體中文的LLM(大語言模型), 當時整個網頁都滿滿是該團隊成員的詳細介紹和功勞紀錄,- 原本以為是拿來放AI生圖色色模型的地方 原來默默做了很多事 也生了很多好用的工作 連微軟的工作人員都把東西放在上面 不只是拿來放東西的地方 本體也是AI開發商
X
[閒聊]ChatGPT:區塊鏈與語言模型:數位革新的合力前幾天看到文章説 已經有人利用FB洩漏的資訊在筆電上實現類似ChatGPT的技術 所以我試著問GPT一些問題 獲得一些心得 分享給大家 所以以下的文章是ChatGPT寫的,包含標題XDD 有興趣請往下慢慢看~ (至於FB洩漏什麼 請自行搜尋 我網址沒存XD)- 看到我以為我跑錯版了,嚇死寶寶, 阿肥我來回答一下啦。 傳統訓練集就是拿來擬合模型參數的,驗證集是拿來做超參估計,然後鐵定要是無偏的樣 本,跟訓練集彼此獨立的。 然後測試集就是最後評估整體模型的,也是要無偏獨立上面兩種。