[閒聊] 哈利波特成為AI界學習用普世聖經
AI:讚頌萬母之母莉莉絲,智慧之果的恩賜者\[J.K. 羅琳]/。
話說回來如果偷偷換成哈綴本不知道會發生什麼事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
作者 林 妤柔 | 發布日期 2023 年 12 月 27 日 12:37
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式AI 系統如何學習和提供資訊。
根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。
最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI
聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。
因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。
Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。
Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。
另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。
為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。
研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。
在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首圖來源:pixabay)
--
ai:你再使用禁止字,我就對你索命咒
SJW:你說誰的《哈利波特》
到處都是梅林的鬍子
這些論文標題真的很像哈利裡的書名w
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,17
[蒸汽機] 芝加哥大學研究團隊發布防模仿AI模型目前生成式 AI 模型可以學習去模仿特定畫家的繪畫風格6
Re: [新聞] 吳欣盈街頭開講近全台語 群眾喊「you are道 : 2. GDPR 架構上有沒有問題?有。其中一個是因為很多領域如醫療等其實很難訂出全歐 一 : 3. 另根據研究,在 GDPR 實行也對產業產生衝擊,有數據指出有 8% 的利潤損失,其 中?4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
Re: [問卦] AI畫奶的功力怎麼進步這麼快的?AI畫奶的技術是一種基於深度學習和圖像處理技術的應用,隨著機器學習和計算機視覺的 不斷發展,其技術水平也在不斷提高。 在過去的幾年中,AI畫奶技術已經經歷了許多重要的進步,其中包括以下幾點: 數據集的增加:AI算法需要大量的數據來進行訓練和優化, 隨著數據集的增加,AI算法可以更好地理解不同類型的圖像,從而提高奶畫的質量。3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3d
74
[鳴潮] 憑良心講,你們覺得哪一邊比較好看53
[Vtub] Kiara澄清沒出現Fauna畢業直播的原因47
[鳴潮] 庫孝子尬吹2.0環節43
[閒聊] 各國蛇年生肖郵票48
[holo] 船長暴露486曾經和營運大戰的故事41
[閒聊] 寶多六花figure的大腿細節37
[閒聊] 魷魚遊戲2被中國禁了33
[母雞] 睦寶怎麼不幫 雷38
[閒聊] 死霸裝到底有什麼功能?33
[閒聊] 鳴每隻都想抽 原只想抽一隻 怎麼回事36
[刺客] 25年是暗影者之年?誰給育碧的自信?35
Re: [閒聊] 真有人會跟班上最討厭的女生結婚?35
[閒聊] 墨西哥街頭的芙莉蓮34
[閒聊] 石田三成輸給家康輸在哪?爆
[閒聊]隻狼究竟算不算難28
[種命]議長的命運計畫有甚麼問題??28
Re: [閒聊] 各國蛇年生肖郵票爆
[閒聊] 魔法少年賈修作者的賀年圖被韓國人抗議26
[閒聊] 今天是青木陽菜ひなぴよ的生日24
[閒聊] 祥子最後是不是會變成養渣男的陪酒女?25
[閒聊] PTCGP 水箭龜活動牌組35
[閒聊] 一兆遊戲這麼冷門是畫風關係嗎?24
[閒聊] 中文遊戲攻略AI生成氾濫導致污染23
[妮姬] 企業CEO的年紀22
Re: [閒聊] 異種族風俗:梅多莉哪裡香了?21
[閒聊] 阿蝙到底為什麼要堅持不殺人?20
[母雞] 喵夢是攻還是受啊?20
[閒聊] 2025還有人玩原神在用安柏?20
[閒聊] 睦頭人是喜歡爽世還是祥子啊?20
[閒聊] 現在回鍋遊戲王md要玩什麼?