[閒聊] 哈利波特成為AI界學習用普世聖經
AI:讚頌萬母之母莉莉絲,智慧之果的恩賜者\[J.K. 羅琳]/。
話說回來如果偷偷換成哈綴本不知道會發生什麼事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
作者 林 妤柔 | 發布日期 2023 年 12 月 27 日 12:37
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式AI 系統如何學習和提供資訊。
根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。
最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI
聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。
因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。
Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。
Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。
另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。
為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。
研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。
在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首圖來源:pixabay)
--
ai:你再使用禁止字,我就對你索命咒
SJW:你說誰的《哈利波特》
到處都是梅林的鬍子
這些論文標題真的很像哈利裡的書名w
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,17
[蒸汽機] 芝加哥大學研究團隊發布防模仿AI模型目前生成式 AI 模型可以學習去模仿特定畫家的繪畫風格6
Re: [新聞] 吳欣盈街頭開講近全台語 群眾喊「you are道 : 2. GDPR 架構上有沒有問題?有。其中一個是因為很多領域如醫療等其實很難訂出全歐 一 : 3. 另根據研究,在 GDPR 實行也對產業產生衝擊,有數據指出有 8% 的利潤損失,其 中?4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
Re: [問卦] AI畫奶的功力怎麼進步這麼快的?AI畫奶的技術是一種基於深度學習和圖像處理技術的應用,隨著機器學習和計算機視覺的 不斷發展,其技術水平也在不斷提高。 在過去的幾年中,AI畫奶技術已經經歷了許多重要的進步,其中包括以下幾點: 數據集的增加:AI算法需要大量的數據來進行訓練和優化, 隨著數據集的增加,AI算法可以更好地理解不同類型的圖像,從而提高奶畫的質量。3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3d
70
[閒聊] 現實遇到葉雲裳只想打死她吧?爆
[閒聊] 活俠傳 更新內容預告59
[討論] PS5 pro的商法到底誰想的……57
[雀魂] 透! 透! 透!41
[Vtub] 拉電介紹台南美術館&美食87
[閒聊] 米哈遊卡池大改動?39
[閒聊] 為什麼MyGO歷久不衰31
[PTCGP] 對戰打完會給謝謝的是不是越來越少了31
[閒聊] 與變成了異世界美少女的大叔一起冒險(26
[問題] 用自己名字替新發現疾病命名的醫生在想32
Re: [閒聊] 活俠傳 更新內容預告24
Re: [Vtub] 拉電介紹台南美術館&美食33
[閒聊] 覺得P5R比暗喻幻想好玩 正常嗎(雷)50
[情報] 這本輕小說真厲害 歷年男女角前3/2025作品19
[閒聊] 12點了 誠實說有對Biboo起色心嗎?19
Re: [閒聊] 我的的假小子女友20
[閒聊] 寶石之國第一季YT免費看18
[骨折] 自殺突擊隊百元豪華版現在僅售5美元17
[閒聊] 井上雄彥會怎麼畫這屆棒球12強?18
[閒聊] 偶大劇場版開大招了16
[閒聊] 索尼會怎麼防止黃牛?14
Re: [討論] 日本是不是熱衷棒球大於籃球?15
[Vtub] 佃煮のりお的13周年新衣裝14
[MyGO] 和愛音一起散步14
[閒聊] 秋葉原車站 阿夸生日快樂廣告14
[GBC] ガールズバンドクライ2nd LIVE主視覺圖公開21
[閒聊] KOFXV 泰瑞的帽子 ¥4,73058
[閒聊] 在廁所抽菸的都什麼人?13
[閒聊] 福山潤 生日倒數生放送13
[妮姬] 兔女郎灰姑娘