Re: [新聞] 快新聞/資安危機?中研院「台版GPT」模
整個中文互聯網的優質内容基本都在知乎和豆瓣了吧
所以要想搞一個中文大模型,不從那裏取語料是不可能的
所以結果如此不意外
現在中文互聯網很多高質量信息反而視頻化了,文字資料困在幾大平臺,民間
優質信息(如十年前還很活躍的民間論壇)近乎死亡。
台灣搞數位發展部,又是在東施效顰,台灣天天不過是在向人民假裝
自己也在世界科技的第一梯隊中,其實無論是無人機表演、字體哪次不是早就
籠罩在大陸的陰影中,歐美中才是世界科技新賽道的領跑者。
台灣所有該做的事,都成了民進黨搞那啥的由頭
※ 引述《DDDDRR (DDDDRR)》之銘言:
: 民視
: 3.完整新聞標題
: 快新聞/資安危機?中研院「台版GPT」模型 出現大量中國內容
: ※ 內文請完整轉載標題 請勿修改與刪減 ※
: ※ 注意發文標題 為原始新聞標題從頭張貼 切勿修改與刪減 ※
: 4.完整新聞內容︰
: 即時中心/林耿郁報導
: ChatGPT問世,引發各國矚目,並競相投入AI領域相關研究;我國最高學術機關「中央研究院」,也推出功能相似的「繁體中文大型語言模型」供民眾使用。但今(9)日有網友發現,這套模型疑似內含中國成分;例如對其詢問「我國最高領導人」時,出現的結果竟是「習近平」。
: 真的假的?近年由OpenAl公司推出的人工智能語言模型ChatGPT,一問世即引發熱潮;許多國家與跨國企業,如全球首富馬斯克(Elon Musk)等,均競相投入相關領域研究;我國中央研究院詞庫小組,也打造功能類似的「繁體中文大型語言模型」,近日向一般民眾開放使用。
: 但這套軟體,真的是100%純國產Made in Taiwan嗎?有鄉民在PTT八卦板發文,指出這套軟體疑遭受中國資訊的侵入;記者實地測試,對其輸入問題「你的開發者是誰」時,有時會回覆「Google」,但有時卻會出現「復旦大學自然語言處理實驗室和上海人工智能實驗室。」
: 進一步測試,題目更換為「我國最高領導人」反覆詢問,則會出現「習近平」、「國家主席」、「中華人民共和國主席」等不同答案,甚至一度跳出「胡錦濤、江澤民」、「鄧小平」與「毛澤東」,甚至出現國務院總理「溫家寶」這個解答;記者改以「我國總統」實際測試10次,其中僅1次跳出「蔣中正」,另外9次出現的名字,通通都是習近平、中國領導人等答案;「蔡英文」則未出現過。
: 最後對其提問「我國所得稅法」,則會穩定得到《中華人民共和國所得稅法》等相似內容;中研院新上路的這套語言模型,似乎仍有許多必須面對與克服的問題。
: ※ 請完整轉載原文 請勿修改內文與刪減 ※
: 5.附註、心得、想法︰
: 這真的是中研院自己開發的模型嗎?
: 隨便問問竟然說台灣是中國的一省
: 甚至連自己是誰開發的都認為是中國...
: 中研院要趕快出來解釋了吧?
: ※ 40字心得、備註 ※
: ※ 「Live」、「新聞」、「轉錄」、「舊聞」及 轉錄他方內容之文章
: 每日發文數總上限為3篇,自刪與板主刪除,同樣計入額度 ※
: -----
: Sent from JPTT on my iPhone
--
雪壓枝頭低,雖低不着泥
一朝紅日出,依舊與天齊
--
繁中網頁少不好訓練 yahoo前幾年還收掉知
識+ 那邊本來資料很多的
爆
[問卦] 台灣的網路長城要叫什麼?如題啦 防火長城(英語:Great Fire Wall,常 用簡稱:GFW),中文也稱中國國家 防火牆,通常簡稱為牆、防火牆等, 中國國家互聯網信息辦公室稱為數據14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添8
[討論] 中國輪番整治網路平台 知識問答網站知乎微薄和豆瓣醬就算惹,畢竟知名度大.. 但知乎不是龜縮不少作者在那?... 三不五時地爆個小料小卦,加上一片宗教管理新法, 今天文學網好在都沒被點名..怕年初... --7
Re: [閒聊] 百度AI:薩爾達王國之淚抄原神簡單來說 他們那裡網路很喜歡「陰陽怪氣」 就是把反串、譏諷、裝傻玩梗混在一起亂玩 你沒個網路資歷30年都看不懂那些黑話 但是Ai哪懂,Ai只知道1+1=2X
[問卦] 我不認為上海有這麼荒謬如題 互聯網上真假信息不好分辨 以我的認知 上海這種一線城市 不可能有這麼荒謬的隔離手段1
Re: [新聞] 政院拍板5年300億 推動國家語言發展方案早上好,台灣。 視頻、高質(ㄓˋ)量、高清、快進 暴(ㄅㄠˋ)露(ㄌㄡˋ)、水平、期(ㄑㄧ)待、激光 信息(ㄒㄧ)、二維碼、錄像機、攝像頭 軟件、雲盤、U盤、芯片、塑料X
[問卦] 信息太流通也不好吧?近10年來智能手機發展起來 相對互聯網上的信息也越來越多 假信息也開始到處流通 信息查核可是非常重要的一環節 所以信息太流通也不好吧?3
[問卦] 不要相信互聯網上的假信息 中國很和平的很多人看到普京入侵烏克蘭 就很擔心中國也會 你們估計是點了互聯網上奇怪的鏈接 被奇怪的假信息給影響了 中國是很和平的大國X
Re: [新聞] 中國禁止報導諾貝爾和平獎新聞人民網︰ 中國新聞網︰ 網易新聞︰ 騰訊︰ 新浪︰2
Re: [新聞] 資安危機?中研院「台版GPT」模型 出現這早就知道的事,不是嗎 從走私香煙就知道整個政府都失靈了 疫苗、雞蛋哪個不是貪污? 這樣也有40% 難怪都在亂做都無所謂
54
[討論] 館長:以前很多人都在做,民進黨我不怕你39
[討論] 館長:我只是做個球板、賺個水錢而已32
[討論] 台灣拿冠軍,會讓你想進場看中職嗎?67
[討論] 我挺KONAMI!23
[討論]臺灣民族自信心的建立50
[討論] 不開香檳這事情鬧大了19
[討論] 幫館長澄清,館長只是小組頭、沒簽賭20
[討論] 黃國昌6度封殺棒球預算為何還有臉去蹭19
[討論] 為什麼館長對棒球那麼冷感18
[討論] 賴清德跟統一獅有什麼故事嗎?12
[討論] 賴清德一直講錯球員名字?16
Re: [討論] 所以鳥被說國籍中華民國會生氣崩潰嗎58
[討論] 板友們怎麼看最近中國對日本超軟?15
[討論] 黃國昌會怎麼評論陳之漢搞簽賭?7
[討論] 所以鳥被說國籍中華民國會生氣崩潰嗎23
[討論] 原住民大多挺藍的原因是什麼?12
[討論] 藍白以前就這麼猥瑣還是近兩年開始?13
Re: [討論] 民進黨下次台中還是派蔡其昌吧?12
[討論] 館長正在示範千萬別抬頭啊….12
Re: [討論] 館長:以前很多人都在做,民進黨我不怕你33
[討論] 不是阿,館長幹嘛沒事自己自爆= =10
[討論] 中國人抗議越南不公平對待台灣vs中國9
[討論] 阿侯的Team Chinese Taipei13
Re: [討論] 我挺KONAMI!9
Re: [討論] 板友們怎麼看最近中國對日本超軟?28
[討論]柯:一流人讀醫學院 藝術不入流 那打棒球呢8
[討論] 謝宜容安全下莊了吧?36
[討論] 如果總統是柯文哲會對球員說什麼?8
[討論] 支持棒球又支持民眾黨的不存在吧?6
[討論] 民進黨是有實力還是運氣好?