Re: [閒聊] 文心一言AI繪圖(慎入)
文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網
路資料兩年了,到了去年底才終於開花結果
目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,ChatGPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添加一些限制來引導訓練方向,但總體而言跟其他Ai模型一樣訓練出來的模型基本上是黑盒子,是無法直接改動的,所以基礎語料的重要性不言而喻
而中文跟英文在目前網路的資料量91%左右,而中文只有0.11%,甚至還沒有日文0.12%多,文
心一言基本上就是專攻中文的,所以在先天條件下其實就不如ChatGPT(GPT的中文回答很多時候也是經由英文生成答案再轉成中文的
第二個就是算力差距也很大,之前微軟的訓練場所都是5萬張A100在24小時跑模型的,美國之
前已經要求NV禁售高階運算卡很久了,目前百度能用的卡就是一些消費級的和以前囤積的卡,聽說他們之後要用他們的國產摩爾線程的顯卡,不過那個效能和NV差距非常大,在算力這方面上幾年內也是追不上OpenAi團隊的
不夠就算如此,我也覺得百度這次算厲害了,為什麼?因為隔壁Google 開始公測的Bard實際
表現還不如文心一言,甚至可以說慘多了,全靠同行襯托啊。而且百度這次不像很多中國公司一樣拿外國產品套個皮就說自研,而是真的在做產品,這點就挺厲害了,不過他們會下去做主要也是想繼續霸佔中國瀏覽器市場的龍頭地位就是了
--
這沒辦法解釋為什麼愛國的定義 出來是美國捏
算力不足的狀況下我覺得這模型出得太快了~
因為實際上那張圖的標籤加了美國的,只是被P掉了
所以我說那個國呢?
我覺得那不是重點,生成圖片和影片就是百度的噱頭,實際上
看文字生成的部分比較有意義
這篇也太lag早就被踢爆這個垃圾是把用戶打的字機翻
然後放到國外的sd跑出來的
你只要用一些中英歧異的字 就能測試出來
機翻也可能是核心抄襲所以沒辦法直接用中文啊
不多說了自己去查 反正這又是國外開源我就原創
所以我說那個標籤呢?
文字對話和圖片生成是分開的啊,圖片生成是用開源的工具生
成的這個第一天內測的時候不就知道了,但文心一言最重要的
是跟ChatGPT一樣的語言對話模型啊,為何都在討論圖片生成的
部分,我看不太懂
你要不要看看標題在說什麼
那你上面說的那個標籤跟P掉是怎麼一回事 要不要解釋一下
那你要不要看內文在寫什麼?
我只是想討論一下目前的幾個大型LLM模型而已,Ai繪圖早就已
經玩爛了,技術難度也遠低於對話模型
就那張圖把標籤P掉了啊,你實際打愛國的貓沒有美國國旗,很
難懂嗎?
呵
連人家自家人都懷疑文心一言了 你居然能信誓旦旦他只
是訓練不夠 你難道是內部員工?
而且你拿bard比較更好笑 你要不要去查一下bard的作用
你真的沒有基礎概念嗎?難道你覺得對話模型可以生成圖片嗎
?百度只是把生成圖片跟影片這個部分當成噱頭加進去文心一
言,但這個功能跟語言模型的部分是獨立的你了解嗎?這種語
言模型重要的是訓練模型,訓練出來的模型都在OpenAi的雲端
,想抄還抄不到,所以我才說百度是真的有訓練語言模型,理
解嗎?
至於Bard Google就定義為聊天語言模型了,在ChatGPT推出後
急忙上線公測版,不是對標是要做什麼?
好對不起我不該在C洽討論技術的,對不起對不起對不起
在瞎掰了! 大家來看阿! 這傢伙在瞎掰了!
你覺得不對你可以針對你覺得不對的點反駁,而不是說空話,
雖然我理解你肯定都看不懂,也無從反駁。
這樣也能吹,了不起
你慢了 看討論圖出來不久後有人想試那時愛國變成禁字了
現在應該是改完了
中國擋一堆關鍵字,好奇用中文資料訓練出來的AI能多強?
都被踢爆還能吹,也是滿厲害的
就跟英文有三個數量級差距,而且資料的含金量也遠低於英語
,上限就在那邊了,追不上OpenAi的
生成圖片的和語言模型是兩個東西,只是百度把它都丟到文心
一言裡面,這很難理解嗎?被踢爆的從來都不是語言模型的部
分
現在他們拼命hotfix加詞庫,有些東西已經玩不出來了
我的文章都是想討論LLM模型訓練出來的語言模型,這是未來十
年最重要的技術之一,而不是這個繪圖Ai,繪圖Ai沒人在乎,
OpenAi也不在乎
推文怎麼有人像三歲小孩一樣發顛==
我看了很頭痛,Ai這個東西訓練過後是黑箱子,這代表什麼?
這代表這並不像那些固定的程式碼,比如操作系統或者軟體包
可以直接複製一份偷過來的,且所謂的LLM模型就是超大規模模
型,也不是隨便什麼硬碟就能裝下的GPT3.0時代光是模型就有
3000多TB了,且都存在OpenAi的伺服器上,跟繪圖Ai這種用本
地NPU就能跑的東西是完全不一樣的,他們只是都叫Ai而已,別
混為一談啊
我覺得很神奇 整串推文好像只有原PO一個人知道自己在講
什麼 失智到有點誇張... 生圖跟聊天是兩個 AI
一直貼生圖的那個用機翻被抓包跟原PO講的有一丁點關係嗎
有些人跳針到有點好笑
所以我覺得百度把圖片生成的Ai加進去很愚蠢。
實際上原本文心一言的重點是和ChatGPT一樣訓練方式的對話模
型,結果被這個圖片生成器搶走了目光,一般人也分不清楚
兩者的差別
應該也不是分不清楚啦 而是 _____ 嗯
重點是語言模型那原PO回什麼P圖的就多啦
我本來不想討論繪圖方面的,只是剛好有看到那個貓的討論,
那個貓熱度很高的,只是下面留言很多人自己測試並非是美國
外型的貓
實際上圖片生成的部分百度用開源的這個是明顯的事實,但用
邏輯思考就知道一般的繪圖Ai在畫這個主題時也不會特別去畫
美國國旗,在生成圖片的風格選擇那邊可以選美式風格,就單
純選了那個選項但把標籤移到下面
查證推,為反而反真的太反智了
你不該浪費時間試圖在這個版理性討論
就不要結果是google自己的東西 vs openai開源的gpt 2
走了捷徑然後就沒有了
實際上大家現在用的都是Google 2017年提出的transformer模
型,原理並不難,難的是需要海量語料和算力來建立LLM模型,
我不認為百度會爛到連基本原理都搞不懂,因為實際上這些東
西一般大學的資工系都能輕鬆理解原理
但如前面所說的,其實難的是工程問題,chatGPT2.0以前,語
言模型的邏輯推理能力還非常弱,直到3.0版本資料量提高了1
000倍以後,ChatGPT才表現的更像人類,這也是為什麼以前搜
索引擎時代,Google可以以小公司白手起家,但是現在LLM模型
卻沒有新興小公司能做的原因,原理不難,難的是錢啊,微軟
兩年前投資100億美元,讓open Ai用微軟雲端的5萬張A100訓練
才有的成果,一般公司或者大學研究團隊根本搞不出來這麼大
規模的算力
而且我發現前面很多人的噓文好像以為我是想吹百度,其實我
真正想吹的是有了多模塊能力的GPT4.0啊,數學能力飛速成長
和擁有了圖片識別能力,實際上我認為百度根本沒有追上Open
Ai的機會
倒是Transformer模型的提出者Google推出的Bard令人失望,也
體現到了最近的股價,就不多談了
你好有耐心
推原po,你討論的是技術,很激動噓文那幾個討論的是政治,
永遠取不到共識
就資料庫來說 中文這塊還真的要靠對岸發展 他們的資料量
大封閉性又高 就怕又是另一個內宣噱頭而已
我是覺得不用跟前面幾樓解釋這麼久啦...他們就不在乎真相只
在乎能不能嘲笑中國而已
認真文給推
但百度的語言模型和近年看到的各種 transformer 差
不多。然後繪圖也是他自稱的多模態,既然他刻意混
淆也別說別人誤解了。
ChatGPT和Brad也都是transformer模型啊,只是在GPT3.0之前
沒有預料到LLM會讓基於transformer模型建立的語言模型產生
類似邏輯鏈的概念,至於百度說他活該我也沒意見的,自己要
搞噱頭的,不過要強調的是百度的文心一言跟多模塊差很多的
,文心一言並不能以文字輸入以外的方式來和模型對話
推
推樓主回覆
私聊資料都能用的
我也覺得生圖那是噱頭可不談。但我的意思是 transf
ormer 近年大家都在玩,百度語言模型的看起來也沒
比較厲害。chatGPT 真的恐怖
跟openAi比那是比不過,但是現在檯面上有推出對話語言模型
的就只有GPT Bard 文心一言這三個,底層結構這三個都差不多
,差別在於語料 訓練量和權重,OpenAi雇了數萬人來人工審核
GPT生成的答案,就是在改變模型的權重,不過讓人感興趣的G
PT4.0數學能力大幅提升到秒解高等數學的程度的原理,OpenA
i並沒有公布,這個應該不是單純喂資料可以訓練出來的
55
Re: [閒聊] ChatGPT是語言模型不是搜尋引擎本來沒想這麼早回這篇的,不過既然都有人把討論串回起來了我丟點資訊, 既然都會看網紅發表對ChatGPT的看法(沒有貶義),我覺得也可以看看這個: 台大電機副教授李宏毅老師的ChatGPT講解(先回到PTT還是學術論壇XD) ChatGPT (可能)是怎麼煉成的 - GPT 社會化的過程21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機4
[情報] ChatGPT點燃AI熱情導致NVIDIA股價大漲52%最近ChatGPT各種刷屏,幾乎每天都是科技媒體網站的頭條 有人早在擔心自己的工作被ChatGPT取代,更多的人及公司是想辦法蹭上ChatGPT熱度 然而說到真正的受益者,NVIDIA這一波可是實實在在吃到了紅利。 ChatGPT火爆出圈之後,不少公司及投資者都加大了對生成式AI的投入 然而ChatGPT的成本不菲,訓練一次的費用在幾百萬到上千萬不等2
Re: [問卦] AI產出的產品之間有關聯性嗎?: 阿肥碼農阿肥啦!有興趣可以看我在科技版的文章,看一下chatGPT的思維模式綜述。 #1Zxi_nPB (Tech_Job) 基本上,現在的深度學習突破的領域在學術界已經是一兩年前的舊聞了,現在所有的語言 視覺模型最好的成果都是基於Transformers(變形金剛)這個家族爆發性成長的結果。2
[討論] 小玉 若用明星訓練的AI做A片 還會被關嗎?現在主流認為 用網路爬蟲去抓未授權的影像回來訓練 AI 模型 再由 AI 模型生成的資料是可以合法賣錢的 (例如 Midjourney, chatGPT, Dall.E2) 這樣說 小玉 若用明星訓練的AI做A片 還會被關嗎? #他只是生不逢時 --
爆
[蔚藍] 聖誕SP生放爆
[活俠] 小梅…噢…我的小梅……96
[問題] 在宿舍怎麼玩黑白妹 急80
[閒聊] 史丹利是不是真的很恨統神?爆
[推投] 銀魂 最喜歡女角「1票」83
[GBF] 合作活動 魔法老師65
[討論] 今年最好看的動畫要推哪部64
[閒聊] 傑利鼠木雕56
[生日] 今天是聲優「楠木燈」的25歲生日!49
[Vtub] LIVE是真的LIVE嗎?51
[蔚藍] 新角(睡衣)公開 好有感覺!!76
[閒聊] 鍾培生:規則絕對是統神有利,但裁判不47
[沒倒] 鎖鏈戰記 出大事啦!!!!!!46
[問題] 吉良吉影自我介紹 真的嗎32
[鳴潮] 散華這免費新造型也太低級審美了吧= =42
[問題] 黑白妹 2 DLC FPS忽然降超低40
Re: [蔚藍] 新活動 秘密のミッドナイトパーティー~40
[閒聊] 碧藍航線 7年的變化37
[閒聊] 壞女人的魅力是什麼?35
[蔚藍] 聖誕之前! SP! 生放集錦(圖極多注意)32
[閒聊] 變成付喪神的鋼彈模型33
[情報] 魔都精兵的奴隸 二期 新CV公開31
[閒聊]D4跟POE2哪個值得入手?28
[閒聊] 史丹利敢跟統神打一場拳上嗎?28
[問題] 怪獸8號這部高潮是第幾本?29
[情報] 親女兒閃刀姬又出異圖啦29
[閒聊] 「一步都沒有退」第一個想到誰?28
[情報] GBF11週年活動預告 十二神將演義25
Re: [閒聊] 絕區零的初玩感想39
Re: [閒聊] すき家是怎麼一統台灣速食牛丼江湖的?☺