Re: [新聞] 日本AI研究第一人這樣評價Deepseek
三民治以及蟾蜍網紅
很喜歡用北一女筆記這個比喻去打DS
應該是當時候收錢
給的文案就是這樣寫的吧
但是對AI有一點概念的人
看了真的覺得在瞧不起人民智商
根本是在亂噴
對AI有興趣的
強烈推薦台大李宏毅老師的頻道
https://youtu.be/cCpErV7To2o?si=fhemvtkydilYOMwt
簡單來說
AI的成形分三階段
比較好的比喻是
第一階段是生一個小朋友(pretrain)
第二階段是讓他學校上課學習(督導式學習)
第三階段則是對這位小朋友的回答提供反饋(RLHF), 告訴他哪一個回答比較好
很明顯第一步要生出小朋友是比較困難的
要花很多的資源去train一個模型
打造他的樣子 捏他的臉型 膚色 外型比例之類的
這也是為什麼OpenAI 和meta花了這麼多錢的原因
而台灣乃至美國的學校所謂的發展AI
大部分都是拿這些Meta開源的模型(小朋友)
去用他們自己的資料去微調參數
有點像是讓這些Meta生的小朋友
去不同學校上課
培養出不同個性和學識的小朋友
這個就相當簡單
簡單到幾個禮拜就可以做完
也不用花什麼錢
所以當你看到新聞
說什麼哪個學校或哪個機構發展自己的AI
花的時間少 成本還很低
你可以看看就好
沒什麼稀奇的
而 Deepseek 呢?
他是和那些學校和機構一樣
拿別人已經生出來的小朋友去上學
就說自己發展出AI了嗎?
人家可不是這樣
他跟OpenAI 和Meta一樣
都是從頭開始
自己捏出一個自己的小朋友
生出這個小朋友的成本還極低
而且在運作時
這位小朋友消耗的能量也少
生的時候花的力氣少
生出來後吃的東西也少
這是什麼神仙寶寶
這才是各界震驚的原因
Deepseek的確是讓人類在AI發展邁進一大步
並不是三民治在那邊造謠就可以抹滅
有良知的媒體和政府
應該讓人民認知我們自己目前的不足
然後砥礪大家前進
而不是拿一塊布把大家眼睛遮住
一直騙說別人只是作弊
我們沒有很差
把時間浪費在造謠和口水
倒不如把時間花在了解和學習
人家跑在前面又怎樣
努力跟上去就有機會反超
而不是自欺欺人
導致永遠地落後
-----------------
附上懶人包
簡單介紹AI成形三階段
再次感謝李宏毅老師的貢獻
http://i.imgur.com/6KO6GvX.jpg
※引述《netflix06 (OK )》之銘言:
: 我的理解啦~
: 這就好像一個北一女的筆記本出售,
: 有人去讀那個筆記,
: 可以在考試上接近不錯的分數,
: 後來又再出售自己的筆記,賣得很便宜,
: 然後呢讀書方法這種事真的還是講興趣跟天份的吧,
: 有興趣的話,可以融會貫通,
: 跨領域聯想,可以一直舉一反三,
: 再來,也有底蘊底氣的不同,
: 西方國家如果做比喻的話就像三代文人家族,
: 從祖父開始是哪裡的狀元在哪裡當官,
: 有什麼門生人脈再到父輩;
: 然後中國就像寒窗苦讀,
: 不是鬥不起,
: 是資源掌握跟運用的問題,
: 幾十幾百個寒窗苦讀的人,
: 讓他們都考上狀元榜眼探花舉人秀才,
: 全部加起來,也很難比過三代文人望族世家貴族階層;
: (例如被限制取得先進光刻機)
: 再來,個性決定命運,
: 這話也能套用在國家民族特性,
: 如果將美國跟中國各看成一個人,
: 一個是擅長創新而且鼓勵自由發展,
: 一個是偷竊邀功欺上瞞下,鼓勵不公平競爭個性的人,
: 這兩個人會有什麼發展,其實不難推斷,
: 回到現實面,科技的發展取決於晶片,
: 晶片的IC設計-美國矽谷跟以色列最強,
: 晶片的製造-先進製程-台灣台積電最強,
: 目前deepSeek 就像剛剛舉例抄筆記,
: 可以達到AI運算,
: 但是實際比較運算能力跟速度,
: DeepSeek 還是比不上chatgpt.
: DeepSeek 對比 chatgpt
: 就像比亞迪追趕特斯拉,每當追上了硬體或軟體,
: 特斯拉又去研究新的領域,
: 無人駕駛技術或機器人發展或太空領域探索。
: ※ 引述《anti87 (天機老和尚)》之銘言
: : 原文標題:日本AI研究第一人這樣評價Deepseek
: : 原文連結:https://reurl.cc/5DxgVR
: : 發布時間:2025/02/13
: : 記者署名:徐潮、鈴木健二朗、岩澤明信
: : 原文內容:
: : 中國初創企業DeepSeek(深度求索)開發的高性能、低成本生成式AI(人工智慧)大規模
: : 語言模型(LLM)受到了全世界的關注。日本經濟新聞(中文版:日經中文網)就如何評
: : 價該公司的最新AI模型、安全性方面的風險、以及對日本企業的影響等問題,採訪了日本
: : AI研究領域的第一人、東京大學教授松尾豐。
: : 性能與美國OpenAI接近
: : 記者:您如何評價DeepSeek的技術?
: : 松尾豐:技術很出色,性能與運營「ChatGPT」的美國OpenAI接近。(DeepSeek)
: : 每次發佈新的AI模型,都會發表論文,詳細説明模型採用了什麼樣的技術,以及花費心思
: : 實施的改進之處。
: : 該公司還同時以(任何人都可使用的)開源方式進行公開。1月發佈的最新模型「
: : R1」進行了提升推理能力的強化學習。最終展現出了與OpenAI的「o1」同等的推理性能。
: : 在中國,AI開發十分活躍,孕育實力企業的環境不斷擴大(DeepSeek的APP界面,REUTERS
: : )
: : 記者:在AI開發方面,美國一直處於領先地位。競爭的勢力格局是否會發生變化?
: : 松尾豐:作為大前提,中國的AI水準相當高,可以與美國比肩。至少從頂尖(學會
: : 採納的)論文數量來看,中國已經超過美國。
: : 另外,中國還有阿里巴巴、騰訊、百度等其他很多實力強勁的企業,擁有眾多優秀
: : 原文標題:日本AI研究第一人這樣評價Deepseek
: : 原文連結:https://reurl.cc/5DxgVR
: : 發布時間:2025/02/13
: : 記者署名:徐潮、鈴木健二朗、岩澤明信
: : 原文內容:
: : 中國初創企業DeepSeek(深度求索)開發的高性能、低成本生成式AI(人工智慧)大規模
: : 語言模型(LLM)受到了全世界的關注。日本經濟新聞(中文版:日經中文網)就如何評
: : 價該公司的最新AI模型、安全性方面的風險、以及對日本企業的影響等問題,採訪了日本
: : AI研究領域的第一人、東京大學教授松尾豐。
: : 性能與美國OpenAI接近
: : 記者:您如何評價DeepSeek的技術?
: : 松尾豐:技術很出色,性能與運營「ChatGPT」的美國OpenAI接近。(DeepSeek)
: : 每次發佈新的AI模型,都會發表論文,詳細説明模型採用了什麼樣的技術,以及花費心思
: : 實施的改進之處。
: : 該公司還同時以(任何人都可使用的)開源方式進行公開。1月發佈的最新模型「
: : R1」進行了提升推理能力的強化學習。最終展現出了與OpenAI的「o1」同等的推理性能。
: : 在中國,AI開發十分活躍,孕育實力企業的環境不斷擴大(DeepSeek的APP界面,REUTERS
: : )
: : 記者:在AI開發方面,美國一直處於領先地位。競爭的勢力格局是否會發生變化?
: : 松尾豐:作為大前提,中國的AI水準相當高,可以與美國比肩。至少從頂尖(學會
: : 採納的)論文數量來看,中國已經超過美國。
: : 另外,中國還有阿里巴巴、騰訊、百度等其他很多實力強勁的企業,擁有眾多優秀
: : 工程師。在這樣的生態系統中,AI不斷得到開發與應用。出現DeepSeek這樣極具實力的企
: : 業,並不令人驚訝。
: : 對日本企業來説也是一種鼓舞
: : 記者:您如何看待DeepSeek的出現對日本産生的影響?
: : 松尾豐:日本也需要努力開發生成式AI模型。像DeepSeek這樣並非大型科技企業、
: : 也沒有雄厚資本的公司,竟然能夠實現世界最先進的精度,這對日本的初創企業來説也是
: : 一種鼓舞。即便在日本國內,只要紮實地進行技術開發,就有可能實現這樣的飛躍。: : 很多日本的AI初創企業從松尾教授的研究室誕生(2024年10月攝)
: : 記者:您如何看待像DeepSeek這樣的企業採取開源戰略的動向?
: : 松尾豐:最初採取開源戰略的企業是美國Meta,該公司推出了「Llama」。後來,
: : 中國阿里巴巴推出了性能非常高的模型「Qwen(通義千問)」。在日本,基於這兩家企業
: : 的模型進行追加學習的動向也十分活躍。如果基礎模型紮實,就能輕鬆提升性能。
: : 不過,開源強大,還是OpenAI及美國谷歌這樣的非公開系統強大,競爭始終存在
: : 。哪一方勝出會因狀況而變。
: : 這次DeepSeek的出現,使得開源方面的勢力得到了很大的恢復。雖然OpenAI及谷
: : 歌擁有性能卓越的非公開模型,但這表明開源也能夠做到同樣的事情。
: : 安全風險因使用方式而異
: : 美國OpenAI在應對DeepSeek的崛起(首席執行官薩姆· 阿爾特曼,REUTERS)
: : 記者:對於利用現有AI模型輸出的數據來創建新的生成AI的DeepSeek的「蒸餾」技
: : 術,OpenAI指出這種做法違規。
: : 松尾豐:我不知道情況的真假。在美國企業之間,這樣的傳聞非常常見。這次也可
: : 能涉及(中美的)政治含義。
: : 記者:您如何看待使用中的安全等風險?
: : 松尾豐:是利用DeepSeek的開源還是使用其服務?根據使用方式的不同,風險也不
: : 同。開源可以下載程式並在本地運作。這樣的話,數據不可能被發送到某個地方。
: : 另一方面,DeepSeek的APP服務在中國的伺服器上運作。一旦輸入數據,這些數據
: : 就會發送到中國的伺服器,在中國進行處理並返回。雖然表示不使用這些數據進行學習,
: : 但實際上並不排除使用的可能性。
: : 這點不管對於DeepSeek還是OpenAI來説都一樣。這是一個你對對方投以多大信任的
: : 問題。
: : 記者:圍繞AI的智慧財産權和資訊洩露問題,中美間的對立似乎還會加劇。
: : 松尾豐:美國(海軍和某些州)提出不要使用DeepSeek。但從研究者的角度來看,
: : 我並不認為DeepSeek做了什麼特別的事情。相反,我認為他們只是在好好搞技術並將其發
: : 佈。
--
清晰的比喻
好奇如果是自己生出來的 怎麼會回答我是chatgpt?
還是其實也是被黑的XD
因為第三塊啊 合成數據原因RLHF用RL取代=_=...
因為"我是誰"是哲學問題,現在AI還只能靠人餵的資料
去認知自己。
Deepseek也是用別人模型蒸餾出來的好嗎= =
看別人教材自己編講義有什麼問題嗎? 至少學習方法跟
推臺大李宏毅老師
講義編法有改良進步啊!
起手勢就扯政治,證明這種廢文就沒可信度
對於有這種立場的帳號,當廢話聽聽
DS一個重點就是證明第二階段不重要,之前花一堆力
氣在那邊人工做教材教,結果發現AI自己就能通了
去政黑
DS如果不是中國發布,大概就不會有人扯政治了
DeepSeek v3並不是蒸餾 好奇的是training data來源
樓樓樓樓上 你認真=_=?
第三方的open deepseek 搞出自己版本的合成數據了
現在一堆人殺入如何設計用大模型生數據創造思考
ai真他x捲 今天我看到paper已經提到關鍵是structure
很懷疑就去了解別人的論文 很難?
說真的很感慨啦 尤其是唐鳳沾沾自喜繞過64議題
台灣什麼時候變得這麼沉淪 我們應該趕快發展AI
而不是阿Q心態說這又沒多強
羨慕中國研發能力強大 反觀
@@ 買個4090 實作一下 就很有快感啊 去摸摸比吵架好
deepseek 現在問第二次就死,答案還一直幻覺,這東
西早就沒用了。我現在只想等這個月gpt5 和claude4
付好費等他更新
我只能說用過deepseek 後,真的沒想像中的好用,控
制力真的還不能拿來應用在各種場域中
我觀察這邊deepseek吹的問題,不是生活或工作幾乎沒
真的使用過ai,就是連deepseek都沒打開來用過只看新
聞,實際要用,gpt claude才是最好的工具,不是deep
seek這垃圾==
DS強項是便宜好嗎
沒有你腦補這些
而且DS並沒有那麼神,會震驚一方面是他從中國來
松尾豐說DS技術很出色 樓上說強在便宜 誰是對的?
台灣是小國,能選的路線有限,倒不一定要去
硬拼AI
便宜不算技術出色嗎?
都對啊 ds不如o1 claude 但是免費
o1 claude 20/200 鎂刀
我沒有說他不出色啊,但不是原po講的那樣
o1大概6-10萬可以下載在本地端接你的知識庫
說錯ds ds可以你在家自己部署 closeai claude 可
不行
優化很強 並不代表基礎全都自己做耶 MOE才是重點
不要671b的甚至一般顯卡也能跑 開源就是屌
你看上面免費仔網頁用一用就判定死亡
誰被中國便宜貨卷到都沒好處,現在在吹什麼,股板
推
台灣軟體實在不行
看企業獲利,不是看百姓便不便宜
但DS只會是AI發展的一個過程
遠遠不會是最終解
我不覺得台灣要發展軟體,人口不夠
台灣務實的方法,應該是利用台積的優勢發展本土供
應鏈
你就算講那麼白話還是一堆人看不懂啦!他們只會中共
抄襲,還好台灣沒有什麼AI軟體股,要不然這群人一定
是韭菜中的韭菜,笑死!
小國可以拿人家的東西來改啊,而不是直接禁止啊,當
年荷蘭打獨立戰爭一樣有和哈布斯王朝貿易啊
台灣學DS幹嘛?你先學不發廢文先
跟著喊 抗中保台 抵制china
我們才兩千多萬人口,怎麼跟人比
我們有台積電!!
開源就是站在過去的巨人上優化在優化 meta/MOE都是
這波AI大語言模型都降低那麼多軟體業門檻了,寫碼成
本直接爆減,有好的idea都可以靠這波新創起家了,台
灣還不趁這個機會發展軟體產業,有錢賺也不會賺,真
的棒!呵呵!
就是優化很好的AI演算法 邁一大步有點誇張 哈
倒不如去研究光阻劑之類的
研究光阻劑?認真?專利早就被人家卡死了啦!呵呵!
會說問第二次就死...大概不知道要調一下對話流設計!
看到什麼都想做,只會資源分散
當然我也認為"花錢無腦用"才是最好商業模式,問題這
這串是在討論技術。
被卡也要培養啊
軟體產業寫程式碼是最不會被專利卡的,結果台灣完全
放棄,連到現在有好的idea餵ChatGPT搞不好程式碼就
生出來了,也不會用,難怪只能花大錢生個點麵線,笑
死!
而且AI不一定賺錢,台積供應鏈是有母雞的
那你怎麼不去研究
連用AI工具都不會還想研究光阻劑?人家該研究的早就
搞完了,真的是想太多,研究光阻劑還是洗洗睡吧?
你知道人家研究光阻劑的都是專利直接卡官能基嗎?好
用的早就沒了,還輪到台灣?
人家AI都是多少規模的在做,你以為只有寫code喔
都是幾億人口大國才撐得起來
軟體產業不是只有AI懂嗎?用AI來產生服務性軟體可以
大幅降低成本,懂嗎?
台灣可以做應用面就好了
資源有限的小國,不可能面面俱到
我知道你不懂啦!這也是為什麼國外瘋AI,人家國外新
創懂得花小錢用ChatGPT生成軟體,而國內還在我們有
台積電,呵呵!
不然你看其他小國都在做什麼
台積電本來就很重要了
我講的才是務實面的東西
你發展供應鏈,才更好去跟人談判
確實 股版一堆沒知識的
全台灣才幾間實驗室
你是要台灣實驗室都去發展AI跟人拼喔
軟體產業是成本最低的產業,有大腦有一台電腦就可以
了,知道國外那些科技巨頭當初起家時成本多低嗎?只
有台灣還在我們有台積電,笑死!
那為何全世界國家幾乎都是用美國,一部分中國的軟
體
軟體幾乎就是winners take all的東西
而且那些軟體,還不是很多都要台積晶片
我覺得講白了到最後的結論就是台灣人不夠聰明,連大
陸人都屌贏台灣,那個被你是誰你要做什麼的馬雲起家
金也超低,但換個方向思考就是台灣當奴工的才能屌贏
大陸,呵呵!
看成日本研究AV第一人 該換眼鏡了
你不會不知道馬斯克是南非起家的吧?
那你怎麼不叫那些軟體業者自己製造晶片
拜託,馬斯克都跑去美國起家了
這篇一開始講得義正嚴辭,要講重點時就歪掉了 @@
因為不需要,最聰明的大腦負責搞軟體,收割奴工代工
那馬斯克為何不在南非發展
們的最大利益就好,看看現在就是如此。
免費的可以回答一堆,但只能做一些不重要的應用,結
果重要的商業應用還是要用付費的ai來解答,請問這個
免費的到底有降低多少成本?我看起來是徒增成本,de
epseek 只有一個貢獻,就是讓gpt和claude 趕快出新
一代,真的要使用ds我想還是算了
美國中國都很想要晶圓製造好嗎
因為任何一個公司搞大就是要走向世界獲取更多投資,
奇怪我是在跟三歲小孩講道理嗎?
奴工奴工的也很好笑,你以為軟體不奴嗎
你講那麼多道路,怎麼不親自示範一下
道理
軟體奴但是屌贏代工奴,能在矽谷當碼農會去intel當
作業員?
你要不要先設計軟體來跟我們看一下
不是成本很低嗎
講不贏要放大絕囉?笑死!
按照你的聰明才智應該可以吧
當然可以呀!ChatGPT會用就可以,呵呵!
台灣很多實驗室研究類神經網路喔
要不要加入一下
那那麼多實驗室有多少H100?笑死人!
發展軟體 硬體成本不高 但人工成本很高 台灣老闆又
覺得人工只值幾塊錢而已 誰想做?
而且已經研究十年以上了
所以台灣哪個軟體公司獨佔世界市場夠強的?
我們學弟跟著AI熱潮一堆去研究,還造成人才短缺
對啊,然後你看結果呢?那些人不聰明嗎
四大的喔
如果你那麼有熱忱,可以去試試看啊
連H100都沒幾張了,原po講的台灣AI大咖李宏毅都沒幾
張H100,這還只是單純花錢就可以辦到的事,台灣這幾
年不是賺很多錢嗎?買不起H100也太奇怪了吧?
ds你現在架起來,gpt5和claude出下一代表現更好,你
架起來硬體的錢不還是浪費==然後你說ds下一代如果不
開源,要你付費了,你最終還不是要面臨花錢選邊站,
既然始終要花錢,為什麼不一開始就花錢在最強的那邊
,美國==
講到最後的結論就是什麼都不如人,還是回去我們有台
積電吧?最簡單最能自嗨,笑死!
不用買啊,用租的就好了
對啊,那你講到現實面了,要去租顯卡,那錢呢
要接個人知識庫只能本地部署
我們有台積電,那為何不跟台積拿錢
你說專利,科技業不都專利卡來卡去
ds發展並沒有錯,因為大陸有那個需求,也有足夠資金
投入並獲利(反觀更有錢的台灣),而且就算是開源也
是有獲利模式的。
高通卡一堆專利,聯發科為何還做起來了
原來台灣沒錢呀?現在是終於要承認台灣只有台積電當
奴工的份了嗎?呵呵!
只要本土供應商肯研究,台積一定肯出錢的
因為聯發科靠arm公版好嗎?
你知道聯發科是靠arm授權的吧?呵呵!
最好是那麼簡單
你以為只有arm就夠了喔
就這麼簡單,沒有arm授權,聯發科直接死,呵呵!
你也太小看工程師的能力了
現在人家高通已經要計畫脫離arm,而arm也打算自己生
產晶片了,還不知道嗎?
那照你邏輯,高通也一樣啊
推
你以為當arm自己推出晶片的時候聯發科還吃香喝辣呀
?笑死!
那高通研發了嗎
還不是靠arm起來的
人家早期靠arm,但人家知道靠別人終究不穩,所以要
自己搞了,這麼簡單的道理也不懂?現在arm要自己推
晶片,聯發科就會越來越尷尬,呵呵!
白癡,聯發科的ai我用過,很爛,為啥就不能回到產品
面到底好不好用來討論,還是你又要說是國家不投入導
致研不出來,但按你邏輯ds開源免費你應該就要做得出
屌打gpt和claude 的東西啊== 然後講一堆,國籍競爭
力中美必爭的最後還是跑到台積身上,而不是聯發科,
不覺得你挺的東西很矛盾嗎?
尷尬?你也想太多了,他們又不是要做手機晶片
還是你已經推導出之後要做手機晶片了
高通一個影都沒有,而且那是跟arm打官司搞出來的
你知道發哥現在已經不輸高通了嗎
這還是高通設一堆關卡下做出來的
這就證明了,就算卡專利,還是可以發展啊
人家孫正義可不認為不做手機晶片耶?呵呵?
有沒有看到考慮兩個字
蛤?所以你是中吹喔?那你移民去中國不就好了==
而且那是新聞報導的
你確定可信嗎
arm不下來自己幹,就會輸給高通跟蘋果的自研晶片,
最後喪失市場,至於聯發科算什麼咖,人家根本不放在
眼裡,笑死!
而且我的重點是,我在證明卡專利還是可以研究啊
好,趕快移民,沒加蓋
說聯發科什麼咖就更好笑,發哥很強了
下游專利照樣被上游專利卡死啦!懂專利研發嗎?有申
請過專利嗎?我有喔!
你還在發哥低階的年代?
你先回答我沒有arm授權聯發科做什麼手機晶片這個簡
單的問題就好,笑死!
這個重點是什麼
那高通就不是用arm?
如果發哥可以成功,台積供應鏈為何不行
你扯來扯去發哥多神,我就直接嗆明arm不授權發哥手
機晶片直接收攤啦!呵呵!
你知道什麼是自研架構晶片嗎?你知道高通蘋果在玩什
麼嗎?
發哥市佔已經超越高通了
台灣是拿了一堆錢結果做了一堆糞
而且我重點是,就算卡專利,還是可以研發不是嗎
那你的重點是什麼
然後呢?發哥靠arm,人家arm現在要自己玩,到底懂不
懂呀?你知道arm要自己下場是被高通跟蘋果逼的嗎?
呵呵!
不授權gg沒錯啊,但這就是合作
台積供應鏈還不是一樣,一個環節都不能缺
所以今天才要培養台積供應鏈啊
高通跟蘋果不想再被arm授權卡死,所以自研架構晶片
,這兩大arm客戶沒了市場份額直接完蛋,arm為了提早
準備只能自己下場,到時候就會重演HTC跟Google事件
了,呵呵!
然後你又說供應鏈不行,那你要什麼
政府一些公部門都禁止用大陸AI!呵
這個不是新聞腦補而已嗎
試管嬰兒 跳過最花錢的愛愛(誤
那你覺得供應鏈不行的地方在哪裡
自己生出來的小孩,回答自己是chatgpt???是不是被戴
綠帽了
做代工不是唯一,還搞不懂喔?為什麼現在台積電危險
了,因為你全部關鍵被美國上游技術跟盟友原物料卡死
,管你供應鏈整合多強,川普拳頭下去,你就是奴才,
呵呵!
好可憐,明明出生的時候都是為了自己的生存而活,結
果讀書時被思想灌注洗腦成自己的性命來自於國家,要
你捨棄你身為生物的本性,讓你現在心甘情願為國家死
,極權國家最喜歡你這種思想了,讓個體去死可以不付
出一點代價最有效的就是思想的洗腦,愛一下自己吧==
照你的邏輯,沒有arm發哥不行,那台積不是更該警惕
賠錢也要自己發展本土供應鏈
原來美國是極權國家?神了!還有不好意思我是台灣人
中華民國國民,笑死!
你說我講的是不是很合你說的狀況
所以台積電哪個技術脫離的了老美控制?麻煩講一下,
呵呵!
對啊,斷供會有危機,所以要建立啊
聯發科處境就跟台積電是一樣的,你就是不懂而已。
如果這都做不到,那其他怎麼拼
所以要建立啊
為何你反而覺得建立供應鏈不重要
有拼嗎?沒有吧?有拼還會像現在對川普毫無抵抗力?
照你的邏輯,高通也要建立啊
你知道嗎,差別在是不是讓政府權力越小,個體權力越
大,民主國家的最終型態本來也是最小政府的概念,政
府對個體的剝奪權力越小,個體自身的權力越大,然後
對於願意犧牲的個體給予更高的福利與尊敬,你在想這
是不是美國
對啊,那你為何又覺得台積不用建立
政府說台積電去美國沒有踩紅線,這可是最新的新聞,
呵呵!
你這樣講不是矛盾嗎
台積有供應鏈不是更好談判嗎?然後你說不用
對美國國民是呀?你的思考方式很奇特喔!美國對於美
國國民完全就不是極權國家,比台灣更不是。
買就好了。但是高通你覺得自己來可以
不覺得怪怪的嗎
美國國民聯合訴訟大企業是可以搞到美國大企業破產的
,台灣行嗎?自己好好想想吧!
難道arm就沒卡專利?
自研架構就是要拜託專利卡啦!
擺脫
所以只有洋人沒有專利問題,這是你的意思?
對啊,那台積供應鏈為何就不行擺脫?
然後你在想想極權國家是什麼情況,國家不願意放棄自
己剝奪個體的權力,用思想洗腦方式,讓個體相信政府
應該要有更大的剝奪個體權力,來比較好管理多數人,
越是極權的國家,你的生命就越不值錢,如果你說美國
不好,那你覺得中國比較好嗎?
洋人有專利問題,但人家會想辦法不被別人控制,而且
你不覺得自己在雙標嗎
不只洋人,人家華為最新的晶片價架構也已經脫離了ar
m。
台積電比高通還有錢耶
對啊,所以重點呢?
你到底在說什麼?美國哪裡是極權國家?你自己定義的
嗎?笑死!
所以你的重點是高通華為可以自己發展供應鏈,台積
不行
是這個意思嗎?但台積電好像更有錢耶
而且你自己打的東西,你自己想想台灣有沒有吧?我就
而且市場地位更高
直接回答你美國不是極權國家,川普的作為是為了履行
他的政見,完全正常。
是阿,美國不是極權國家,那中國是極權國家嗎?你想
去極權國家嗎?
照你的邏輯,我講的不是更務實嗎?
一開始供應鏈一定會賠錢,不如進口
但靠台積輸血會越來越好
中共是集權體制,但有人在討論中共嗎?現在是流行比
爛大會是吧?現在是中共威脅台積電嗎?呵呵!
不用馬上跟進口一樣好
台積電一年賺上兆,有的是錢
OK,反正我們有台積電,呵呵!
我看你的意思很像是,說美國對台灣不好,所以中國更
好的意思捏?高通都搬出來了,前面還在吹deepseek
,如果覺得中國比較好為什麼不移民去中呢?
而且晶圓製造是台積獨大,可以玩
我講的這個不是比你的AI優先務實嗎
claude最好 但是免費版本限制多
deep太多爭議實在很難說到底怎樣 但至少檯面上已經
端出來 台灣只有麵線…
你說美國不好 台灣也不好 然後中國最好 ,中國這麼
好為什麼不選擇移民呢?門檻最低吧?
DS也是蒸餾出來的好嗎,才不是什麼自己從頭開發
gpt要付費版本才比較追得上claude
不然頂大研究AI的不多嗎
中吹應該看下之前怎麼在股版瞎吹捧ds、嘲笑chatgpt
和nvidia。結果兩個星期後,chatgpt在app store又
重新超越ds,後者的股價也逐漸回來
結果頂大一堆研究生做AI 十年過後還是這樣而已
也不是沒成就,AlphaGo之父就台灣人
舉的例子有點怪
你真的當這裡是柵欄版喔?完全不演了!
柵欄仔發錯板了
很白話的解釋,應該置頂精華
我只知道台灣只有套皮deepseek
怎麼在駡政府呢, 應該去罵習維尼64啊
駡政府是不行的唷,看看usaid
該桶了
李宏毅幾班
你這篇讓一堆人破防大罵怎麼不移去中國XDDD
美吹只能拿輝達股價回升跟下載量應了,也不看看Clos
eAI開始打價格戰了
v3的訓練數據肯定也有包含OpenAI生成的 嚴格說來也
算是有蒸餾在裡面吧 只是他們把蒸餾這個方法做的很
好 甚至驗證在小模型上
這個要水桶10年 太明目張膽了 直接寫在第一句
v3本來就不可能是完全從頭自己來的你這篇先等等
ds不是你說的第一階段就自己開發
中吹崛起
是啊 可是政治腦會說你中共同路人
deepseek v3基於v2 v2基於DeepseekMoE
讀完DeepseekMoE的論文就知道一二了吧
更別說R1這種蒸餾Llama與Qwen的產物了
DeepseekMoE的論文開頭就說基於傳統MoE模型了
到底哪來從頭自己捏小朋友
跟中共同路人還是反共同路人沒狗屁關係,純粹之前
被吹過頭。現在熱度不見,多數人還是繼續用chatgpt
小紅書之前也是一樣吹上天,結果現在哪還有什麼小
紅書移民潮
最大的貢獻在開源。幾乎每個業內公司都花了百萬美
元把它部署上去了。
Just 16-32個h100, 就可以有最好的llm 來加工
ds說白了就是貢獻ai眾多進步當中的一步,但硬要瞎
吹最後就是和現實脫節
對你的解釋也沒興趣 這裡不是在ㄟㄞ課
水桶見
Deepseek問題是伺服器繁忙
訓練資料哪來的?拿別人模型輸出的
中國一定有很棒的地方,台灣不需要和中國比較
DS沒pretrained,你可以專業一點嗎?不要自打臉。
我斑願稱你為體術第一人
還要拿台大教授來背書…教授知道嗎?這邊不是八卦
版
笑死
走水溝反超,棒棒的。
看來很多人V3和R1傻傻分不清楚
買個5090實作一下 很好用的
很厲害
de開源被檢視
你當大家都沒出過社會?會被你這個震住?
拿台大來震壓社會人士?
你不要丟臉了
我只能說deepseek很多人吹,結果用起來沒那麼強,這
才是重點,第二次開始繁忙,回答這麼跳,最後要解問
題還是用gpt claude ,最強ai? 這跟中國人滿腦子自
己超越美國,但數據一攤開美國不知道輸了哪,這種洗
腦法真的看了讓人覺得相當弱智
推個
講強弱的從頭到尾搞錯重點 重點在成本好嗎 唉
伺服器繁忙正常 他就不是要靠這賺錢 還是有其他家DS
的服務 Azure目前免費 中國也一堆公司DS限免 perple
xity付費也能用
排名就擺在那 livebench第三 chatbotarena第四
然後我記得R1不搞RLHF 他是直接用真的RL
這也是它這次的亮點 借鏡AlphaGo-Zero
R1有蒸餾版 和 滿血版671b 怎麼現在還有人沒搞清楚
蒸餾版最大也才70B
鬼扯,DeepSeek是拿Meta的開源模型進行優化
不是無中生有幹一個模型出來
那人家的補習重點再出一版精簡版講義....
推分享
你要吹捧也不要只講一半啊 Deepseek隱藏層參數怎麼
來的怎麼不介紹一下
還從頭捏勒 好會扯
蒸餾版qwen,llama的模型,是訓練完671B滿血版才做
的事,llama中文這麼差,蒸餾它完模型還會變笨,要
懷疑的是到底有沒有蒸餾openai
還捏出一個小朋友咧,很會胡扯,DeepSeek是用蒸餾
技術利用別人的模型,最好他是自己捏出一個小朋友
啦
1X
我的理解啦~ 這就好像一個北一女的筆記本出售, 有人去讀那個筆記, 可以在考試上接近不錯的分數, 後來又再出售自己的筆記,賣得很便宜,X
的確講得不好,自刪囉 -- 全書贈閱 《推背圖諰:中國國運與人類命運之預言憂患》全書PDF檔 免費流通 詮釋《推背圖》,反省過去,展望未來,自二十一世紀浩劫後重建人類文明,X
中國有deepseek 美國有chatGtp , 台灣有你們兩位AI大師+那台大什麼很屌的教授, 疑? 怎麼台灣什麼都沒有?? 好了啦AI大師們,
沒辦法啊 巧婦難為無米之炊 研究機構或大學院校 學生一邊要讀書 還要一邊開發系統 然後沒什麼錢賺 怎麼可能弄得出像樣的東西 新創公司經費有限 花不起這麼大的錢X
我不懂ai 想問從無到有都自己做的話 那紅框裡的文字是正常的嗎? deepseek說自己是基於gpt 3.5或gpt 4的架構,並且核心模型是gpt 3.5/4![Re: [新聞] 日本AI研究第一人這樣評價Deepseek Re: [新聞] 日本AI研究第一人這樣評價Deepseek](https://i.imgur.com/Y6gj6VUb.jpeg)
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預會恐慌是美國那些公司的心態有問題,他 們幻想的是自己能獨佔AI領域,幻想他們 燒大錢最後生出來的大模型可以抬價收費 meta的模型號稱開源講白了就只是因為差 openai太遠所以把資源丟出來靠龐大共享![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/1EERwjXb.jpg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
11
[問卦] 有沒有小朋友或大人以為AI是近年發明的其實AI的概念在1950~1960年代電子計算機 (電腦)尚未普及的年代就已經出來了 只是因為到2020年代以前 電子計算機的運算速度實在實在是太慢了 所以當初終究只是個概念而已 一直沒被實現出來![[問卦] 有沒有小朋友或大人以為AI是近年發明的 [問卦] 有沒有小朋友或大人以為AI是近年發明的](https://img.youtube.com/vi/v18BYHNotm8/mqdefault.jpg)
10
Re: [問卦] DeepSeek成本這麽低的原因是啥?分兩個部分來說, ——————————————— 第一個部分是澄清: DeepSeek 是微調別人做的基本模型。 比如臉書 meta 花數千萬美金或上億美金做出模型 llama.![Re: [問卦] DeepSeek成本這麽低的原因是啥? Re: [問卦] DeepSeek成本這麽低的原因是啥?](https://i.imgur.com/O3nSbTXb.jpeg)
3
[問卦] 台灣為何沒有發展自己的Ai大模型?台灣的各大科技公司或政府力量怎麼沒有發展自己的開源Ai大模型,打造台版的Deepseek? 是因為資金不足嗎? 發展AI大模型需要龐大的資金與運算資源。台灣難道不沒錢發展專門的超級運算中心? 還是沒有人才? 現在不少頂大畢業只想去考公務員? AI技術需要大量的高端人才,特別是數據科學家、機器學習專家以及研究型工程師。大陸和美國有許多頂尖人才,而且那裡極佳的薪酬與資源。 到底是什麼原因沒有開發出繁中版的AI開源通用大模型? --5
[黑特] lono小朋友快來 AI白痴國家+1澳洲政府禁止公家機關使用deepseek 理由是保護國安 路透社這篇也有提到台灣政府也有禁 lono小朋友前幾天說卓榮泰是AI白痴![[黑特] lono小朋友快來 AI白痴國家+1 [黑特] lono小朋友快來 AI白痴國家+1](https://static.euronews.com/articles/stories/09/02/57/36/1200x675_cmsv2_05d33d52-0a1b-5e31-ac40-24bef244703c-9025736.jpg)
6
[討論] 日本AI領域權威評DeepSeek的表現跟風險日經中文網翻譯採訪報導,找來日本專門研究AI模型的權威討論DeepSeek 日本AI研究第一人這樣評價Deepseek l 簡單做個結論,就是光以資料會被利用這點用哪家都一樣,看你能接受給誰用3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI