Re: [討論] 台灣為什麼搞不出DeepSeek?
※ 引述《LinuxKernel (Linus Torvalds)》之銘言:
: 這幾天被DeepSeek洗板,美股盤前也被炸到血流成河
: 但不禁好奇,為什麼台灣做不出DeepSeek這種等級的東西
: 早前機器學習時代,台灣學術界還有LIBSVM可以說嘴
: 但到了GenAI/LLM時代,好像就沒印象有什麼厲害的產出了?
: 幾年前AI Labs橫空出世,似乎也沒聽到什麼太大的impact?
: 問路人可能只對什麼協同帳號分析有印象...
: 究竟是什麼原因,讓台灣在這波GenAI/LLM熱潮顯得落後?
LIBSVM 是學校的東西,而且,它不用OOXX卡。
LLM 要大量的電,因為它要OOXX卡。
再說,LLM 這東西不賺錢,也沒什麼大不了的應用。
最後,本國是硬體立國。我們從不走在前面。
--
open source projects:
https://github.com/terrylao/
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.142.174 (臺灣)
※ PTT 網址
→
蔡明仔:我們只做微笑曲線
→
能賺錢就好,誰跟你做前沿開發,傻
→
了嗎?
推
中研院水電費預算被砍了三成, 台灣
→
國會別說支持了,光搞破壞就發展不
→
下去了!
→
養老院搞AI? 再說,砍三成剩多少?
1X
首Po這幾天被DeepSeek洗板,美股盤前也被炸到血流成河 但不禁好奇,為什麼台灣做不出DeepSeek這種等級的東西 早前機器學習時代,台灣學術界還有LIBSVM可以說嘴 但到了GenAI/LLM時代,好像就沒印象有什麼厲害的產出了? 幾年前AI Labs橫空出世,似乎也沒聽到什麼太大的impact?15
AI = 大量的訓練資料 x 龐大算力 x 頂尖理論人材 地球上只有兩個國家同時具備這三個條件,一個是美國,另一個是中國。 其它國家能作的就是陪跑 比如台灣在硬體部分是很有機會可以摻一腳 撈一筆 硬體以外的部分就別想了 錢投下去 99.999% 跟丟到垃圾桶沒兩樣 --7
LibSVM早就是上古以前的東西了,現在做分類大家也都說拿好的backbone基礎大模型再接一 層硬train一個baseline了,像Meta、谷歌這些基礎模型再預訓練的時候就想盡辦法拿到一 堆沒看過的數據語料圖片設法先讓模型從複雜數據中學會抽基礎特徵,這樣後續你做分類根 本不需要做什麼kernel function 就有能力擬合任意函數。如果你發只是純SVM的東西到現 在ICCV等應用類的頂會只是刷分大概會被直接reject到爆,沒跟這些基礎大模型比根本沒插7
我說啦,中華民國只有兩千三百萬人 本來就應該嚴重偏科(大陸用語) 就是重硬體輕軟體,或是重軟體輕硬體 選一條路走就好 科學家做過很多實驗X
因為吳越人真的比較聰明 自古以來吳越地區都是中國人才聚集地 全中國科舉時代最聰明的腦子就在吳越地區 這次深度求索公司也是在杭州 江浙滬聚集了14億的頂尖精英
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。35
Re: [請益] AI到底是遇到什麼問題?技術跟應用場景的問題我不談,之前的人已經談過了,大致上沒有問題。 不同領域的人可能體驗不太一樣,但LLM普及的程度並沒有這麼低,具體而言,主要是 ChatGPT ,在部分領域已經是不可或缺的必要工具,到了掛掉會影響到正常工作或不能工作的程度。 首先是 coding,就我而言,至少有50%的程式碼已經是由 ChatGPT 完成的,遇到 bug 我幾乎沒有再用 Google 或是 stackoverflow ,log 直接丟進 ChatGPT , 大部分情況下它都能大幅減少我的工作時間。 除了遇到有關於 pydantic 的問題,因為這個 module 最近出了V2,模型的回答經常會混合V1的答案,而且傻傻分不清楚,在之前舊的沒有納入 pydantic 的版本時,這問題更為嚴重,必須要自己先提供文件用RAG 讓它知道。 但是就我實際的觀察周邊的人,發現LLM 對於低階的工程師,高階的工程師的幫助個別顯著,但是對於中階工程師而且有使用上的困難。32
[心得] Wustl LLM轉JD心得(文長慎入,手機排版若有不便閱讀之處還請告知) 一 . 前言 其實非常猶豫是不是應該要發這篇心得文,因為這一路走來並不是非常光鮮亮麗,跟板上 諸多神人相比我實在是非常普通的背景。但是最近發現越來越多人想要出國念JD,而且越 來越多人在想LLM to JD這條路是否可行,因此這篇文是用以給正在迷茫抉擇是否要選擇29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型20
Re: [新聞] DeepSeek在蘋果中國及美國區免費App下載-捲起來 Deepseek 全面引爆美國? 不是 正確來說 Deepseek 是引爆全球12
[問題] llm選校問題 USC v.s. BU代po ————————————————————— 板上各位好: 我近期收到兩個offer:有USC+3500USD獎學金、Boston University+ 5000USD獎學金,其 他學校還沒出來或已被拒絕QQ,就先不討論。8
[心得] LLM轉JD (UMN)看到Joanne大的心得文,決定也來分享自己的心得。剛剛PO了一篇但排版怪怪的, 抱歉重PO 【自我介紹】 非公民沒綠卡,台北大法律學士+碩士畢業。其實本來就一直想出國念書,誤打誤撞在台灣自己執業幾年多後決定還是要出來。 【選校】 當初原本就是想要念SJD或是JD,但是完全不想準備LSAT,所以選校時只考慮允許LLM轉JD同時有開放SJD學位的學校,比較有名的就是WUSTL跟UMN等等,其實我也沒有研究太多,我只知道T14的學校似乎似乎比較沒有轉JD的途徑。如果可以重選一次,我會選擇考LSAT,理由就像Joanne大說的一樣,LLM跟JD的時間線完全不一樣。4
Re: [新聞] 美國紐約州律師考試公布榜單 小室圭「殘我覺得這沒啥好酸的 他才去第一年就要用英文考試 而且是考律師= = 中間還要面對媒體對婚事的一堆提問 你覺得86%好考4
Re: [討論] 中國低成本開發出deepseek 台灣還在睡覺?老實說這個真的是一件很恐怖的事情 在美國晶片禁令之後 大家樂觀其成的一件事 就是可以防止中國在人工智慧上取得重大成果 結果deepseek這間公司才推出v3這個版本3
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套身為LLM猴子,大多同意DrTech的看法,只是台智雲這塊有點不一樣。 其實台智雲有幾乎一半台灣杉2號的機器可以用, 也克服很多開源軟體無法解決的問題;例如硬體是V100不是A100, 又要能夠做3D model parallelism,又要同時能跑LoRA,RLHF, 在100Gbps網路中維持GPU使用率滿載等等。在meta llama出來之前,