Re: [問卦] DeepSeek怎突然沒人用了
算力應該不是問題 因為現在的LLM是接龍遊戲
整體的母體資料是有限的,算的快,算的慢,最終他就是能算完,用的資料就是這些
差異是用這些靜態的資料,到底要應用到什麼地方?
現在每年能加強LLM的能力已經看到天花板了,每年新加入的資料很難提升LLM的能力了。
現在開始要找應用面了,要是找不到突破性的應用面,就慘了。
※ 引述《TameFoxx (foxx)》之銘言:
: 但為啥現在效果這麼糟
: 單純就是因為算力太過受限
: 如果能買到輝達最新的GPU那結果可能就不一樣了
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.127.118 (臺灣)
※ PTT 網址
→
正解 因為現在的AI終究也不是真的AI
推
找不到啊 頂多變成新的瀏覽器
→
Openai要進軍情色領域了,大陸這些公司能
→
做嗎? 不能做會被甩遠哦
→
色色
推
再怎麼吹不能創造真的產值也就泡沫
噓
LLM是接龍遊戲 但是推論能力兩邊差很多
→
嚴格說LLM沒有「推論」能力。
→
你覺得他有推論,那就是不瞭解LLM了
推
所以你覺得數學競賽怎麼達標得?
→
有聽過「Chain-of-Thought」嗎?
噓
COT也可以拿出來吹
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。![Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套 Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套](https://i.imgur.com/s6MWLNmb.png)
26
Re: [心得] 蘋果揭露人工智能並不思考1. 首先 , 蘋果是最沒資格說話的 先看看蘋果AI的鳥樣 2. 蘋果 : 人工智能不能思考 這句話有很大的問題 現在的AI主流是經由大量資料訓練29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://i.imgur.com/vA7ifFRb.jpeg)
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。![Re: [爆卦] 中央研究院詞庫小組大型語言模型 Re: [爆卦] 中央研究院詞庫小組大型語言模型](https://llama-chat-4fcmny015-replicate.vercel.app/opengraph-image.png?0806238e04f3e3af)
12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,11
Re: [心得] 寫點自己的觀察其實現在 Senior 還在砍還真的跟 LLM 沒關係,主要是: - 疫情後一開始是為了經濟蕭條做準備,以及疫情間過度招募 - 最近還在砍很多都是縮減業務與成本、部門重整 - 資金流到 LLM 專案,其他軟體產品走維持路線 真的有因為 LLM 提高員工生產力而造成的裁員嗎?5
Re: [新聞]剖析中研院大型語言模型事件的衝擊先說結論: 發展本土化,繁體中文LLM模型,然後期待這個模型能讓大家使用,根本是錯誤方向。不知道這些專家學者,是在騙經費,還是還沒想清楚產業到底缺什麼。 --- 如果今天你使用Google搜尋,搜到"台灣是中國的",或任何有政治偏見的相關文章。 你會不會覺得Google很爛?5
Re: [問卦] AI領域中的LLM會讓英語系國家更具優勢?其實光是中文資料不斷地消失這件事情 用中文資料訓練的LLM效果自然不會太好 中文的網路資料這幾年不斷消失 原因無他 很多中文圈的網路公司沒錢收掉 這些資料就可能從世界上消失 等於中文的訓練資料無法累積 資料不夠 模型再大也沒用