Re: 本來學ML是該轉路還是繼續鑽研
一個ML應用要落地產生商業價值
在data scientist把model訓練出來之後
還有很長一段路才能真正進到生產環境
ML系統的複雜度其實非常高
從資料收集,特徵處理, 模型訓練, 模型測試, 一直到後面的模型部署,模型監測
真正要落地,上面的每一步都會有相對應的系統來做處理
系統要能自動化 要reliable 要scalable 還要能控制ML流程本身的複雜度
而不是說只要跑個jupyter notebook把模型訓練出來test能過就完事了
關於這個議題還是要大推一下2015年的NIPS paper
Hidden Technical Debt in Machine Learning Systems
所以呢 目前可以看到業界職缺的演化是有以下兩種型態
一種是scientist track
另一種是engineer track
scientist就真的需要比較強的數學理解
要能夠有能力訓練出"符合需求"的模型
但是通常這種人系統及程式能力不會這麼強
所以需要engineer來補足
其實scientist track還可以分成偏研究和偏應用的
簡單來說
偏研究的比較像是增加整體公司的技術力 他們會去發paper 數學要真的好 要有研究能力偏應用的目標則是會更聚焦在商業問題上
他們需要在有限的資源下(時間, 運算資源, etc.)提出解決商業問題的方法
在業界其實大部份搞ML演算法的都比較是這類
工作基本上就是兜兜library套一些現成的演算法
但是也不是說這種人就毫無知識含量
對相關商業domain的深度了解
使他們可以在有限的時間及資源下提出方法解決商業問題
這個就是他們的價值
engineer就比較像是構建最一開始所說的系統的人
做自動化 做scalable feature pipeline 做模型training/testing平台 模型部署
而且真正開始ML落地的公司 線上在跑的很快就不會只有一兩個模型
可能是數十個模型,甚至上百個模型
這就需要專職的engineering team來負責, 包含ML platform dev, 還有MLOps
這樣的工作其實程式和系統的能力會比較重要
比較像是介於傳統data engineer和data scientist之間
也有需要加點一些devops跟backend的技能
做這類工作就不需要對ML演算法及理論有那麼深的理解
知道點high level其實就足以勝任(因為主要是由scientist負責)
但是做這件事軟工的技能就要點得比較高
當然演算法的理解還是會對這個工作有幫助
比如說要做distributed training的系統
那有些ML演算法天生就是是沒辦法平行化
不知道演算法的細節
就可能沒辦法理解天生的限制而最後搞出了不合用的系統
我想說的是 如果數學不好 又想做ML也是可以考慮看看這個方向
隨著ML開始落地的公司愈來愈多 這樣子的職缺也會愈來愈多
如果是剛畢業想走這條路
或許從data engineer開始可能會是可以去嘗試的一條路
可以先沾個邊 在公司裡面再慢慢點上面我說的技能
※ 引述《ckrmpuhv (阿瓜)》之銘言:
: 各位板上大大好
: 小弟是後段國立科大資管碩即將畢業
: 因為一些私人原因是不用當兵
: 所以論文完成後準備開始找工作
: 目前程度:
: 大學學過JAVA
: 網頁跟資料庫也只有課堂學習過沒實際做小專案
: 因為對Ml有興趣
: 在碩階段期間 都是自學ML相關
: 聽過李宏毅老師的課
: 實作過他課程的作業
: Keras的一些神經網路搭建也沒捨問題
: Kaggle只參加過一兩次 排名都很爛
: 大部分的實作和論文都是跟影像辨識相關
: 最近看板上大大各式各樣建議
: 非四大四中 也不是kaggle的佼佼者
: 數學方面 線代沒學 統計學大學學過但也不熟
: 看完覺得自己很爛出去可能沒人要?
: 目前都還在做ml各種模型實作
: 但看完板上很迷茫要往哪些方向學習怕找不到工作非常憂鬱
: 我不清楚該橫向發展拓別的領域
: 像是網頁、App 自己做一些小專案增加作品集
: 還是去補數學 更深入研究Ml
: 又或者先去刷Leetcode打底
: 還請各位大大指教 謝謝
: -----
: Sent from JPTT on my iPhone
--
說得不錯 前一個在蝦七八亂 XD
推!不過台灣稱得上Scientist的職位太少QQ 畢竟沒有FA
ANG那種規模……
可能大多都是把現有ML方法拿來用,而不是開創新的ML
方法
偶爾寫一篇的那種可能還行 但要投錢持續去做純研究產出的單位真的很燒錢 看看下面的例子 deep mind是有google做乾爹 去年虧損六百多萬美金 google爸爸還幫忙付了10億美金的債 open AI也是是有微軟爸爸投資了10億美金 圖靈獎得主Joshua Bengio的研究公司Element AI也是賠到脫褲 好像準備要賤價賣出 有多少資源做多少事 現實就是這樣 我覺得沒什麼好埋怨LOL 隨著模型愈來愈複雜 連拿已經有的演算法來train model都會變成資本遊戲(想想GPT3)
推 寫得很好 MLOps 是趨勢
歡迎大家加入MLOps 的行列!業界很缺人喔
開創新的ML模型要有商業價值 目前大多數場景用既有的框架
就好 真正難度往往是系統落地真正運作在 production上
推 蠻清楚的
台灣我看有些公司還是會去發paper 只是可能不多就是了
如果是真正想研究ML模型 基本一定要有 PhD(或是極出類拔萃
的master) 以及做的研究業界要用的到才有機會真的進業界做
ML research. 像我們團隊就跟很多學校鑽研 private ML的學
者合作 有些團隊成員也是直接從學界加入的 像現在這種 res
earch scientist職位競爭超級激烈 沒有三兩三連面試機會都
沒有 所以大家說你做 engineer會簡單很多不是沒道理的
其實競爭激烈有一個原因是 業界並不真的非常需要做純研究的人XD 能解決商業問題讓公司賺進利潤擺脫成本中心才是硬道理 剛從學校畢業的人裡面 眼高手低的人太多 腳踏實地的人太少 再說如果engineer做到很有經驗也是很有價值的 現在有個看得到的趨勢是research paper上 scientist和engineer其實會一起掛名 所以即便沒有PhD 還是有機會可以發paper的 而且其實ML system也開始有自己的conference了
https://mlsys.org這個就是engineer的主場了
大推這篇,講得非常貼近目前的ML現實。前一篇有點以偏概
全,反而容易混淆視聽。同場推2014 NIPS Google的Machine
Learning: The High Interest Credit Card of Technical
Debt
了解感謝大大 我會在好好琢磨
你說的沒錯
這篇才是業界真實生態,感謝分享
這個是比較實在的業界生態 @[email protected]~ 還是要能賺錢先
前一篇就是那種去面試喜歡沒事問各種名詞的人
其實學界業界很多這種人@[email protected]~ 目前要的其實是這篇講
的兩種人混合 可惜的是這種人在業界也沒幾個
純 ml研究燒錢外效果也不是特別好 只能說海水退了
就知道誰沒穿褲子 想走ml進隊只能說超難了
就我自己的團隊跟業界合作伙伴 也是套模型&DE
但能套到讓一些公司掏錢做就好了啊
推好文分享
推好文
讚
推ML大神廖大!
感謝分享
推,確實越來越有如此分工的傾向,不過行有餘力,往對
方的技能點個一點有深一點的理解對自己的職涯還蠻有幫
助的
裡面還有一個workshop就是 MLOps
現在這遊戲就是燒錢 有機器有卡的大聲 看看某學校
不過真要做成系統除了理論外 還有蠻多"實際"的問題
這些才是真正讓ml能不能用的關鍵
推這篇~~
感謝大大分享!!
推
再推一次~感謝原po耐心回覆小弟的推文,講的很好!
推
大學畢業在高雄時才三萬初...
講得很好
優文推
ElementAI 已經掛了吧 推這篇
推推
推推
推
謝謝分享
15
等 : : 十位畢業生的研究題目大約會有7位以上跟ML直接或間接相關 : : 雖然這個領域未來很看好, 但是真的沒那麼多職缺20
大家去google一下最近AIDS論文中的作者 那些作者中研究生的linkedin跑去哪裡不就知道了 我的觀察啦 除非進那種大所的少數人 (Google, FAIR, Nvidia, MS research) 很多博士AIDS領域的還不是去小公司當data scientist23
Quotes:“Strength is something you love doing and are good at.” 看了板上許多討論ML vs. DS和大公司 vs. Startups的文章 (這兩個面向是高度相關的) 很多都是很好的分享,例如 上一篇前同事frouscy的精闢灼見 ()和6
ML的各種職缺和工作內容有幾位大大回答得很詳細了 這邊針對就業市場的狀況跟大家分享近兩年的招募心得 首先我是做數位IC設計相關工作的, 對於新人沒要求即戰力 所以EE, CS 或其他相關背景的都會談 目前看起來EE非固態,類比,RF相關的科系,CS還有其他工程類包括環工,醫工,農機,造船等等22
^^^^^^^^^^^^^^^^^ 恩..."後段國立科大資管",好一點的公司可能連HR那關都過不了 : 因為一些私人原因是不用當兵 : 所以論文完成後準備開始找工作 : 目前程度:15
首Po各位板上大大好 小弟是後段國立科大資管碩即將畢業 因為一些私人原因是不用當兵 所以論文完成後準備開始找工作 目前程度:
23
Re: [請益] 想從零開始轉行當AI軟體工程師大家討論了很多高深的數學,或是頂會。 實際上,我真的很懷疑有多少人真的在業界上搞 AI。 只論台灣吧。首先市場上純研發,需要數學或考績強制發論文的職缺,占不到5%。而且這兩年職缺越來越少。更何況頂會… 台灣業界一年也沒看多少人在發頂會,幾乎沒有吧。就連國際研討會,比例來說也沒看到多少人在發,常常看論文的我都沒搜到台灣業界發的論與。板上動不動就需要數學與改模型架構,真的感受差很大,可能是我看得不夠多? 好啦,如果你在國外大公司當我錯了。的確很多人搞數學,但是人數比例還是超級少。 再來談產品。首先論產品的效果,資料面就決定結果論了。實際工作時,有大部份的時間在處理資料。然後還是要花很多時間做特徵工程。當然特徵工程你可以搞很深的數學啦,但是可能需求方,多給你一個有用的資料特徵,都比搞數學重要。19
Re: [心得] 2021 外商資料科學求職心得之前在本板分享過我在 2021 年的數據分析求職經歷 我當時也找了機器學習演算法應用相關的工作 由於準備方法與數據分析領域大不相同,所以另外寫了這篇文章與大家分享經驗 尤其有很多資源是我在 Soft_Job 板找到的,也希望給這裡一點回饋 以下文章為了 PTT 排版有稍微精簡內容13
Re: [請益] 統計所畢業是否不適合資料分析?看到這篇文章就手癢很想回一下 我現在工作大概快六年了,待了三間公司 我自己覺得統計背景是其實滿適合的 我自己是116經濟雙主修統計 後來唸116統計所 在台灣其實職缺不少,只是title都很不一致9
[心得] AI/ML software engineer工作心得之前還是學生的時候在版上發文詢問過方向,到現在已經工作約半年了, 分享一下我後來學習的方向和目前的工作內容,當作回饋。 簡單描述當初發文詢問的原因,想知道詳細內容可以a我的id: 碩班讀AI,畢業後想去日本工作,如果想進外商該如何準備。 ============================================================8
Re: [請益] 想從零開始轉行當AI軟體工程師Hello 我勉強算是在一線外商做機器學習的 我覺得討論到這裡需要釐清一下所謂 "AI工程師" 的角色 在業界下圖打*號的都有可能會自稱是 "AI工程師" _________________________圖____________________________ Domain Expert7
[請益] offer請益(宇匯/趨勢/台達/凌陽/華碩)本篇為代 po HackMD 好讀版: 排版差、文長請見諒 ## 個人背景:5
Re: [問題] 各位覺得冷門理組未來怎麼樣?重點不是科系名稱或是領域 而是是你進去以後做研究的方法跟工具是否對業界有用 不是本科系的工作又如何? 我在美國遇到一堆這種的 有人地質博士 研究做地震波的分析6
Re: [問卦] ChatGPT改變了什麼行為模式?行? : : 業都發揮著重要作用,對許多人的生活產生了深遠影響。我想請問各位前輩,究竟Ch at : : T改變了哪些行為模式呢? : : 希望大家能分享一些寶貴的經驗和看法,讓我對ChatGPT及其對社會行為模式的影響5
[請益] offer請益(宇匯/趨勢/台達/凌陽/華碩)本篇為代 po HackMD 好讀版: 排版差、文長請見諒 個人背景:2
Re: [問卦] AI大數據分析是不是過譽了?所以任何當前的機器學習模型都需要Data scientist來做前置性分析的啦。明星級的DS多 半是數學、統計、計算機科學交叉領域的專家,一個好的模型訓練集跟測試集必然存在獨 立同分佈,獨立同分佈是為了確保樣本足夠分散各類均勻又能代表真實分佈,因為分散均 勻若模型只看了其中8成比例數據必然能泛化剩下的兩成(這邊必然有數學上的驗證,由於 有大量數學引理就不贅述,可以從林軒田老師的基石課去找資源,關鍵字VC generalized