PTT評價

Re: [爆卦] 美國教授踢爆高虹安大數據招牌造假

看板Gossiping標題Re: [爆卦] 美國教授踢爆高虹安大數據招牌造假作者
murai111
(明鏡止水)
時間推噓4X 推:10 噓:59 →:67

大家好,打給厚,胎嘎厚,馬哩馬哩蹦。身為一個資料科學家,好死不死咧,Dr.嘴叔在某個場合遇到過野生翁達瑞。忍不住又要來嘴一下。

以下文長,為了保護你的眼睛,可以直接到這裡用聽的
https://reurl.cc/95OaQn

本集達特嘴哥地圖砲本來要在節目裡面跟大家揭曉翁瑞達的背景,沒想到節目才錄到一半,Dr.彭文正就手快腳快的丟了一個名子出來,鄉民用自己打一次手槍的速度就肉搜到了一些
目標。Dr.嘴叔在此不直接透露姓名,請大家自己用Quasi-attack從以下消息去比對。其實Dr.嘴叔不是要討論誰是翁達瑞這麼無意義的話題,who fucking cares?而是要討論什麼是


大 數 據 專 家


翁教授質疑高委員是冒牌的大數據專家,但什麼是大數據?什麼又是大數據專家?翁教授應該要先定義好前提,再來討論高委員到底夠不夠格稱為大數據專家。

首先大數據專家可以被拆成大數據AND專家。翁教授把重心放在專家,只要證明高委員不是專家,自然他就不可能是大數據專家。首先翁教授企圖把專家和學霸連結在一起,他認為高委員的學歷還不到學霸的水準,所以自然也不是什麼專家。Dr.嘴叔不是很吃學歷這套,但是學歷多少還是有點參考標準。身為一個資料科學家,直接上資料。

這邊提供四個排名系統
A. Usnews national university rankings
B. Usnews global univeristies rankings
C. Usnews best engineering schools
D. Usnews best business schools


其他還有英國的QS,上海交大排名,但因為當事人念的是美國學校,所以就拿Usnews排名為主。

高委員(UC) 翁達瑞(美國中部某知名大學)
A 148 40-50
B 202 50-60
C 92 5-10
D 100-150 N/A

首先A是翁教授在FB嘴高委員使用的排名系統,翁教授當年博士班念的學校在這分排名裡面的確是屌打UC。然而這份排名是大學部的排名,並不考慮學校的學術表現,所以拿來做博士班的比較是不準確的。而B排名是世界大學排名,考慮了學校的學術成就和名聲,在這份排名裡面UC被翁教授的母校屌打。UC世界排名202其實算不錯,台大在這份榜單排184,師大1000+。如果以翁教授的想法,要念台大才是學霸,那其實UC和台大在世排的差別不大。當然啦,翁教授講的是血統純正,台大大學部才算數,但是台大的大學部排名並不會在A榜單中。但是B榜單還是有BUG,翁教授念的是商學博士,高委員念的是工學院,這是要比個屁。所以我們可能要看的是C和D榜單。UC的工學院排名92,被翁教授的母校屌打。但翁教授母校的商學院排名連USNEWS都懶得提供數字,在系所排名部分翁教授的母校被屌打。所以這一回合就算平手吧。

但是今天要比的不是這兩個人誰才是夠格被稱為學霸。不是學霸的人難道就不能嘴人嗎?以翁教授的資歷,包含他過去任教的學校(經過嘴叔的查證,他並沒有灌水),高委員的學歷的確還不夠格被稱為學霸。就像很多人覺得念台大就是學霸,但台大土木的同學可能覺得台大醫科才是學霸。問十個人會有十個對學霸的標準。所以翁教授身為側翼,打學歷是不對的。

我們應該去看論文引用數。前面有網友也討論過了。根據Research Gate高委員的論文引用數有4400。

這個數字非常驚人,基本上是神人的等級,Dr.嘴叔完全看不到車尾燈。台灣很多國立大學的終身職教授可能幹了一輩子都達不到這個數字。好,所以有人開酸,這些高引用數的論文,高委員幾乎都不是第一作者。如果只算高委員第一作者的文章,引用數剩下100不到,被打回正常人。這個講法有點不公道。首先我們從時間軸上來看李傑教授的論文引用數

https://reurl.cc/OkpnkX

因此高委員大數據專家這個稱號,已經到手了一半,也就是專家。

再來什麼是大數據?
根據一份業界的定義,數據快速成長會遇到四個方向:Volume(大小), Velocity(資料製造的速度), Variety(多樣性)以及Veracity(真實性)。由此可以了解數據多大是大數據。

以Dr.嘴叔電腦科學的背景來看大數據這門學問,其實是要解決資料存取和計算的問題。當數據大到記憶體裝不下的時候,電腦要怎麼做運算?當數據大到一顆硬碟裝不下的時候,那你有買兩顆嗎?一顆D槽裝不下,你有裝NAS嗎?

在電腦科學領域大數據是分散式系統設計的問題,數據變的這麼巨大,使用者要怎麼調出自己要用的那些資料,電腦要怎麼知道資料放在哪?要怎麼快速的收集到所有資料?使用者要做計算,又要怎麼弄,一台電腦算不了了,要怎麼把計算分散?

以上就是電腦科學領域中,所謂大數據要處理的問題。基本上是一個系統設計的問題。
使用者用Sparks, BigQuery就可以輕鬆取得他們要的資料。所以我其實不知道大數據分析是三小

我們攤開高委員的論文,Dr.嘴叔大致過了四篇,包含
李傑教授主筆獲得3600次引用的
A cyber-physical systems architecture for industry 4.0-based manufacturing
systems
這篇論文只有六頁,最後一頁只有參考文獻。內容來說看得懂英文的人就看得懂,主要在講一個CPS-5V的架構:
https://reurl.cc/xEOAvN
1.從機器收取資料
2.把資料變成有用的資訊
3.結合所有機器的資料作peer-based analysis
4.把資料呈現給管理者,讓管理者好做判斷
5.不管用人工智慧或是工人智慧的方式,把命令返還給機器,讓機器可以自動調整,優化製程參數。

這篇文章大概內容就是這樣,幾乎沒有技術牛肉。比較像給出一個研究願景或者工業4.0的趨勢。一般能發表這種純嘴砲論文,作者肯定是大頭,通常實作的部分會在其他地方發表。

另外在台GG工作一段時間的工程師,是不是感覺到了deja vu,這不是十年前台GG就在Run的東西嗎?感覺李傑教授應該不是一般人,他那裡歐印彼特幣應該還來得及。

為了證明高委員和大數據的關係,Dr.嘴叔又找了同年發表,標題跟上一篇有87%像的這兩篇論文

高委員同學Bagheri主筆的
A cyber physical interface for automation systems—methodology and examples
高委員列名第三作者,總共有300次引用

高委員主筆的
Cyber-physical systems architecture for self-aware machines in industry 4.0
environment
總共有50次引用

我原本以為可以看到技術內容,但這兩篇paper大多也是打嘴砲。想知道高委員的研究領域是怎麼寫paper的,可以自己點我的podcast連結聽,我大該花了一分鐘講完,但我不想花五分鐘打字,因為大家看了也是浪費時間。

所以Dr. 嘴叔只好又去找第四篇paper來看,也就是跟高委員博論同名的
Quality prediction modeling for multistage manufacturing based on
classification and association rule mining
當然也是由高委員主筆。

從標題來看,的確是技術性的內容。簡短來說,作者提出了一個模型希望從機器返還的資料來預測機器最後做出來的產品會不會被品管打槍。使用的方法是用PCA對資料做降維打擊,之後把feature丟給決策樹、貝氏分類器、SVM、Apriori、Rough set等去判斷品管結果。使用的資料是某半導體的製程資料,做了實驗比對發現基於Rough Set算法的分類器可以屌打其他Bench Mark。爽,可以畢業了。

好看到這裡,了解機器學習的同學可能會覺得幹這三小,這些模型可能比很多大學生年紀還要大,況且也不是什麼大數據計算。但是這並不能說明高委員不懂高深的技術,研究沒用到不代表不懂。而且在業界有很多問題其實根本不用什麼很屌的模型,什麼深度學習。feature抓一抓丟給sklearn裡面內建好的各種模型,看誰的結果好就用誰的,打完收工,高委員也是這樣做的,簡單粗暴,有沒有用?有用!那你他媽有什麼問題?

不過咧,Dr.嘴叔要argue的是這篇研討會論文寫的不是很好。想知道為什麼的自己去聽我的podcast。因為這不是討論高委員是不是大數據專家的重點。而且這是一個2017年在台灣墾丁半的研討會,看網站就知道不是什麼重要的研討會,一般美國的博士生會把研究丟到這種研討會,來取得學校贊助的台美來回機票,免費回台爽玩一波再回學校,但這一切都被武漢病毒給毀了。

快速看完這些paper,我決定不再繼續找下去,因為我忽然恍然大悟。

大數據這三個字在非電腦科學領域,實際上是一個行銷用語。任何東西前面擺個大數據,就會變得高大尚。所以想當然爾,高委員的研究領域用這種方式寫paper,的確就是在發揮大數據的精神和其專業。

因此,身為職業資料科學家而且擁有博士學位的的Dr.嘴叔在此認定,高委員的確就是大數據專家,僅代表個人想法,Dr.嘴叔只是一位看數據說話的小宅男,請勿肉搜。



--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 97.126.46.220 (美國)
PTT 網址

duo0518 09/26 19:23太長 沒重點 還反串

duo0518 09/26 19:23這是新的人設嗎

kaky 09/26 19:24你有跟翁確認是個真人?

ellychen 09/26 19:24很認真的回應, 但是字太多了

kaky 09/26 19:25沒確認過的話你的比較就是GIGO.....Y

guesswhen 09/26 19:25覺得會沒人看 幫推

cloud3455 09/26 19:25要傳達你的理念前,先想想怎麼傳達才會

cloud3455 09/26 19:26讓人有看下去的念頭

pippen2002 09/26 19:26https://i.imgur.com/028jFqe.jpg 選?

ga652206 09/26 19:26先學會怎表達要講什麼

Liebesleid 09/26 19:27Business school 是MBA program

leecliff 09/26 19:27好了啦蓋達瑞 過氣多久的冷飯還在炒 廢

whitenoise 09/26 19:27所以重點是啥?高不是大數據專家?

你覺得呢?

murai111 09/26 19:27有閱讀障礙的人我愛莫能助

popeyewowo 09/26 19:27廢文寫這麼長

helloman 09/26 19:27

ad1339 09/26 19:28本來只要做過相關工作,稱專家就不算錯了

whitenoise 09/26 19:28現在是要討論諾貝爾獎提名資格膩

cloud3455 09/26 19:28是看不懂你文章的有閱讀障礙,還是你

cloud3455 09/26 19:29表達能力欠佳,就各自認定了

REALucifer 09/26 19:29這樣是紅不了的

ad1339 09/26 19:29高的學經歷還能挑毛病真的是有夠北七

darkholy 09/26 19:29我只好奇翁達瑞真身是幾個人,其他不用

darkholy 09/26 19:30多扯

wchad 09/26 19:30沒有結論嗎?結論可以先打在最前面嗎?

njxmzxc 09/26 19:30專家又不是什麼特殊名詞你覺得你是專家

njxmzxc 09/26 19:30就是專家 跟翁比學歷幹嘛比他高就是專家

njxmzxc 09/26 19:30比他低就不是專家嗎

ga652206 09/26 19:31頒發講廢話專家證書給你

ASEVE 09/26 19:31翁連身分都不敢明講,這就高下立判

helloman 09/26 19:32連真實身分都不敢公開 是要比個毛?

swgun 09/26 19:33你又哪位?

waijr 09/26 19:34講難聽點文組大部分一點用都沒有 比學校

點開上面那些論文,先遮住名子,看完你跟我講看起來是文組論文還理組論文

touchdowns 09/26 19:34寫得很用心 幫忙推一個 ☺

waijr 09/26 19:34和理組比有甚麼鳥用 人家機電系領多少 你文

waijr 09/26 19:35組領多少

以上有87%的人根本沒看文章就噓,不過這在八卦版是正常能量釋放

※ 編輯: murai111 (97.126.46.220 美國), 09/26/2021 19:36:50

waijr 09/26 19:36翁達瑞 一個連自己名字都見不得光的人

waijr 09/26 19:36對別人的資歷挑三揀四 他有甚麼資格阿

annie060326 09/26 19:36翁達瑞對台灣有什麼貢獻嗎?

waijr 09/26 19:37假裝公正內 翁閃一邊去啦

werqq 09/26 19:37https://i.imgur.com/NbL1rZD.jpg

werqq 09/26 19:37https://i.imgur.com/b36YDfu.jpg

murai111 09/26 19:37我是有說他有資格嘴人逆?

不然你有資格?你都有資格了人家沒資格?你是有昭告天下你真名嗎?

kaky 09/26 19:38你的比較基礎是什麼啦翁瑞達都沒揭露過你比

kaky 09/26 19:39個鬼啊...說人家沒看文章不先檢討輸入是垃圾

murai111 09/26 19:39前幾篇不就有人透漏他是誰了嗎?

kaky 09/26 19:39就只會產生垃圾的結果....

kaky 09/26 19:39太好笑了還有人透露蔡是李的私生女

kaky 09/26 19:40你也要拿來用?

我用了他什麼?

murai111 09/26 19:40為了不出賣我的消息來源,我就不明講了

leecliff 09/26 19:40通篇垃圾資訊 下去吧

guest8888 09/26 19:40躲起來喊最大聲

kaky 09/26 19:40那就是垃圾資料啊啊 不知名學校 可以比排名

abadjoke 09/26 19:41無法證偽的就是垃圾資料

你不看清楚內文就推文,我也沒辦法跟你說什麼

※ 編輯: murai111 (97.126.46.220 美國), 09/26/2021 19:44:32

cvnn 09/26 19:43寫作文嗎?還是世界上只有三個人知道?

ga652206 09/26 19:43那你還發在八卦是再講自己嗎

QQDK 09/26 19:43這篇順序就錯了吧 要也是先分析翁達瑞是不是

QQDK 09/26 19:44陳時奮 然後再拿陳時奮的生平/論文跟高虹安

QQDK 09/26 19:44做比較吧? 直接拿翁達瑞這筆名是要跟誰比?

如果我跟你說87%是,你會好好看內文嗎?

wolver 09/26 19:44還在翁 可憐那 連人設都不知道

mengpo 09/26 19:44等敢掛名的時候再出來講~廢

RognerLiu 09/26 19:45沒重點 都是廢話 還想帶風向嗎?

※ 編輯: murai111 (97.126.46.220 美國), 09/26/2021 19:46:09

luoqr 09/26 19:45整篇看完毫無重點 也看不出你專業在哪啊

我不記得我有講我專業是什麼,我只討論某領域是怎麼寫論文的

dawn855532 09/26 19:46先學會如何簡單清楚傳達你的意思再出

dawn855532 09/26 19:46來戰吧你

QQDK 09/26 19:47這種比法乾脆跟達瑞斯比誰開大比較厲害好了

OEC100 09/26 19:51不好意思捏,歸功於塔綠班,現在評論別人

OEC100 09/26 19:51的沒具名都當假消息了

Sabo5566 09/26 19:52北七文 表達力低下 肯定是個廢材

mcyangtw 09/26 19:54one page report please

我懂鄉民只要資訊快餐,順風推逆風噓,中間的論證過程沒人care。

※ 編輯: murai111 (97.126.46.220 美國), 09/26/2021 19:56:02

Fracon 09/26 19:57真厲害 監督民進黨政府有這麼努力就好了

事實上,我也滿常嘴民進黨的

chris0694 09/26 19:59哦 你遇到過哦 0.0 遇到過一個不具名

chris0694 09/26 19:59美國教授 好厲害0.0

chris0694 09/26 19:59就像當初找法拉盛爸爸也只有3Q跟小商人

chris0694 09/26 20:00找得到一樣0.0

假設你在某場合遇到一個人,你不知道他FB,但有天他用某FB帳號密你

taylor0607 09/26 20:03可悲 連論述都不會 還想學人臭人

taylor0607 09/26 20:04講專業的你不會 想包裝也不夠聳動

要不你反駁一下我對於大數據的論點?讓我學習一下。

eatk 09/26 20:08這樣不會紅的換個方式吧

我講我想講的,有沒有人要聽是聽眾的事

abadjoke 09/26 20:14對著一個不存在的"翁教授"都能屁這麼多

abadjoke 09/26 20:14我也是滿佩服的

前面就有人說他是誰了,難道九把刀是筆名所以他也不存在?

burtburt723 09/26 20:15專業?還是先學會表達跟詞句通順比

burtburt723 09/26 20:15較好唷

duo0518 09/26 20:18真心要辯證的話就不要用反串的

miloskyman 09/26 20:24講人話~阿鬼

duo0518 09/26 20:26本來看到前2行就不想看了

duo0518 09/26 20:26勉強看完發現就又是一篇東扯西扯沒重點

duo0518 09/26 20:27然後又一直講反話的文章

看不到你想要看到的東西,真抱歉。是不是要先同聲譴責翁達瑞,先測一下風向。風向對了再說

sinju1204 09/26 20:30又不知那來的野雞id想繼續抹啊,怎麼不

sinju1204 09/26 20:30先檢視一下蔡總統的論文呢 啊 抱歉 沒

sinju1204 09/26 20:30人看過蔡總統的論文

我也想看,但看不到啊,你手上有的化站內信我

hsuhsinjen 09/26 20:37出來到底在講三小喇叭?

duo0518 09/26 20:40就是叫你去聽他的Podcast啦 其他都廢話

soar1983 09/26 20:43你是在共三小

tengerinedog 09/26 20:43所以翁是誰?

伸手牌?

stvc 09/26 20:43好的塔綠班

soar1983 09/26 20:46你真的是博士嗎?我也是博士哦

hools 09/26 20:49成就遠大於學歷

的確,有時候懂得行銷才是關鍵

George728 09/26 20:54臉都不敢露,別當縮頭烏龜啊…

Dia149 09/26 20:54朝聖啦

jun7154 09/26 20:56真心供三小?

Belanice 09/26 21:00End,先學會怎麼讓人有興趣看下去

xp75381 09/26 21:06可憐

kenclyde 09/26 21:07我很好奇高什麼時候自稱大數據專家?

kenclyde 09/26 21:07應該說她專長是大數據分析

我有說他自稱?那我問你什麼是大數據分析?媒體稱他大數據專家就不能反駁嗎?

yymeow 09/26 21:09尼這個反串文寫太長惹。還有綠軍已經要切

kenclyde 09/26 21:09再來,李傑被引用超多次的資歷都被你

kenclyde 09/26 21:10批成不算專家,那您的資歷為何呢?著

kenclyde 09/26 21:10作數量與引用次數多少呢?

我哪裡批李傑不是專家?我只說和我認知的大數據有點差距

yymeow 09/26 21:10割美國教授了,尼這個已經不潮了

smallkaka 09/26 21:11我幫忙讓你紅

多謝

askey 09/26 21:11我也是博士哦

eterbless 09/26 21:15看到有人叫人高調這篇只好噓了

yueyajbdt 09/26 21:34好了啦,87%是陳不如叫陳自己來PO一篇

yueyajbdt 09/26 21:34啊,不敢就下去,連自己講話都不敢負責

yueyajbdt 09/26 21:34的人還想叫人看文章,沒看過這麼孬的教

yueyajbdt 09/26 21:34授啦

s21mo9025 09/26 21:57太長

我又不認識他,也沒有認同他,只是剛好知道他是誰而已。

tudlot 09/26 22:07可憐啊!又一個大樹鋸專家

aigret 09/26 22:44好啦 塔綠班上工

showoo 09/26 23:30可以講一篇翁虹嗎

IRPT001 09/27 00:00先現真身吧 不然就是欺負妹子

照你邏輯,下次推文之前都先現真身,不然你在嘴三小?

BREAKFAST204 09/27 00:15新人設?

※ 編輯: murai111 (97.126.46.220 美國), 09/27/2021 00:49:50

Thorvs 09/27 00:58看完就知道你不懂大數據,下去吧

Migual 09/27 01:07自己被打假學歷拿來打別人 笑死

murai111 09/27 01:43不然你告訴我什麼是大數據,我很想知道

推文挺有趣的,把世界分成兩半A和B。你檢討A就代表你挺B。這邏輯跟塔綠班和1450有87趴像 坦白說,我支持高委員,但媒體或民眾黨用大數據專家去包裝他是在害他。稱他為工業工程專家比較合適,但大數據聽起來比較潮。我從來不否定高委員的立委專業程度,但路要走的遠,很多事情最好早點澄清。

※ 編輯: murai111 (97.126.46.220 美國), 09/27/2021 02:21:34

helloI 09/27 05:05好的 美國塔綠斑

musetime 09/27 07:47我覺得分析得滿好啊 幫補血

qmobig 09/27 08:20好的 塔綠班

RAY1203 09/27 08:49喔喔哈哈呵呵哦哦耶耶

picturesome 09/27 15:36竟然看完paper 強 幫補血

mkokm 09/28 04:27又來

mkokm 09/28 04:33所以翁的博士論文是啥?喔連學校都不知道是

mkokm 09/28 04:33哪一間

murai111 09/28 07:20翁的論文關我屁事,翁又不是大數據專家

colin90149 09/28 09:58https://tenor.com/bggsQ.gif

Mtcat 09/29 13:50推嘴叔