Re: [問卦] 口說講解影片是不是快被AI完全取代了?
※ 引述《horseorange ()》之銘言
: 網路上會滑到的口說講解影片
: 光講話的部份之前就被微軟雲希搶了一半以上的工作
: 至於其他的部份
: 剛剛在看別人貼的教學
: 現在文本也可以用AI寫
: 甚至你覺得影片沒有人
: 也可以叫個AI人像在前面講話
: 文本、口說、影像AI都能做到了
: 這樣看來口說講解影片被AI完全取代剩沒多久了吧?
阿肥外商碼農阿肥啦!認真說,這幾年口說上字幕甚至翻譯,還有有字幕上語音這幾年都獲得不錯的進展,包含openAI、Google、Amazon、Meta實驗室都有不錯的產出,而且這些都是依靠當前所謂的多模態零樣本學習的大力進步,很多轉換錯誤或是機器音都減小很多,不過偶爾還是會有出槌需要人工修正的部分。
所謂的多模態零樣本其實就是換一個思維過往很多工作需要大量標注工跟資料工程前處理來完成,但是這樣的成本往往都非常高,而我們其實人類原始的數據來源是很大只是雜訊很高,往往在傳統機器學習會認為是很難學習的,不過現在就是透過大量GPU大力出奇蹟,反正先訓練一個夠大夠強的模型不管他是不是有偏數據,然後再利用這樣的大模型我們透過有限監督來微調,這邊有很多方法,包含把多模態(圖像、語意、文字)來結合再一起,或是透過主動學習、強化學習來監督新模型輸出結果。
這樣就不需要落入我們一定要先有標注資訊才能做,像openAI的新模型whisper就能不須要傳統做音訊前處理直接把環境音加人聲一起喂入,直接給出人聲轉文字結果,這種做法在很多實驗跟研究中也發現你只要夠大模型的魯棒性越高,加上用所謂的對比方式來學習那要達到不須要額外新樣本就可以在新樣本上達到SOTA越容易。
差不多4醬
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.13.42 (臺灣)
※ PTT 網址
※ 編輯: sxy67230 (101.10.13.42 臺灣), 01/08/2023 12:16:03
→
看到zero shot就想吐
40
Re: [外絮] 用機器學習模型預測MVP得主大略看了一下原文 提供我的一點淺見 首先 使用機器學習處理問題 是假設實際存在一個真實的模型29
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒阿肥外商碼農阿肥啦! 剛好阿肥是這塊領域的研究員,大概工作也有六年是在這塊機器人語意理解領域了。 直白來說,現有的不管你要叫AI或是內行一點要叫ML/DL,這塊領域當前最好的SOTA模型 從數學直觀理解都驗證機器對於模式識別是很強的,但是分析永遠不是ML的強項。 也就是說當前不管是BERT還是GPT 3等等等,他們強項就只是找到序列詞組的關聯性,最17
Re: [新聞] AI「薪」貴!科技業祭出年薪200萬搶人才認真說,這個立場有點偏頗,先說,我贊成你所謂的拼數據,但機器學習一直都是資料、統 計導向的學門,data driven本來就機器學習的一環,DL只是機器學習的一個子方法,他依 舊脫離不了資料統計建模,而所謂的AI是一個模糊超集,他包含專家系統、統計建模、機器 學習、範疇論、消息理論等等等,只用AI等於DL是一種不太健康的心態。 然後可以看看Stanford HAI REPORT根據2022全球關於AI(ML/DL)的領域產業發展概況其實可12
[請益] 為什麼現在新的深度學習模型都很少割出te"為什麼現在新的深度學習模型都很少割出test dataset?" 在進行實驗的時候, 發現近三年來的研究工作, 很多都沒有切割test dataset, 論文裡也沒有列出test dataset的實驗結果.12
Re: [閒聊] 繪師是怕畫不過AI還是怕AI會創作?怒刪,剛好碩班是研究AI領域,以我的角度來看 其實人工智慧這一塊的發展跟人類特徵學息息相關。人類從自我的習性套用到機器上,透 過流程特徵化後編制pipeline讓機器模仿人類的習性。 先說結論,Machine Learning(ML)不可能只靠「單一」一張畫師的畫就可以訓練成一個有 效的模型;相反地它需要透過大量的數據去臨摹某一種畫風。10
Re: [討論] 2021 NBA歷史百大球員排行首Po賺個P幣 個人對Learning to rank略有接觸,想說從一個不同的角度切入百大排名這件。 首先找到一組權重去對球員排名本身就是非常困難的問題。像前面版友講的,有人會說得分王重要乘以2,有人會說強分區要加權,還是不是要考慮DPOY/正負值/季後賽勝率/明星賽次數...要考慮的特徵排列組合非常非常多,還要幫每個特徵選出一個權重。 所以從資料科學的角度,常用的方式就是用監督式機器學習從現有的資料裡學出權重,這種方式必須要標記的資料。舉個例子: 大家都把自己的百大排名打在下方,這樣我們可能就得到了一些樣本可以去建立回歸模型。5
Re: [問題] 要怎麼讓AI記住一件事情?小弟本身是相關的研究領域的剛好在西恰看到就簡單回答,chatGPT當前是沒有所謂記憶這 件事的,他其實是用到一個Trick就是直接把你前面的對話直接併到當前對話,由於目前有 最大字數上限(印象中是4000還是40000,有錯還請見諒)超過就直接把你前面的對話都丟掉 ,所以你常常會發現他好像講一講就自己忘記了。 GPT系列本身其實就是有點像接龍一樣的語言模型,你問馬可就會去預測一般人類遇到最常2
[問卦] 為什麼現在新的深度學習模型都很少割出te"為什麼現在新的深度學習模型都很少割出test dataset?" 在進行實驗的時候, 發現近三年來的研究工作, 很多都沒有切割test dataset, 論文裡也沒有列出test dataset的實驗結果.1
Re: [新聞] AI機器人ChatGPT爆紅 紐約憂學生作弊全面edium=facebook&fbclid=IwAR2F7vp--YvkSZGtMUlcvv9NipFo2CjETp0ng7cykSBZuMzgUi1Iz3i1 1PE 這個算是比較Lag的新聞了,已經有知情微軟已經有意把整個chatGPT跟Bing綁在一起了,微 軟投資openAI算是投資對了,不過倒也不是chatGPT用了多強大的技術。
爆
[爆卦] 賴清德為霸凌案出面道歉了爆
Re: [新聞] 為愛赴緬做詐騙!靜宜女大生近期有望回台爆
[問卦] 一提到被媒體霸凌大家第一個想到誰?爆
[問卦] 綠同事:第一次有人死掉鬧這麼大爆
[問卦] 人資:「上班偷錄音違反職場倫理」爆
Re: [新聞] 批黃國昌輕放謝宜容!李正皓:勞動部調查爆
Re: [新聞] 爆黃國昌與謝宜容秘密會議 李正皓秀公文爆
Re: [新聞] 快訊/柯文哲涉「2大案」最快12月偵結爆
[問卦] 道歉影片出來了?86
[爆卦] 潘傑楷 炸裂45
[爆卦] 台灣2:0美國啦32
[問卦] 主管要檢查手機 說是防洩密 要交出去嗎42
[問卦] 有比皇帝還上位的存在嗎?34
[問卦] 免費讓你學台語你會去嗎?31
[問卦] 出事情嚴查嚴辦當事人卻跑了?27
[問卦] 烏克蘭的兩年戰事,給台灣的啟發?31
[問卦] 同樣是政府部門 怎麼有的部門爽到爆?爆
[問卦] 今年2024代表詞要選什麼?25
Re: [問卦] 怎麼都沒有公民團體發聲阿?62
[問卦] 謝宜容下屬10分鐘不回line就開罵 結果自23
[問卦] 第一島鏈在2024年,是否還重要?18
[問卦] 大谷翔平為什麼沒關注12強?75
[問卦] 對工作單位充滿感謝,然後在單位上吊?43
[問卦] 為啥國際上泰國比台灣還有名30
[問卦] 公務員不屌上司會怎麼樣18
[問卦] 朋友說現在公務員不能加班但事情沒變少54
[問卦] 為啥很多女主管都喜歡緊迫釘人?17
[問卦] 美國一直觸身球 丟爽沒19
[問卦] 勞動部事件火越燒越大啦20
Re: [新聞] 勞動部霸凌案 死者母淚崩「我可憐的孩子