Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好

ewings 發表於 2021/4/9 上午2:08:43

看板car標題Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好作者

(火星人當研究生)時間Apr 9 02:08:43 2021推噓11 推:17 噓:6 →:53

※ 引述《ykjiang (York)》之銘言：
: 從最基本的原理來說，光達跟雷達就是用來測距，理論上只有一維的資訊
: 三維的部分是經過一些設計、運算後得到的
: 反而鏡頭得到的一開始就是二維資訊，然後可以經過運算得到三維的資訊，

這邊看完，我的感想只有“供三小？”

雷達與光達在原理上是利用掃描的方式，取得距離與向量，本質上資料的維度就是大於二維了。

是什麼時候變一維的？如果要這麼瞎扯，那鏡頭裡的CMOS一次也只能讀一個cell的資料，一樣得要逐個掃描才能得到二維影像（這個就是所謂的果凍效應的成因），
照你的說法，鏡頭不也一樣是一維的？

: 特斯拉更進一步從中取得四維資訊（多的那維是時間軌跡預測）

這邊也不知道在供三小

在半個世紀前，雷達後處理技術就已經發展出利用比對前後時間目標的變化，預測目標未來位置，
並且持續追蹤的技術。甚至還有類似合成孔徑雷達（SAR）那種利用時間與位移積分，
利用二維掃描形成3維雷達影像的技術。

而利用都卜勒濾波技術，甚至不需要比對前後時間的資料，就能直接得到目標的速度，
在半個世紀前，雷達就能直接利用都卜勒測速，外插推估目標的未來位置。

但也沒人講雷達是四維資料的探測器。

而特斯拉的前鏡頭並沒有構成立體視覺，就算加上時間預測，也只能構成2.5D，
（三個定焦鏡只能利用影像模糊的程度大致判斷距離）,這也是特斯拉自動駕駛在視覺深度一直為人所詬病的地方。

: 以目前的技術：
: 距離方面，光達的精度比較高
: 平面部分，鏡頭的精度較高，然後鏡頭還可以判斷顏色這個重要資訊
: 以自動駕駛而言，兩者的精度都超過人眼了
: 所以關鍵還是在 AI 等其他方面

無腦特粉才會覺得只靠鏡頭和AI就行

真的在搞自動駕駛的，在研究的是怎麼做多感測器的融合。

https://global.kyocera.com/ces/img/sensing-technology/sec11_img03.jpg

像是直接將光達和攝影機做成同一個感測器，就是其中一個方向。

: ※ 引述《airforce1101 (我不宅)》之銘言：
: : 影像、雷達、光達不太一樣，我把影像與雷達、光達拆成兩類好了，影像對於訊號處理來
: : 說屬於二維陣列，但是雷達與光達可以帶回三維的目標資訊，雷達就是低頻段的光，因頻
: : 率特性不同，所以適用場景不同，光達的脈衝時間很短，所以較於雷達相比，對於相同目
: : 標，可以帶回更高精度的資訊。
: : 光達的領域上有關延展性目標，可以參考K. Granstrom, M. Baum, and S. Reuter 所著
: : 的這篇文章 Extended object tracking: Introduction, overview, and application.
: : 在AI輔助下，或許環境良好下影像能做到光達能大多數能做的事，但某些判斷影像與光達
: : 先天上的差距還是存在。
: : 其實也好奇，傳感器與影像間的關聯是否讓AI找出並學習其特徵向量，有待高手解答了。

--
亂餵流浪狗的人其實和渣男沒什麼兩樣
一個是讓狗以為自己是有主人的狗，一個是讓人以為感情有了歸宿
但都只是做半套不想完全負責而已

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.76.142.11 (臺灣)

※ PTT 網址

推

techih 04/09 02:37特斯拉也有雷達OK 不是只靠鏡頭

推

techih 04/09 02:40我看完你寫的感想也是公三小？！？

→

ewings 04/09 02:46特斯拉的前雷達分辨度大於7度，在50公尺外並排行駛

→

ewings 04/09 02:46的兩輛卡車，特斯拉雷達上也會辨識成同一個物體。

推 techih : 兩個鏡頭就能構成立體視覺了難道你有三個眼睛？

04/09 02:47 特斯拉用的是三個焦距不同的定焦鏡對同一個物體只會有一個鏡頭有較清晰的影像這種鳥玩法是弄不出立體視覺的。

→

ewings 04/09 02:49而特斯拉用了這種等級的雷達，雷達測距資料與影像資

→

ewings 04/09 02:49料的融合，基本上和用AI預測擲筊結果差不多吧

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 02:52:14

推

techih 04/09 02:50螢幕顯示一輛車並不代表他就只能看到一輛只是你

→

techih 04/09 02:50看的越細需要的電腦資源就越多那有沒有這個必要

推

techih 04/09 02:53我認為特斯拉比較著重在視覺辨識，雷達只是輔助

推

techih 04/09 02:57我覺得不太需要下定論啦如果真覺得光達終勝那可以

→

ewings 04/09 02:57特斯拉用三顆定焦鏡的鳥玩法，反而增加了電腦運算的

→

techih 04/09 02:57買Mobileye股票應該會賺翻

→

ewings 04/09 02:57需求量。光達+鏡頭，關聯性演算法的需求可以低到只

→

ewings 04/09 02:58用單晶片距離，但是特斯拉就要用到礦卡級的處理器。

推

techih 04/09 02:59但我記得NIO用光達卻配了4顆N牌高階處理器耶

推

techih 04/09 03:02 https://i.imgur.com/xnmwZQW.jpg

→

ewings 04/09 03:12人家NIO要搞的ADAS，是要直接衝Level 4，才要開發這

→

ewings 04/09 03:12個規模的硬體。可沒像特斯拉還要求車主雙手不能離開

→

ewings 04/09 03:12方向盤呢。

→

ewings 04/09 03:30另外，用NIO沒像特斯拉小器的使用低解析度的攝影機

→

ewings 04/09 03:30，影像串流處理的量本來就比較高，把tops去除pixel

→

ewings 04/09 03:30數量，特斯拉用的運算資源還比較高勒。

→

Guideboy 04/09 03:36三個定焦鏡是指三個不同焦距的鏡頭？

→

Guideboy 04/09 03:37是的話對同一物體可以同時準焦吧

問題是鏡頭內的影像不會只有一個物體，而且這三顆鏡頭的焦距範圍各差了100公尺相當於戴著單筒望遠鏡，還傻到要建立兩眼立體視覺一樣搞笑

→

Guideboy 04/09 03:39只是成像時物體大小會不同不會只有一個準焦

→

Guideboy 04/09 03:41不會有你說的一個鏡頭清楚其他模糊的情況

噓

a1445979 04/09 03:42到底在公三小，講的好像特斯拉沒有要衝Level4一樣

→

a1445979 04/09 03:43你要針對物件辨識、車輛辨識、道路辨識好像不用運

→

a1445979 04/09 03:43算資源一樣

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 03:52:09

推

kmlvli84 04/09 03:48你好像分不清焦距跟對焦距離的差別，特斯拉用了三

→

kmlvli84 04/09 03:48顆不同焦距的鏡頭，但是這三顆鏡頭的對焦距離基本

→

kmlvli84 04/09 03:48上可以視為泛焦。加上三顆鏡頭的位置並不重疊，是

→

kmlvli84 04/09 03:48完全可以計算出深度的，可惜的是並不是全畫面都算

→

kmlvli84 04/09 03:49得出來。

→

ewings 04/09 03:53你講的不就我上面已經講過的2.5D?

→

ykjiang 04/09 03:53而且特斯拉前向的鏡頭總共有五個，另兩個在側前方

→

ykjiang 04/09 03:53側前方那兩個鏡頭的規格是完全一樣的

https://qph.fs.quoracdn.net/main-qimg-18ea7bf48a6f7dfdce9e384c2ef80840

兩個側前方的鏡頭，和前方鏡頭視角重疊的範圍只有十幾度，而且還不是在車的前方。這個分配是要怎麼弄出兩眼立體視覺？？

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 04:00:51

推

kmlvli84 04/09 04:03你對緯度的定義有問題，兩顆鏡頭只要能看到同一個

→

kmlvli84 04/09 04:03物體，就必定可以辨識出三維的位置。可辨識範圍不

→

kmlvli84 04/09 04:03會影響維度。而且這三顆鏡頭只有一顆是長焦的，你

→

kmlvli84 04/09 04:03的望遠鏡舉例根本不合邏輯。

→

ykjiang 04/09 04:04不知你怎麼看出十度，而且只要那兩個重疊夠大就夠了

→

kmlvli84 04/09 04:05你忽略了wide forward camera跟main forward cam

→

kmlvli84 04/09 04:05era的重疊區了。

→

ykjiang 04/09 04:08十度應該是廁後方那兩個鏡頭

→

ykjiang 04/09 04:11重點是Tesla這樣的鏡頭配置行之有年了，

→

ykjiang 04/09 04:11要真有如此低級的設計錯誤發生，早就更正了

→

ykjiang 04/09 04:59查了一下Tesla 3D視覺主要是靠正前向的那三個鏡頭

→

ykjiang 04/09 04:59可行的原理如 kmlvli84 說的

→

ykjiang 04/09 05:00只要兩個鏡頭拍出的同一個物體有不同位置或大小，

→

ykjiang 04/09 05:01理論上就能估算出距離

→

ykjiang 04/09 05:03不同大小，可以因為視角範圍不同或焦距不同造成的

推

ingmu 04/09 07:58好了別吵來看資料 Tesla其實用單鏡頭就能判斷距離

→

ingmu 04/09 07:59原理說明 http://bit.ly/TeslaHere519

→

ingmu 04/09 08:00實測遮到剩一個鏡頭還能在路口轉彎

→

ingmu 04/09 08:00https://bit.ly/TeslaHere609

噓

ssss127 04/09 08:12無腦特黑的最高表現？理性討論不行嗎

噓

ssss127 04/09 08:29不懂就虛心求教整天扣人帽子

噓

sted0101 04/09 08:32嗯嗯口氣很大水準很高哈哈哈哈哈

噓

pavaro 04/09 09:00供三小然後咧其他車廠現在在幹嘛

推

bluemkevin 04/09 09:17單鏡頭理論上可行，但是特斯拉目前的鏡頭規格有風險

→

bluemkevin 04/09 09:17...

推

ssss127 04/09 11:05換鏡頭分分鐘的事情而已目前特斯拉鏡頭解析度不高

推

bluemkevin 04/09 11:19不光是鏡頭的問題，早些年前晶片設計接收鏡頭影像格

→

bluemkevin 04/09 11:19式的接面可能也不堪使用。

→

bluemkevin 04/09 11:23現在的鏡頭不會只丟純影像的內容給晶片，還會伴隨其

→

bluemkevin 04/09 11:24他感測資料，然後車用鏡頭這幾年吃記憶體頻寬越來越

→

bluemkevin 04/09 11:24恐怖，車用壓縮也不太可能用lossy的方式，不過這看

→

bluemkevin 04/09 11:24車廠對於風險的拿捏。

推

zxcbrian 04/09 12:55那篇果然沒內容

推

largesperm 04/09 13:02你太小看軟體了

推

moboo 04/09 16:39感覺你是在硬體廠，現在軟體單鏡頭就能看深度了。

→

moboo 04/09 16:39看物體大小加上時間就能判斷

→

moboo 04/09 16:39上面推文很多人寫了，而且這是潮流

噓

milichang 04/10 01:09謝謝你帶來歡樂

推

shadowppt 04/11 01:41做硬體的怎麼不知道景深這件事.....

同系列文章

Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好

其他人也閱讀了

PTT 熱門相關