PTT評價

Re: [心得] GN 13、14代問題影片重點整理

看板PC_Shopping標題Re: [心得] GN 13、14代問題影片重點整理作者
AquariusZi
(AZ)
時間推噓57 推:58 噓:1 →:131

剛看完GN的影片,小弟我想從另一個角度來聊聊
一般半導體廠是怎麼做FA/RA/解issue的


以下長文,且為了方便理解會忽略許多細節與大量相對不準確用語
各路大神若不吝指教,先萬分感謝~~



依我個人的經驗,當產品出問題時,基本有三條主線要解

1.為什麼會發生,真因(root cause)是什麼
2.如何改善/根除異常,不再產出瑕疵品
3.為什麼瑕疵品會被出貨


第一條主線找真因的部分,Steve說了會委外實驗室來做,但沒特別講怎麼做
這邊非常粗略介紹IC FA其中一種常見的流程
這邊借用IST的圖來一用
https://i.imgur.com/5U4IbsM.png



Step1.電性測試
這邊是要先確認晶片哪組腳位/function是異常的,且是什麼異常
最簡單常見的作法是拿sample測電流電壓的反應曲線(I-V curve)
電測根據結果不同,能很粗略地判斷可能是什麼原因

舉例:電壓通再大電流都躺平是0=>斷路(open)=>可能是開孔分層delam
電壓通大電流增加但不同步=>高阻=>可能是介面層雜質/氧化
沒通電壓卻有電流=>短路(short)=>可能是電遷移


Step2.非破壞檢測
有了第一步的判斷,知道缺陷"可能"長怎樣之後
接下來就是要大範圍(eg. memory controller或是整顆die...XD)尋找可能的故障點 以CPU來說,我看超音波也免了,直接上Xray/3D Xray做定位可能比較快


Step3.前處理
晶片是3D結構,上一步通常只能判斷故障點的2D位置,或是知道很粗略的3D位置
接下來就是要把晶片磨到預定要看的那一層
但如果狀況很複雜,沒辦法判斷缺陷在哪一層,那就會Step3/4之間來回橫跳


Step4.主菜
找到目標點之後就是FIB切下去...前題是有找到就是了
下面是網路上隨便找一張FIB切開的樣子,看看到底長怎樣
https://i.imgur.com/IC2d6H2.png


這時候通常也會搭配XPS看元素成分,阿如果還不夠就請出大神TEM/element mapping

以CPU/SOC來說能走到這一步其實就噴非常*n多錢了
Q跟神山有問題的時候常常是一波爆送30顆樣品去分析,有一兩顆有切中就不錯了 找不到原因回頭切第二波第三波第n波都是非常有可能低
GN送幾顆去如果也能切中真的是祖上積德不然就是I家爛到出汁,隨便切都中
那I家也不要切FIB了,切腹吧



好,假設我們現在知道缺陷長怎樣了
"理論上"就可以下一些手段去做初步的改善
用業界的講法就是D2明確之後就可以下D3然後想D5怎麼下
這個就等GN找實驗室分析的結果或I家自己出來講ㄅ



最後來談可靠度驗證RA(realibility assurance)的部分
這部分是有JEDEC規範的,以我最常接觸的就是HAST系列測試
高溫+高壓+高濕度,還有是否通bias電壓的差別(uHAST vs bHAST)
RA的流程跟參數都是有規範的,例如像下面這樣(一樣借用IST的圖):
https://i.imgur.com/Gr7f276.png


這樣的業界標準測試不可能不做,也幾乎不可能亂做,
亂做/改RA數據被客戶抓到真的會被告死
但是

Windcws9Z: 所以..是QA流程有問題或QC造假數據嗎? 59.127.190.36 07/21 19:55

與其說QA流程有問題/RA亂做/造假數據/etc...

我更覺得是JEDEC公版測試其實已經越來越不夠用
像上圖中的溫度參數,最嚴苛的是130度,這對一般晶片測試可能已經非常夠用
但對A/I兩家動輒95~100度的工作溫度來說,130度真的還能叫"嚴苛"?


以下是超級不負責任亂猜
1.I家沒有意識到要用更高的標準跑RA,JEDEC pass就pass
2.I家用原本產品規格跑tighten RA,但臨時改規格(eg.頻率)又沒重跑RA,想說hold的住3.I家Q Lab乖乖過期
4.G桑虎軀一震說給我出,然後準備上法院被電爆
5.掰不下去惹


然後這種RA才看得出來的defect最致命的點在於
一旦RA沒抓到之後大量生產,更不可能回頭做這些測試
生產線的QA就算百百檢也抓不出來
現在I家應該除了內部全力找到原因之外,應該就是努力兜說帖安撫客戶了ㄅ


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.28.130 (臺灣)
PTT 網址

E7lijah 07/22 23:59樓下噓又在帶風向

pcfox 07/23 00:01客戶X 律師O

ss93106ss 07/23 00:03好久不見,可惜這篇沒有掛

SPDY 07/23 00:03這次災情很難定位 2顆切不到明確病灶不意外

benmei99 07/23 00:04專業推

Depthsharky 07/23 00:12某大師:沒直接點出主因=帶風向?

yymeow 07/23 00:14這幾天電蝦真的神人輩出,文章品質比其他

yymeow 07/23 00:14站要好上一截

mrme945 07/23 00:16某:不管啦,沒有講真因就是帶風向

jerrychuang 07/23 00:16也可能HTOL電壓設得太低,看不到問題

jerrychuang 07/23 00:16

mrme945 07/23 00:17所以其實我也不是很看好GN他們送檢能夠找

mrme945 07/23 00:17到根源就是了,但光他願意花那麼多錢送就

mrme945 07/23 00:17值得給個respect

Depthsharky 07/23 00:19對阿 超多$$ 可能打水漂 或中大獎

mrme945 07/23 00:23想問喵編,最近13、14代有賣很差嗎?這次

mrme945 07/23 00:23事件真的有影響到實際銷售嗎?

Zenryaku 07/23 00:26一堆專業鄉民跑出來

AreLies 07/23 00:26i5還是賣很好(菸

Zenryaku 07/23 00:26雖然我都有看沒有懂

Zenryaku 07/23 00:27大部分人都沒在做功課的吧,店家推什麼

Zenryaku 07/23 00:27就買什麼,你看前面才一篇買146kf的

mrme945 07/23 00:28因為我自己體感是覺得對實際銷售似乎沒什

mrme945 07/23 00:28麼太大影響,畢竟會關注的還是少數

ctes940008 07/23 00:29品牌機都14代CPU了吧?表示13代已...

smallreader 07/23 00:30神人輩出m(_ _)m

ctes940008 07/23 00:30市面上有一大堆可能要重驗證的產品

Depthsharky 07/23 00:34144 145照賣阿 146K以上也是照賣阿

Depthsharky 07/23 00:34又不負責修 也沒倒楣到剛售出就出事

Depthsharky 07/23 00:35吧(X 超過一個月都是跟消費者說找代

Depthsharky 07/23 00:35理/原廠 跟底部銷售端應該是沒差

yiting428 07/23 00:36intel有問題固然是事實,但youtuber跟

yiting428 07/23 00:36網路上的說詞也聽聽就好,很多都不懂

yiting428 07/23 00:36裝懂,出一張嘴最厲害

Depthsharky 07/23 00:38大環境還能說你那區有沒有跳電(X

Depthsharky 07/23 00:38要不要買個UPS

AreLies 07/23 00:39這次問題就是intel也不知道 也解決不了

AreLies 07/23 00:39大家當然用自己的依據下去猜問題點了

AreLies 07/23 00:39不然要怎樣

Depthsharky 07/23 00:40雞尾酒療法自救拉 怎辦 當鴕鳥又不會

Depthsharky 07/23 00:40解決

yymeow 07/23 00:40我就說實話了,一定會有人說帶風向

yymeow 07/23 00:40答案就是沒有。而且至少在台灣,i比A只看

Koogeal 07/23 00:4137樓發言..頓時水桶蓋突然炸裂了!有沒有

Koogeal 07/23 00:41掛??

AreLies 07/23 00:41從問題爆發以來都更新三波BIOS了

AreLies 07/23 00:41CPU還是爆 是要怎麼辦 嘴砲說沒問題嗎

yymeow 07/23 00:41量不看銷售值,應該在8:2到7:3之間

yymeow 07/23 00:42其實從問組機單的i:A也可以看出一二

ctes940008 07/23 00:42A牌還是小眾吧,筆電跟品牌機也少。

yymeow 07/23 00:42然後因為core ultra 200差不多要上市了

ctes940008 07/23 00:42尤其現在很多學生也不買筆電都用平板

AreLies 07/23 00:42A筆電跟套裝機是台灣比較少進

yymeow 07/23 00:43所以各通路13/14代高階的U其實庫存水準應

ctes940008 07/23 00:43去圖書館發現準備考試的幾乎都用iPad

yymeow 07/23 00:44該都在低點。通路不怕U賣不出,比較怕板子

ctes940008 07/23 00:44筆電這幾天大概只看到十台

yymeow 07/23 00:44清不掉

yymeow 07/23 00:45要說這事件對通路的困擾就是的確售後需求

canandmap 07/23 00:45帶風向大師可以提供反證嗎?

canandmap 07/23 00:45還是只會跳針說在帶風向?

yymeow 07/23 00:45增加了,這個其實看各站各板出來喵說BSOD

yymeow 07/23 00:45的文章頻率也可以推知一二

mrme945 07/23 00:46感謝喵編解答

mrme945 07/23 00:46所以我說喜歡Intel的其實也不用難過,畢

mrme945 07/23 00:46竟實際影響真的不大

mrme945 07/23 00:47PTT跟現實世界風向不同也不是第一次了

yymeow 07/23 00:47有時候看某些推文吹大哥要死了,我看報表

yymeow 07/23 00:48都有平行世界的感覺:) 有時候還有美股二

yymeow 07/23 00:48板的感覺

Depthsharky 07/23 00:49賣自家保固給企業的OEM比較頭疼?

yymeow 07/23 00:49然後台灣市場跟全球市場其實也有落差

yymeow 07/23 00:51所以要怎麼自我詮釋其實也無妨。但是回歸

yymeow 07/23 00:52實際面,真的客人在進行消費時,i或A的品

yymeow 07/23 00:52牌喜好可能也沒那麼重,尤其是沒有沉浸在

yymeow 07/23 00:533C產業的人。打個比方直接問家人CPU有哪兩

yymeow 07/23 00:53家,可能答案會是華碩蘋果等等也說不一定

yymeow 07/23 00:54或可能知道英特爾美超微,但是真的要跟各

yymeow 07/23 00:55位的長輩說英特爾以前只出四核心不長進...

aaddaaddjack 07/23 00:55intel在幹嘛真的匪夷所思,14代是re

aaddaaddjack 07/23 00:55fresh 所以13代有的問題可能14代也

aaddaaddjack 07/23 00:55解不掉,但是問題就出在13代試產到M

yymeow 07/23 00:55他們可能就喔喔,好好好。但並不見得會影

aaddaaddjack 07/23 00:55P前這中間完全沒有發現問題嗎?

aaddaaddjack 07/23 00:55不專業猜可能是fail rate低直接放過

aaddaaddjack 07/23 00:55或是測項沒有cover到壓力的long run

aaddaaddjack 07/23 00:55? 只覺得蠻扯的

yymeow 07/23 00:55響消費決策

mtc5566 07/23 01:00如果風暴只有這樣 那確實影響不大 如果

mtc5566 07/23 01:00風暴越演越烈就不好說了

yymeow 07/23 01:01最主要還是企業客戶跟OEM市場的反饋

Depthsharky 07/23 01:02角度不同而已 末端小眾消費者/企業

mtc5566 07/23 01:02就看Intel有沒有辦法擺平阿 最好給力點

mtc5566 07/23 01:02 我還等著抄intc的底勒

Depthsharky 07/23 01:03通路/代理 光是通路不賣專業維修只做

Depthsharky 07/23 01:03更換的話 通路哪有影響

mtc5566 07/23 01:03最好再來個重磅消息 股價跌低一點

Depthsharky 07/23 01:03會做功課的不會去給小賣店宰

Depthsharky 07/23 01:04會被宰的不會懷疑到CPU

Depthsharky 07/23 01:04企業機構那種跟人買服務的就不同了

Depthsharky 07/23 01:05會找供應方算帳

yymeow 07/23 01:05同意樓上所言,我也是覺得企客跟OEM才是

yymeow 07/23 01:06主戰場

mtc5566 07/23 01:06然後供應商就看INTEL給的好處夠不夠 給得

mtc5566 07/23 01:06夠當然願意幫忙擦屁股

mtc5566 07/23 01:06給不夠那就是CEO像P4時期一樣出來下跪道

mtc5566 07/23 01:06歉,那時候就是抄底intc的最佳時點了

Depthsharky 07/23 01:07小眾消費端這就是保內RMA跟嘗試延壽

jay920314 07/23 01:08

yymeow 07/23 01:08其實面對企客OEM,要i社拿15去換14/13,應

yymeow 07/23 01:08該也是做得出來的,順便延長客戶合約,半

yymeow 07/23 01:09買半送

mtc5566 07/23 01:13小眾消費端就天生韭菜命 只是這次剛好踢

mtc5566 07/23 01:13到GN這塊鐵板而已

dieorrun 07/23 01:14GN團隊就專門做這種吃力不討好的

mtc5566 07/23 01:15對這些不做功課的就是不用客氣 揶揄下去

mtc5566 07/23 01:15就對了他們下次才知道要先做功課

dieorrun 07/23 01:19就算真給他們切到問題 也不見得能回本

JackSmith 07/23 01:25上次看到CPU大翻車應該是AMD的推土機了

JackSmith 07/23 01:25只是推土機只是效能不好,I社這次是產

JackSmith 07/23 01:26品良率有很大的問題

justice2008 07/23 01:50可以搜尋AMD TLC BUG

Cubelia 07/23 01:57TLB,而不是TLC

justice2008 07/23 02:05對 記錯了 謝謝

mtc5566 07/23 02:10然後AMD TLB Bug是飛龍時代 不是推土機

ganbee 07/23 02:26連不良批次都沒法確定,代表整批都風險批

ganbee 07/23 02:26,但沒人敢和intel索賠,最後還是真香。

DuFanSong 07/23 02:36最可悲的是這次問題種種指向INTEL但是

DuFanSong 07/23 02:36現在別說索賠連叫囂一下INTEL也要

DuFanSong 07/23 02:37戰戰兢兢的 完全就是被吃得死死

lwei781 07/23 03:31RA 時間完全不夠啊

amos30627 07/23 06:26intel發聲明了 真的有氧化問題

amos30627 07/23 06:29不過說跟CPU不穩定無關

kkcity59 07/23 07:15這是打預防針?先承認有氧化?

kkcity59 07/23 07:17這麼精密的電子元件居然說氧化沒影響歐?

b325019 07/23 07:17GN送兩三顆去切就怕到跳出來先喊有氧化問

b325019 07/23 07:17題但不是原因所以就是在裝死嘛早就知道問

b325019 07/23 07:17題了w

kkcity59 07/23 07:19https://reurl.cc/ZeRrZV

kkcity59 07/23 07:22看來i家是咬死了只要更新BIOS就可解決

kkcity59 07/23 07:23如果解決不了..你去找你的主機板廠商啊

poeoe 07/23 07:26沒錯 要切FIB沒那麼簡單切中啦 常常切一堆S

poeoe 07/23 07:26ample都沒切到問題點

kkcity59 07/23 07:30切已經沒意義啦。i就說會氧化啊

poeoe 07/23 07:31有些狀況還要調layout來比對 才知道有沒有

poeoe 07/23 07:31問題 FA沒那麼簡單做啦

poeoe 07/23 07:31沒有切到問題點 說什麼都沒意義

kkcity59 07/23 07:32切出來氧化i說是早期庫存嘛

greg7575 07/23 07:35氧化是地球的錯,地球上氧太多了

greg7575 07/23 07:40你拿這張SEM比較可惜只能做EDX

greg7575 07/23 07:41EDX定性容易有雜訊。

greg7575 07/23 07:41確定目標點拿auger出來mapping

greg7575 07/23 07:41爽啊刺啊~~

linfon00 07/23 08:331X%的不良率...

ricyear 07/23 08:45重點是RA過了,你inline有變異會重做RA

ricyear 07/23 08:45嗎? 只要in SPEC 大多是大事化小小事化

ricyear 07/23 08:45無吧

widec 07/23 09:13嗯嗯 跟我想的一樣

EEr404 07/23 09:24專業推

nooin 07/23 09:41強調已解決2023年的問題就是承認有過問題?

SPDY 07/23 09:54可能需要誰去追問那批晶片去向 是銷毀了沒?

spr999 07/23 10:03這FIB切出來怎麼都沒窗簾效應也太漂亮,

spr999 07/23 10:03我切出來都好醜

ALDNOAH5566 07/23 10:03不良是整批還是某期間或是整個就有

ALDNOAH5566 07/23 10:03問題還不確定呢

ALDNOAH5566 07/23 10:08另外有TCT HTST環境是150度可以做

n00bmaster 07/23 10:13還好我用AMD

NTUOnline 07/23 10:19但JEDEC不是只有高階才驗阿...

NTUOnline 07/23 10:20理論上真有問題,應該不分產品線吧?

SHR4587 07/23 11:262023也才去年

SHR4587 07/23 11:282023年初跟2023年底也是2023,14代也就20

SHR4587 07/23 11:2824年初發布的,2023年末應該就開始生產

SHR4587 07/23 11:28

Shepherd1987 07/23 12:29AZ大說的都是封裝段的可靠度測試

Shepherd1987 07/23 12:29跟這次GN說的前段不太一樣喔

cmshow 07/23 12:46看電蝦漲姿勢

MrDisgrace 07/23 16:34資訊不對稱 一般user哪知道發生什麼事

a951l753vin 07/23 20:40你太不了解製造業 要做到不被客戶抓

a951l753vin 07/23 20:40包的方法多的是XD

a951l753vin 07/23 20:45業務要求生產幾顆 最後能達標 什麼

a951l753vin 07/23 20:45超產改時間、減少驗證流程 達到客戶

a951l753vin 07/23 20:45需求量 否則獎金績效怎麼來

a951l753vin 07/23 20:51看了ID原來是大佬冒犯了… 我是想表

a951l753vin 07/23 20:51達對外即使說的多麼頭頭是道 對內整

a951l753vin 07/23 20:51個公司文化才是信心來源

TISH12311 07/23 22:36對工廠來說合規的都是良品 不是100%無

TISH12311 07/23 22:36缺陷的才是良品

asdg62558 07/23 22:53巷子內的 專業

darkangel119 07/24 03:35每年都要做的ORM 這樣真的會過?

canandmap 07/24 20:52咦,怎麼不繼續跳針GN帶風向了?