AI GPU L4 NPI Program Manager企業培訓知識點
________________________________________
📘AI GPU L4 (NPI Program Manager)培訓手冊
(N3 / N2 / A16 適用)
________________________________________
🔷 第一篇|角色定位與核心框架
Chapter 1|NPI Program Manager 全景定位
Chapter 2|AI GPU 專案全流程(PRD → MP)
Chapter 3|NPI 核心三角模型
Chapter 4|Program Governance 架構
Chapter 5|KPI 驅動決策模型
🔷 第二篇|Program Planning
Chapter 6|WBS(Work Breakdown Structure)
Chapter 7|Gantt Chart × Critical Path
Chapter 8|Milestone 設計(M0–M4)
Chapter 9|Resource Planning(資源規劃)
Chapter 10|Capacity Modeling
🔷 第三篇|KPI 與 Dashboard
Chapter 11|KPI 定義體系
Chapter 12|Dashboard 設計
Chapter 13|Yield × Ramp 模型
Chapter 14|Cost Model(成本模型)
Chapter 15|KPI → Decision Engine
🔷 第四篇|跨部門整合
Chapter 16|IC Design Integration
Chapter 17|Fab Integration(晶圓)
Chapter 18|OSAT Integration(封裝測試)
Chapter 19|Supply Chain 管理
Chapter 20|跨公司協同(Multi-company)
🔷 第五篇|風險管理
Chapter 21|Risk Register 建立
Chapter 22|Risk Mitigation
Chapter 23|Stop-Ship 判準
Chapter 24|War-room(30分鐘響應)
Chapter 25|雙事件線決策模型
🔷 第六篇|Tape-out 決策(Chapter 26–28)
Chapter 26|Tape-out Readiness Checklist
Chapter 27|Go / No-Go Decision Framework
Chapter 28|Re-spin Decision Model
🔷 第七篇|客戶與商業管理
Chapter 29|Customer Alignment
Chapter 30|Customer Expectation 管理
Chapter 31|SLA × 合約管理
Chapter 32|Revenue × IRR 模型
🔷 第八篇|組織與領導
Chapter 33|Decision Leadership
Chapter 34|跨部門影響力
Chapter 35|L4 → L5 躍遷模型
________________________________________
📘 第一篇|角色定位與核心框架
Chapter 1|NPI Program Manager 全景定位
本章核心在於說明 L4(NPI Program Manager)在 AI GPU 組織中的關鍵角色轉變。從 L3 的「Block 技術負責」進化為 L4 的「產品交付負責」,代表思維從局部最佳化走向全局交付最佳化。L4 不再關注單一模組是否完成,而是整體產品是否能準時 Tape-out、順利量產並達成客戶承諾。本章強調 Chip-level 思維的重要性,要求能整合設計、製造、封裝、供應鏈與客戶需求,避免「局部完成但整體失敗」。同時導入「交付責任制」,明確指出 L4 是最終交付責任人,需在不完整資訊下進行決策,並對結果負責。這種角色本質上是從工程師轉型為產品經營者,是 AI GPU 專案成功與否的核心關鍵。
________________________________________
Chapter 2|AI GPU 專案全流程(PRD → MP)
本章建立 AI GPU NPI 的完整交付鏈路,涵蓋 PRD、Architecture、RTL/PD/Verification、Tape-out 到 MP(量產)五大階段,並定義 M0–M4 milestone 作為核心管理節點。強調每一階段不只是技術流程,而是風險控制與決策門。L4 必須具備 end-to-end 視角,確保整條鏈路時間連續、風險可控。特別指出風險具有「跨階段放大效應」,早期錯誤可能導致後期巨大商業損失。本章同時建立不同階段的風險分類與管理方法,例如 PRD 階段重點在規格穩定,Tape-out 前重點在決策品質,而 MP 階段則聚焦 yield 與供應鏈。核心結論是:AI GPU 專案成功不取決於單一環節,而在於整條交付鏈是否被正確設計與管理。
________________________________________
Chapter 3|NPI 核心三角模型(Schedule × Risk × Cost)
本章提出 NPI 最核心的決策框架——三角模型(時程、風險、成本)。強調三者高度耦合,不可能同時最佳化,因此 L4 的價值在於做出最優 trade-off,而非追求完美解。透過具體案例說明,例如是否延後 Tape-out、是否提前鎖 HBM、是否刪減功能等,展示決策如何影響三個維度。本章提出標準決策流程:定義不可退讓底線、辨識可調變數、量化影響、比較總損失、制定補救方案。核心觀念是「最優解 ≠ 最完美解」,而是最能支撐交付成功的方案。這一章是 L4 從工程整合者升級為商業決策者的關鍵能力模型。
________________________________________
Chapter 4|Program Governance 架構
本章建立 AI GPU 專案治理機制,包括 RACI、Decision Ownership、Escalation 機制與會議節奏。RACI 明確定義 L3(技術負責)、L4(交付負責)、L5(戰略負責)的角色分工,避免責任模糊。Decision Ownership 強調每個決策必須有明確 owner,避免組織陷入無法拍板的困境。Escalation 機制則建立 KPI 驅動的升級流程,例如 30 分鐘響應圈與 72 小時閉環。最後透過 daily/weekly/milestone review 建立節奏化管理。本章核心在於:治理不是開會,而是讓組織在壓力下仍能持續做決策並交付結果。
________________________________________
Chapter 5|KPI 驅動決策模型
本章說明 KPI 在 NPI 中的真正角色:不是報表,而是決策引擎。透過六大 KPI 類別(Schedule、Technical、Manufacturing、Supply Chain、Cost、Customer)建立完整監控體系,並強調 KPI 必須隨專案階段動態調整。進一步提出 KPI Decision Mapping,將指標與決策行動直接連結,例如紅線觸發 escalation、黃線啟動修正。核心理念是:沒有 KPI 就沒有治理,沒有 KPI 對應決策就沒有真正的 Program Management。本章本質是把複雜專案轉化為可觀測、可決策的系統。
________________________________________
📘 第二篇|Program Planning
Chapter 6|WBS(Work Breakdown Structure)
本章聚焦於如何將高度複雜的 AI GPU 專案拆解為可執行的最小單位。WBS 的核心目的不是列出任務,而是建立「可管理的交付結構」。在 AI GPU NPI 中,專案橫跨 Architecture、RTL、PD、Verification、Fab、OSAT、Supply Chain 等多領域,若沒有清楚的分解結構,將無法有效追蹤進度與風險。WBS 的關鍵在於三個層級:Program-level(整體交付)、Subsystem-level(跨模組整合)、Task-level(具體執行項目)。L4 必須確保每一個 WBS 項目都有明確 owner、輸出定義與完成標準(Definition of Done)。此外,WBS 不是靜態文件,而是隨專案進展持續更新的管理工具,特別是在需求變更或風險發生時,必須能快速反映到結構中。成熟的 WBS 能讓複雜專案從「不可控」轉為「可追蹤、可分派、可交付」,是所有後續排程與資源規劃的基礎。
________________________________________
Chapter 7|Gantt Chart × Critical Path
本章說明如何將 WBS 轉換為時間軸管理工具,並透過 Critical Path(關鍵路徑)識別專案真正的瓶頸。Gantt Chart 不只是視覺化排程,而是用來呈現任務依賴關係與時間壓力的核心工具。在 AI GPU 專案中,關鍵路徑通常跨越多部門,例如 Architecture → RTL → Full-chip Verification → Tape-out,任何一個節點延誤都會直接影響最終交付。L4 的責任不是讓所有任務都準時,而是確保關鍵路徑不被破壞。本章強調三個核心能力:一是識別依賴關係(Dependency Mapping),避免隱藏延誤;二是建立緩衝(Buffer Management),應對不確定性;三是動態調整(Dynamic Re-planning),當風險發生時重新計算路徑。成熟的 Program Manager 會持續關注 critical path 的變化,而不是只看整體進度百分比。因為在 NPI 中,真正決定成敗的不是平均進度,而是最慢的那條路徑。
________________________________________
Chapter 8|Milestone 設計(M0–M4)
本章建立 NPI 專案最核心的控制機制——Milestone(里程碑)系統。M0(PRD Freeze)、M1(Architecture Freeze)、M2(RTL Freeze)、M3(Tape-out)、M4(MP)不只是時間節點,而是「決策門(Decision Gate)」與「風險隔離點」。每一個 milestone 都必須具備明確進入條件(Entry Criteria)與完成條件(Exit Criteria),否則就會淪為形式化流程。L4 的關鍵能力在於:能夠判斷是否真正達到 milestone readiness,而不是被表面進度誤導。本章強調 milestone 的三大功能:一是節奏控制,讓專案有清楚前進節點;二是風險封鎖,避免未收斂問題流入下一階段;三是資源釋放,例如 Tape-out 前才投入大量製造資源。此外,milestone 設計必須與 KPI 與 governance 結合,形成可決策系統。若 milestone 設計不良,專案將出現「看似前進但實際失控」的現象。
________________________________________
Chapter 9|Resource Planning(資源規劃)
本章探討 AI GPU 專案中最容易被低估但最關鍵的要素之一:資源配置。資源不僅包括人力,還涵蓋 EDA 工具、計算資源(simulation farm)、Fab slot、CoWoS 產能、HBM allocation 等。L4 必須將資源視為「交付約束條件」,而非可隨意調整的變數。本章強調三個核心觀念:第一,資源必須與關鍵路徑對齊,優先支援 bottleneck;第二,必須建立資源預留與彈性機制,以應對突發需求;第三,需提前鎖定長交期資源(如 HBM、substrate),避免後期供應鏈風險。此外,資源規劃與成本直接相關,錯誤的資源配置可能導致成本暴增或 schedule 崩潰。成熟的 L4 會透過數據(KPI + Forecast)進行資源配置,而不是依賴經驗或部門爭奪。資源規劃的本質,是確保關鍵任務永遠不會因資源不足而停滯。
________________________________________
Chapter 10|Capacity Modeling
本章建立 AI GPU 出貨能力的數學模型,是連結設計與商業結果的關鍵橋樑。Capacity Modeling 的核心在於理解整體產能不是由單一環節決定,而是由最小瓶頸(min function)所限制。例如:晶圓產能、CoWoS 封裝、HBM 供應、ATE 測試與 burn-in 都可能成為限制因子。L4 必須建立 end-to-end throughput 模型,預測不同階段的產能上限,並提前進行資源配置與風險緩解。本章強調三個重點:第一,產能必須動態更新,隨 yield、cycle time、供應鏈變化調整;第二,必須建立 scenario analysis(情境分析),例如 HBM shortage 或 CoWoS delay 對出貨的影響;第三,產能模型必須與財務模型(Revenue / IRR)連動,因為產能直接決定收入實現速度。成熟的 NPI 管理,不只是確保產品能做出來,更要確保能「大量且穩定地出貨」,這正是 Capacity Modeling 的核心價值。
________________________________________
📘 第三篇|KPI 與 Dashboard
Chapter 11|KPI 定義體系
本章建立 AI GPU NPI 專案的 KPI 定義框架,核心目標是將複雜專案轉化為可觀測、可比較、可決策的指標系統。KPI 不只是績效評估工具,而是整個 Program 的「決策語言」。在設計 KPI 時,L4 必須遵循三大原則:第一,KPI 必須直接對應交付結果,而非僅反映活動;第二,KPI 必須具備可量化與可追蹤性,避免模糊指標;第三,KPI 必須與 owner 綁定,確保責任落地。本章同時提出 KPI 分層架構:Level 1(Program核心KPI,如milestone達成率)、Level 2(功能領域KPI,如verification coverage)、Level 3(操作層KPI,如task完成率)。此外,KPI 必須隨專案階段動態調整,例如早期重視spec stability,Tape-out前重視signoff readiness,量產階段重視yield與出貨能力。核心結論是:沒有KPI的專案無法治理,有KPI但無決策連結的專案則無法成功。
________________________________________
Chapter 12|Dashboard 設計
本章說明如何將 KPI 轉化為可視化 Dashboard,讓 L4 能即時掌握專案健康狀態。Dashboard 的本質不是展示數據,而是提供決策支持。有效的 Dashboard 必須具備三個層級:Executive view(高層決策摘要)、Program view(整體進度與風險)、Functional view(各部門細節)。設計上需遵循「少而精」原則,避免資訊過載,並透過紅黃綠(RAG)機制快速標示風險狀態。本章強調 Dashboard 必須具備時間維度(trend analysis),而非靜態數據,因為趨勢比單點更能反映問題。此外,Dashboard 應整合 schedule、technical readiness、supply chain、cost 與 customer 指標,形成統一視圖。成熟的 L4 不會逐一檢查報表,而是透過 Dashboard 快速定位問題並啟動決策。換言之,Dashboard 是「專案神經系統」,讓決策能即時發生。
________________________________________
Chapter 13|Yield × Ramp 模型
本章聚焦於從「產品做出來」到「產品能量產」的關鍵轉換,即良率(Yield)與爬坡(Ramp)。在 AI GPU 專案中,Tape-out 成功只是起點,真正的商業成功取決於 yield 是否能快速提升到可出貨水準。本章建立基本模型:總良率 = 晶圓良率 × 封裝良率 × 測試良率,並強調任何一環的下降都會放大影響出貨。本章同時介紹 ramp 曲線概念(M1→M3→M6),用於預測量產速度與產能釋放。L4 必須關注的不只是最終良率,而是 ramp slope(爬坡速度),因為時間就是收入。此外,本章強調良率問題常源於設計、製程與封裝交互作用(multi-physics coupling),因此必須跨部門協同解決。核心結論:良率不是製造問題,而是整個系統的問題;Ramp 速度決定企業現金流速度。
________________________________________
Chapter 14|Cost Model(成本模型)
本章建立 AI GPU NPI 的完整成本結構,將工程決策轉化為財務影響。成本不僅包括直接費用(NRE、mask、HBM、CoWoS、測試),還包含隱性成本(延遲、re-spin、機會成本、客戶違約)。L4 必須理解「總交付成本」概念,而非只看單點成本。例如,為節省驗證成本而導致 re-spin,最終可能成本更高。本章提出成本分解模型:開發成本、製造成本、封裝測試成本、供應鏈成本與時間成本,並強調成本與 schedule、risk 三者高度耦合。此外,本章引入 IRR / ROI 概念,將專案決策與投資回報連結,例如提前上市帶來的 revenue uplift。成熟的 L4 必須具備「工程 × 財務」雙重視角,因為每一個技術決策,本質上都是資源配置決策。成本模型的核心價值,在於讓決策可量化,而不是憑直覺。
________________________________________
Chapter 15|KPI Decision Engine
本章為整個 KPI 系統的最終整合,建立從「數據 → 判斷 → 行動」的決策引擎。KPI 若無法驅動行動,就只是裝飾。因此,本章提出 KPI Decision Mapping:將每一個 KPI 對應到具體行動,例如正常(Monitor)、異常(Correct)、嚴重(Escalate)。同時建立閾值機制(threshold-based trigger),當指標越線時自動觸發決策流程。本章也強調決策需包含完整元素:owner、deadline、行動計畫與回溯機制(feedback loop)。此外,Decision Engine 必須支援動態調整,因為專案環境與資訊會持續變化。成熟的 L4 不只是看 KPI,而是建立一套「看到數據就知道要做什麼」的系統。最終目標是將複雜專案轉化為半自動決策系統,使組織能在高壓與不確定中仍穩定推進交付。
________________________________________
📘 第四篇|跨部門整合(Integration)
Chapter 16|IC Design Integration
本章聚焦於 IC 設計端(Architecture / RTL / PD / Verification)的整合管理,是整個 NPI 的技術核心。AI GPU 設計高度複雜,涉及數十至上百個 block,若缺乏整合機制,極易出現「局部完成但整體失敗」的情況。L4 必須建立 cross-block integration 架構,確保 interface 定義清楚、clock/reset domain 一致、以及各 block 在同一節奏收斂。本章強調三大整合重點:第一,interface governance(避免協議不一致);第二,integration cadence(確保 SoC integration 持續進行,而非最後才整合);第三,full-chip verification(系統級驗證)。此外,L4 必須關注設計風險如何影響後段流程,例如 timing margin 不足可能導致 silicon fail。IC Design Integration 的本質,是把分散的設計工作轉化為一個可 tape-out 的整體系統。
________________________________________
Chapter 17|Fab Integration(晶圓製造整合)
本章說明如何將設計與晶圓廠(如 TSMC)製程能力整合。Fab Integration 的核心在於「設計可製造性(DFM)」與「製程相容性」。L4 必須確保設計符合製程規範(DRC/LVS/DFM),並與 foundry 協同優化良率與 cycle time。本章強調三個關鍵面向:第一,process window awareness(理解製程變異對設計的影響);第二,mask 與 tape-out slot 規劃(避免錯失時程);第三,early silicon learning(透過 first silicon 快速回饋設計)。此外,先進節點(N3/N2/A16)製程成本極高,一次 re-spin 可能帶來數千萬美元損失,因此 L4 必須在 Tape-out 前做出高品質決策。Fab Integration 的本質,是確保「設計不只是可實現,而是可穩定製造」。
________________________________________
Chapter 18|OSAT Integration(封裝測試整合)
本章聚焦於封裝測試(OSAT)整合,是 AI GPU 出貨的真正瓶頸所在。隨著 CoWoS、HBM 等先進封裝技術普及,封裝已從後段製程升級為系統整合核心。L4 必須整合 OSAT(如 ASE Technology Holding、Amkor Technology)能力,確保封裝設計、材料(substrate)、HBM stacking 與測試流程一致。本章強調三個重點:第一,thermal / warpage / SI/PI 問題(多物理耦合);第二,CoWoS 與 HBM allocation(產能稀缺資源);第三,ATE / burn-in throughput(測試瓶頸)。L4 必須建立 bottleneck 模型(min function),確定整體出貨能力受限於哪個環節。核心觀念是:在 AI GPU 時代,封裝不是附屬流程,而是決定能否出貨與獲利的關鍵節點。
________________________________________
Chapter 19|Supply Chain 管理
本章說明 AI GPU 專案中供應鏈的戰略地位。與傳統 IC 專案不同,AI GPU 依賴高度集中且稀缺的供應鏈資源,例如 HBM(如 SK hynix、Samsung Electronics)、substrate、CoWoS 產能等。L4 必須從早期就介入供應鏈規劃,確保關鍵材料與產能能支撐量產。本章強調三大能力:第一,long-lead item 管理(提前鎖定資源);第二,供應鏈風險分散(避免單點失效);第三,allocation negotiation(與供應商協商優先權)。此外,供應鏈不只是成本問題,更是交付能力問題,缺料可能直接導致無法出貨。成熟的 L4 必須將供應鏈納入核心決策,而不是事後補救。供應鏈管理的本質,是確保產品能在正確時間「被製造出來」。
________________________________________
Chapter 20|跨公司協同(Multi-company Integration)
本章整合整個 AI GPU 生態系,涵蓋 IC 設計公司、晶圓廠、OSAT、記憶體供應商與客戶(如雲端業者)。這是一個典型的 multi-company system,每一家公司都有不同目標與限制,若缺乏協同機制,專案將快速失控。L4 必須扮演「跨公司整合者」,建立共同節奏與決策框架。本章強調三個關鍵:第一,alignment(需求與時程對齊);第二,contract / SLA 管理(確保責任與承諾明確);第三,escalation channel(跨公司問題快速升級)。此外,L4 必須理解不同公司之間的權力結構與資源競爭,例如 CoWoS 或 HBM allocation 的優先順序。Multi-company Integration 的本質,是將多個獨立系統整合為一個「可交付的商業系統」。沒有這一層能力,再好的技術也無法成功落地。
________________________________________
📘 第五篇|風險管理(Risk Management)
Chapter 21|Risk Register 建立
本章建立 AI GPU 專案的風險管理基礎——Risk Register(風險登錄表)。其核心目的不是記錄問題,而是將「未知風險」轉化為「可管理風險」。在 NPI 專案中,風險來源極廣,包含設計(timing、power)、製程(yield)、封裝(warpage)、供應鏈(HBM shortage)與客戶(spec change)。L4 必須建立標準化風險結構,包含:風險描述、發生機率、影響程度、偵測方法、負責人(owner)與應對策略。本章強調風險分級(High / Medium / Low)與量化(probability × impact),避免主觀判斷。此外,Risk Register 必須動態更新,並與 KPI dashboard 整合,形成可追蹤系統。成熟的 L4 不會等問題發生才反應,而是提前建立風險地圖。核心觀念:風險不可避免,但可以被提早識別與管理。
________________________________________
Chapter 22|Risk Mitigation(風險緩解)
本章說明如何將 Risk Register 中的風險轉化為具體行動。Risk Mitigation 的本質不是消除風險,而是降低其發生機率或影響程度。本章提出四種策略:Avoid(避免)、Reduce(降低)、Transfer(轉移)、Accept(接受)。例如:透過額外驗證降低設計風險、提前鎖定供應鏈降低缺料風險、透過 SLA 將部分風險轉移給供應商,或在可控範圍內接受 residual risk。L4 必須將 mitigation 行動具體化,包括 owner、deadline 與 KPI 監控,否則只是形式化流程。本章也強調成本與風險的權衡,過度 mitigation 可能導致成本爆炸或時程延誤。成熟的風險管理不是「把所有風險降到最低」,而是「用最合理成本控制關鍵風險」。核心在於:風險管理本質是資源配置決策。
________________________________________
Chapter 23|Stop-Ship 判準
本章是 NPI 中最關鍵的決策機制之一——何時必須停止出貨(Stop-Ship)。Stop-Ship 決策通常發生在產品已接近或進入量產階段,但出現重大風險,例如功能錯誤、可靠度問題或客戶規格不符合。本章建立判準框架,主要考量三大維度:第一,技術風險(是否影響功能或可靠度);第二,商業影響(是否違反客戶承諾或造成重大損失);第三,可修復性(是否可透過後續修補解決)。L4 必須在不完整資訊下快速做出決策,因為延誤 Stop-Ship 可能造成更大損失。本章強調 Stop-Ship 不是失敗,而是風險控制機制。此外,決策後必須立即啟動補救方案與客戶溝通。核心觀念:Stop-Ship 是保護公司與客戶的最後防線,而不是懲罰機制。
________________________________________
Chapter 24|War-room(30 分鐘響應機制)
本章介紹高壓情境下的決策系統——War-room,是 L4 最重要的實戰能力之一。當專案出現重大異常(yield 崩潰、供應鏈中斷、客戶 escalation)時,必須快速進入戰時模式。本章定義標準流程:T0 發現問題,30 分鐘內完成初步分析,4 小時內做出 L4 決策,24 小時內必要時升級至 L5,72 小時內形成完整行動方案。War-room 的核心不是開會,而是快速決策與執行。本章強調三個關鍵:第一,多部門即時協同(Design × Fab × OSAT × Supply Chain);第二,數據驅動(KPI + root cause);第三,決策閉環(owner + action + tracking)。成熟的 L4 能在混亂中建立秩序,讓組織快速回到可控狀態。War-room 的本質,是把危機轉化為可管理問題。
________________________________________
Chapter 25|雙事件線決策模型(Dual Event-line Decision Model)
本章為高階決策框架,處理多重問題同時發生的情境,是 L4 與 L5 的關鍵能力。在 AI GPU 專案中,問題往往不是單一事件,而是多個事件同時發生,例如「封裝良率下降 + 測試瓶頸」、「HBM shortage + 客戶需求變更」。本章提出雙事件線模型,將問題拆分為兩條主線(Event A / Event B),分析其交互影響與優先順序。L4 必須評估不同組合下的總體風險與商業影響,而非單點優化。本章強調 decision tree 與 scenario analysis,例如不同處理策略對 schedule、cost、risk 的影響。核心在於避免「局部最佳但整體失敗」。成熟的 L4 能在多重壓力下找到全局最優解。雙事件線模型的本質,是將複雜決策結構化,使高階判斷可被系統化執行。
________________________________________
📘 第六~七篇|Tape-out 決策 × 客戶與商業管理
Chapter 26|Tape-out Readiness Checklist
本章建立 Tape-out 前的最終檢查機制,是避免高成本錯誤的關鍵防線。Tape-out 不只是技術節點,而是「不可逆決策點」,一旦送出光罩,後續修正成本極高。L4 必須建立完整的 readiness checklist,涵蓋設計(RTL 完整性、coverage)、實體(timing/IR drop/DRC/LVS)、系統(full-chip integration)、製造(DFM)、封裝(CoWoS/熱設計)、供應鏈(HBM allocation)等面向。本章強調「Checklist ≠ 文件」,而是決策依據,每一項都需具備明確達標條件。此外,必須建立 blocker 機制(任何 critical 未完成不得 Tape-out)。成熟的 L4 不會被 schedule 壓力迫使跳過檢查,而是用 checklist 保護專案。核心觀念:Tape-out 的品質決定後面 6–12 個月的命運。
________________________________________
Chapter 27|Go / No-Go Decision Framework
本章為 Tape-out 前最關鍵決策模型,決定是否正式進入製造階段。Go / No-Go 不是技術判斷,而是「技術 × 商業 × 風險」的綜合決策。L4 必須整合三類資訊:第一,技術 readiness(設計是否收斂);第二,風險評估(residual risk 是否可接受);第三,商業條件(市場窗口與客戶承諾)。本章強調「No-Go 並不代表失敗」,而是避免更大損失的策略選擇。決策過程需透明化,包含風險清單、替代方案與預期影響。此外,Go 決策必須附帶條件,例如需啟動特定監控或 mitigation。成熟的 L4 能在不完美條件下做出最合理選擇,而非等待完美。核心在於:決策品質比時程更重要。
________________________________________
Chapter 28|Re-spin Decision Model
本章探討當 silicon 出現問題時,是否需要重新流片(Re-spin)的決策機制。Re-spin 是 AI GPU 專案中最昂貴的決策之一,涉及數千萬美元成本與數月延遲。本章建立三大判斷維度:第一,問題嚴重性(是否影響功能或市場競爭力);第二,可修復性(是否可透過 firmware/workaround 解決);第三,商業影響(延遲 vs 缺陷的成本比較)。L4 必須透過 scenario analysis 比較不同選項,例如「帶缺陷出貨」或「延後 re-spin」。此外,本章強調 Re-spin 不只是技術決策,而是產品策略決策,需與 L5 協同。核心觀念:不是所有問題都值得修正,只有影響交付成功與商業價值的問題才需要付出高成本處理。
________________________________________
📘 第七篇|客戶與商業管理
Chapter 29|Customer Alignment
本章說明如何將內部專案節奏與客戶需求對齊。在 AI GPU 專案中,客戶(雲端/HPC/OEM)通常具有明確 deployment 時程與性能要求,若未對齊將導致重大商業風險。L4 必須建立持續對齊機制,包括 spec review、milestone sync 與變更管理。本章強調「alignment ≠ 一次性確認」,而是持續溝通過程,特別是在需求變更(late change)時需快速反應。此外,需區分「must-have」與「nice-to-have」需求,避免不必要延誤。成熟的 L4 能在內部限制與客戶期待之間取得平衡。核心在於:客戶不是被動接受者,而是專案的一部分。
________________________________________
Chapter 30|Customer Expectation 管理
本章進一步探討如何管理客戶期望,避免不合理承諾導致交付失敗。AI GPU 專案常面臨性能、功耗、時程等多重壓力,若未妥善管理期望,容易出現信任危機。L4 必須建立透明溝通機制,包含風險揭露、進度更新與問題回報。本章強調「under-promise, over-deliver」原則,以及如何透過 phased delivery(分階段交付)降低壓力。此外,需建立 escalation channel,確保重大問題能快速對齊。本章核心觀念:客戶關係的本質不是滿足所有需求,而是建立可預期與可信任的合作關係。
________________________________________
Chapter 31|SLA × 合約管理
本章將技術交付轉化為法律與商業承諾。SLA(Service Level Agreement)定義了交付標準,例如時程、良率、性能與可靠度。L4 必須理解 SLA 條款,並確保專案運作符合契約要求。本章強調三個關鍵:第一,條款明確性(避免模糊定義);第二,風險分攤(供應商與客戶責任界定);第三,違約成本(penalty 與補償機制)。此外,需避免「不可達成 SLA」,否則將造成財務與信譽損失。成熟的 L4 不只看技術交付,更會考量合約風險。核心在於:SLA 是將技術能力轉化為商業責任的橋樑。
________________________________________
Chapter 32|Revenue × IRR 模型
本章為整個 NPI 的最終目標——將技術轉化為現金流。Revenue 不只是出貨數量,而是出貨時間 × 單價 × 成本結構。本章建立基本模型:Revenue = Shipment × ASP,並結合 IRR(內部報酬率)評估投資價值。L4 必須理解「時間價值」,因為提前上市可顯著提高 IRR。本章強調三個核心:第一,出貨瓶頸(min 模型:HBM/CoWoS/Test);第二,成本結構(HBM/封裝佔比);第三,市場窗口(timing impact)。此外,延遲或 re-spin 將直接影響現金流曲線。成熟的 L4 能將技術決策轉換為財務結果,並以 IRR 作為最終衡量標準。核心觀念:AI GPU 專案的終極目標不是 Tape-out,而是盈利。
________________________________________
📘 第八篇|組織與領導(Leadership & Transformation)
Chapter 33|Decision Leadership(決策領導力)
本章聚焦於 L4 最核心但最難量化的能力——決策領導力。在 AI GPU NPI 專案中,資訊永遠不完整、時間永遠不足、風險永遠存在,因此決策能力比分析能力更重要。Decision Leadership 的本質不是「做對每個決定」,而是「在不確定中持續做出足夠好的決定」。L4 必須具備三大能力:第一,快速收斂資訊(從複雜數據中抓出關鍵變數);第二,建立決策框架(將問題轉化為可比較選項);第三,承擔結果(對決策後果負責)。本章強調,決策延誤往往比錯誤決策更致命,因為會讓組織失去調整空間。此外,L4 必須避免「過度追求完美資訊」,而應建立 iterative decision(迭代決策)機制。成熟的 Decision Leader 不只是做決策,而是讓整個組織具備決策能力。核心觀念:決策品質 × 決策速度,決定專案成敗。
________________________________________
Chapter 34|跨部門影響力(Cross-functional Influence)
本章探討 L4 如何在無直接權力的情況下推動組織前進。AI GPU 專案涉及 Design、Fab、OSAT、Supply Chain、Customer 等多方角色,L4 並不直接管理所有團隊,因此必須依賴影響力而非權威。本章提出三大影響力來源:第一,數據與事實(KPI 驅動);第二,共同目標(將各部門目標轉化為統一交付目標);第三,信任關係(建立長期合作基礎)。此外,L4 必須能處理衝突,例如設計團隊追求性能、製造追求良率、供應鏈追求成本,這些目標往往互相衝突。成熟的 L4 不是消除衝突,而是引導衝突轉化為決策。本章也強調溝通節奏(cadence)與透明度的重要性。核心觀念:真正的領導力不是控制他人,而是讓不同團隊願意朝同一方向前進。
________________________________________
Chapter 35|L4 → L5 躍遷模型
本章為整套手冊的最終總結,說明如何從 L4(交付負責者)進化為 L5(戰略決策者)。L4 的核心價值在於「把產品交付出來」,而 L5 的核心價值在於「決定做什麼產品」。這一躍遷不是能力加強,而是思維轉變。本章提出三大升級方向:第一,從專案視角轉為組合(portfolio)視角,需同時管理多個產品與資源配置;第二,從交付最佳化轉為資本效率最佳化(CapEx / IRR);第三,從執行決策轉為定義決策框架(例如技術路線、節點選擇)。此外,L5 必須理解產業結構與競爭格局,例如 Foundry、HBM、OSAT 在 AI 時代的權力轉移。本章核心強調:L4 解決問題,L5 定義問題。真正的躍遷,是從「如何做」轉變為「為何做」。
________________________________________