• <dfn id="njlhd"></dfn><source id="njlhd"></source>

    <source id="njlhd"></source>

      <dfn id="njlhd"><video id="njlhd"></video></dfn>
      <source id="njlhd"><address id="njlhd"><sup id="njlhd"></sup></address></source>

      <b id="njlhd"><small id="njlhd"></small></b>
        <tt id="njlhd"></tt>

          <video id="njlhd"><address id="njlhd"><kbd id="njlhd"></kbd></address></video>
          • 元宇宙:本站分享元宇宙相關資訊,資訊僅代表作者觀點與平臺立場無關,僅供參考.

          半導體行業專題研究:從英偉達看國產GPU發展機遇與挑戰

          • 未來智庫
          • 2022年10月20日07時

          (報告出品方:中信證券)

          報告緣起

          市場需求:AI、高性能計算、圖形渲染等推動 GPU 等并行計算芯片需求

          需求場景:AI 訓練&推理、復雜科學計算、大規模圖形渲染等,持續推動并行計算芯 片需求。由于 GPU(Graphics Processing Uni,圖形處理器)是由成百上千個陣列排布的 運算單元 ALU 組成,使得 GPU 更適用于大規模并發運算,其在圖形處理、計算加速等領 域有著廣泛的運用。2)由于 GPU 加速器強大的并行處理能力,超算中心工作人員可以更 好地設計深度網絡結構,使得其在超算領域&數據中心領域更具經濟效益,導致 GPU 在 AI 訓練&推理、科學計算等領域有著廣泛的應用。

          GPU 用于 AI 訓練&AI 推理領域。在典型 AI 模型卷積網絡中,大量數據以圖片形 式導入,在進行運算過程中,數據均為矩陣形式,而矩陣運算通常適合并行,因 此 AI 算法的特性,使得 GPU 的運算速度明顯大于 CPU,使得 GPU 得以大量應 用在 AI 的訓練與推理當中。

          GPU 可用于復雜科學計算中。科學計算將物理、化學、生物、航空航天等領域 的問題轉化為數學模型,通過計算和求解模型用于實際產業。從計算數據來看, 由于科學計算中所用數據多數以矩陣為形式,同時由于科學計算對誤差有強制要 求,因此在運算中需要在并行運算基礎上保證一定的精度。而現代 GPU 在并行& 矩陣運算的基礎上,已經能夠滿足科學計算所需的精度要求。

          近些年來,隨著人工智能軟件算法的發展,復雜科學計算的進步,以及圖形渲染功能 的增加,帶動底層芯片并行計算能力需求的快速提升。以全球 AI 芯片領軍者英偉達的發展 狀況來看,公司 AI 芯片算力由 2012 年的 4Tops 提升至 2021 年的 1248Tops,9 年時間提 升了約 315 倍。



          AI 框架、并行計算框架等引入&豐富,不斷推動針對并行計算芯片軟件開發門檻降低。1)從人工智能軟件算法框架的發展歷史來看,2015 年谷歌宣布開源 TensorFlow,2019 年 PFN 宣布將研究方向由 Chainer 轉向 PyTorch。目前 AI 框架形成了 TensorFlow 和PyTorch 雙寡頭壟斷的競爭格局。其中,谷歌開源 TensorFlow 項目,在很大程度上降低 了人工智能的開發門檻和難度。2)TensorFlow 主要用于處理機器學習中的計算機視覺、 推薦系統和自然語言處理(NLP)的模型訓練和推理,涉及模型隱藏層相對較多,模型量 相對較大,基本上均需要 CUDA 的加速處理。隨著 TensorFlow 的開源,涉及到的開發開 發者快速增加,CUDA 軟件下載量也呈現陡增趨勢。據英偉達在 2021GTC 大會上宣布, 截至 2020 年底,CUDA 累計下載量超過 2000 萬次,其中 2020 年下載量超過 600 萬次。涉及到的開發人員約 230 萬人(2020 年新增超過 60 萬人)。

          算法豐富、算法復雜度提升等,亦成為市場需求的重要驅動力。1)如前所述,過去 9 年,AI 芯片的算力大幅提升,也帶動 AI 算法模型參數的大幅增加。從 Alexnet、ResNet 開始,到 BERT 網絡模型,參數量已超過 3 億規模,隨后 GPT-3 模型超過百億,Switch Transformer 的問世還一舉突破萬億規模。2)英偉達 2020 年發布的 Megatron-LM 模型, 參數量達到了 83 億,相比于在 2018 年以參數量震驚世界的 BERT 模型又提升了 5 倍。模型體積幾何倍數的增長也帶了更多數據中心側的需求,只有依靠上千塊 GPU 并行運算 才能在以天為單位的訓練時長中完成對 Transformer 模型的訓練。

          2021 年,全球數據中心邏輯計算芯片市場規模高達 436 億美元。1)在過去數年,全 球數據中心芯片市場保持高速增長,由 2012 的 122 億美元增長至 2021 的 436 億美元, 符合增長率約 15%。2)從市占率來看,早期英特爾和 Altera 幾乎壟斷數據中心約市場份 額,伴隨著 AMD 和英偉達產品矩陣的增加,AMD 和英偉達在數據中心領域中的的市占率 不斷提升。截至 2022Q2,英特爾全球數據中心芯片市占率約 41.5%、英偉達市占率為 34.0%、AMD 市占率為 24.5%。



          英偉達歷史借鑒:產品技術、軟件生態等構筑 GPU 核心壁壘

          近期,英偉達最新兩則公告,導致市場對國產 GPU 的關注度提升。1)8 月 31 日, 英偉達發布公告稱:(a)8 月 26 日,美國政府對英偉達未來出口到中國(包括香港)和俄羅 斯的 A100 和即將推出的 H100 芯片實施了新的許可證要求,該許可立即生效。新的許可 證要求將解決涉及的產品可能用于或轉移到中國和俄羅斯的“軍事最終用途”或“軍事最 終用戶”的風險。(b)該許可涉及到的芯片主要包括:英偉達 A100 和即將出貨的 H100 兩款芯片、基于 A100/H100 打造的 DGX 產品、以及未來實現峰值性能和芯片對芯片 I/O 性能均等于或大于大致相當于 A100 的閾值的任何 NVIDIA 芯片。目前來看,美國政府對 中國以及俄羅斯出口限制的主要是針對數據中心的高端獨立 GPU 芯片及相關產品。(c) 公司于 2022 年 8 月 24 日提供的 FY2023Q3 展望(對應 CY2022 年 8 月-CY2022 年 10 月),其中有對中國大約 4 億美元的潛在銷售可能會受到新的許可證要求的限制。2)9 月 1 日,公司發布公告稱,公司已美國政府新的授權審批,具體內容包括:(a)美國政府已 批準英偉達繼續開發 H100 芯片所需要的出口、在出口和國內轉移。(b)允許英偉達在 2023 年 3 月 1 日前,為 A100 的美國客戶提供所需的出口支持。目前,公司 A100 的美國客戶 包括戴爾、思科等服務器設備廠商,以及終端客戶亞馬遜、谷歌等。(c)美國政府授權 A100 和 H100,在 2023 年 9 月 1 日之前通過英偉達在中國香港的工廠履行訂單和物流。(d) 美國政府放寬許可授權的主要原因是,A100 的部分開發工作是依賴 中國工程師&中國運營部門進行。若 A100 無法完成開發,對英偉達的業績影響相對較大。

          英偉達圖形渲染領域:保持穩定、高頻技術迭代,不斷實現技術領先,例如 RTX&DLSS 等技術,并和開發者、應用廠商構成穩固的合作同盟。1)2020 年安培架構產品中,RTX 技術升級到第二代,并逐步向第三代 Tensor Core 技術推進,帶動 RTX 系列顯卡圖像運算 能力的全面提升,而 DLSS、Reflex 等能力帶動游戲體驗的提升,DLSS 2.0 將 FPS 提升 近 30,Reflex 降低 50%的游戲延遲。對于超大型以及精品游戲的運行,大幅提升體驗能 力。對于大型 3A 游戲,在高畫質條件下需滿足 45-90FPS,電競場景下需要 120-140FPS。在 GTX 的傳統產品線中,開啟 RT(光線追蹤)之后,游戲幀數從 60 掉至不足 30 幀。但 在 RTX 產品中,可提升至 90FPS 以上。2)鑒于英偉達 GPU 在軟件領域的優勢顯著,公 司 PC 用獨顯 GPU ASP 亦顯著高于競爭對手 AMD。2016 年,英偉達 PC 用獨顯 GPU ASP 為 81.3 美元/個,AMD 對應 ASP 為 31.0 美元/個。2021 年,英偉達 PC 用獨顯 GPU ASP 為 163.2 美元/個,AMD 對應 ASP 為 86.6 美元/個。



          英偉達數據中心領域:借助 CUDA 實現 GPU 從圖形顯示到通用計算的跨越,以及產 業生態壁壘的構建,并借助 DSA、NVlink 等架構創新、優化等實現持續性能領先。1)沿 著技術層面的核心差異,我們按照訓練&推理、邊緣&數據中心兩個維度,梳理目前全球主 要的 AI 芯片參與者,整體而言,相較于全球其他主要競爭對手,英偉達在產品完整度、存 量市場份額等層面實現領先,同時我們判斷這種領先優勢長周期亦將大概率維持。2)從 公司的軟件生態布局來看,英偉達構建了從底層到上游細分領域的應用開發軟件,可大幅 降低開發者的開發周期。

          產品豐富度&技術競爭力:英偉達系統級產品布局、在訓練環節的突出表現&領 先優勢已基本成為市場的共識,而在推理領域,伴隨新一代安培架構、Hopper 架構的升級,以及由此實現的訓練、推理的統一,以及對稀疏矩陣運算問題的良 好支持,目前在推理方面,英偉達最新的 A100 芯片的 Int 8 Tops 已經達到 1248, 較上一代提升超過 5X。同時在訓練環節,根據 Mlperf 的評測,在圖像識別、對 話式 AI、推薦系統等多個模型的對比評測中,英偉達芯片訓練性能全面領先華為、 谷歌等主要競爭對手。基于技術層面的全面分析,我們判斷英偉達有望在企業對 外服務(訓練、推理)、企業內部服務(訓練)環節保持持續領先,但在企業內 部服務(推理)仍面臨延遲、功耗等層面的明顯短板。而我們看到,英偉達在數 據中心市場的產品迭代節奏繼續延續既有的習慣,即繼續保持對芯片性能的狂熱 追逐,以及每兩年升級一次產品(CPU、DPU、GPU)的頻率。



          英偉達基于 CUDA 構建了豐富的軟件生態,顯著提升 GPU 的易用性。從軟件技 術分類來看,公司在軟件領域中的產品布局主要分為:基礎架構、游戲與娛樂、 應用工具、應用框架四大部分。具體內容如下:(a)在基礎架構方面,公司軟件 產品主要圍繞 AI&通用能力布局。其中 AI 主要包括邊緣 AI、AI 垂直領域解決方 案、AI 推理等;通用領域則圍繞 IO 傳輸、vGPU 等。(b)在游戲娛樂方面,公 司的產品布局主要包括 Geforce 云游戲平臺、直播領域的 Broadcast App 和元宇 宙領域中的 Omniverse Machinima;(c)在應用工具方面,公司可面向不同的應 用場景(AI、數據分析、元宇宙等領域),提供不同的開發工具。如:在 AI 領域, 可提供加速 AI 部署與工作流程的 NGC 產品;在元宇宙領域,可提供 3D 虛擬協 作的 Omniverse 產品。(d)在具體應用框架方面,主要憑借公司 AI 與數據分析 能力,在自動駕駛、視頻分析、推薦系統等各垂直領域提供具體應用框架,幫助 提高各行業運營效率。

          小結:伴隨 AI、高性能計算、大規模圖形渲染等應用場景的不斷拓展和豐富,市場對 大算力并行計算芯片的需求快速增長,截止目前,全球數據中心領域邏輯芯片市場規模已 經超過 400 億美元。同時近期市場對國產 GPU 領域的關注度提升。基于英偉達的歷史復 盤,可以看出公司在圖形渲染&數據中心領域保持較高的市占率,并實現產業引領。我們 認為核心原因在于:借助持續、高頻迭代保持產品技術行業領先,并借助 CUDA 等實現軟 件生態構建,不斷提升產品易用性等。GPU 作為大算力并行計算芯片領域最為可行的承載 者,在本篇報告中,我們將從全球市場出發,就 GPU 產業本身的產品特性、技術路線、 市場空間,以及國內市場現狀、演進路徑、競爭格局等展開系統的分析和討論,力圖針對 國內 GPU 市場構建一個完整的產業&投資藍圖。

          全球 GPU 市場:并行計算理想載體芯片,數據中心為中期需求增長主要場景

          GPU:通用并行計算理想載體芯片,從圖形處理向 AI、高性能計算等領域 擴展

          GPU 定義:圖形處理器,但承載功能已在早期定義上明顯泛化。1)發展早期,更多稱為圖形處理器(GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電 腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運 算工作的微處理器。2)由于計算機只能識別二進制數字,因此在進行圖形運算時,要把 圖片轉換成計算機能夠理解的二級制數組(見下圖圖示),因此 GPU 在進行運算時,所針 對的都是矩陣數據,因此 GPU 的大部分計算是并行的。這意味著 GPU 更加適合并行計算 與矩陣運算。



          GPU 應用場景:由早期的圖形渲染,逐步拓展至高性能運算、科學計算等領域,GPU 是通用并行計算的理想載體。1)由于計算機以及圖形運算的特性,GPU 所進行的運算多 數為矩陣運算、并行運算,這些特征使得 GPU 更加適合當前以 AI 為代表的高性能計算、 科學計算等領域,GPU 的使用范圍也由早期的圖形渲染領域,逐步拓展至高性能運算&科 學運算領域。2)與其他邏輯計算芯片相比,GPU 在通用性、計算速度、規模化部署經濟 性等核心指標上面,能夠做到較好的平衡,因此在目前 AI、復雜科學計算等并行計算領域, 逐步形成了 GPU 主導,FPGA、ASIC、CPU 為輔的穩定局面。

          CPU:適合處理復雜的串行計算和邏輯控制,并行運算性能顯著弱于 GPU。由 于功能與設計架構的不同,CPU 與 GPU 的計算能力也存在差異,CPU 的架構 使得其適合流水線式的串行計算與復雜計算,而 GPU 的架構使得其適合運算邏 輯簡單但可以同步進行的并行計算。因此在參數上,我們會看到 CPU 具有更高 的頻率與緩存,而 GPU 具備更多的核心。

          FPGA:靈活性突出,但易用性、計算速度、經濟性較 GPU 欠佳。FPGA 是一 種偏向于硬件的可編程芯片,FPGA 中使用了大量邏輯門(數字電路中的基礎部 件,通過電壓高低以及組合,將輸入的命令轉化為 0 或 1),建立真值表(輸入 不同代碼,輸出不同結果的查詢表),通過可編程邏輯布線(可以理解為電路開 關,編程即是對開關調整,實現門之間的電路組合)來實現算法。由于直接對硬 件編程,相較于 GPU 的平均計算效率與可編程性更高,但由于需要直接對硬件 進行編程以及較高的成本(為滿足編程要求通常晶體管冗余設計),通用性、大 規模部署成本以及最高計算能力不如 GPU。

          ASIC:特定場景性能最優,但通用性不足。ASIC 芯片是針對某一特定場景所研 制的專用芯片,優勢在于運算效率極高、部署成本較低。但對于實際應用而言,如果算法出現迭代升級或數據結構發生改變,ASIC 的效率將會大幅下降,因此 相較于 GPU 而言,ASIC 更多用于挖礦、音視頻解碼等專用場景。因此 ASIC 的 平均算力會更強,但在通用場景下以及最高運算能力上,GPU 優勢更大。



          小結:整體而言,正是基于 GPU 本身的優異特性,以及英偉達等企業在芯片架構、 軟件生態等層面的不斷努力,疊加 AI、高性能計算、大規模圖形渲染等應用場景的快速崛 起,GPU 逐步成為全球大算力并行計算領域的主導者。而在產品端,我們也總結發現, GPU 廠商亦結合下游的應用場景,在一個大的體系結構下,針對計算單元、緩存、總線帶 寬等技術點的優化和組合。在下文內容中,我們主要討論當下最主流的應用場景&產品:用于游戲等場景中圖形渲染的顯卡,以及用于數據中心 AI、高性能計算等場景的 GPGPU (通用計算 GPU)。

          圖形渲染:游戲為主,中期有望保持 10%~15%平穩增長

          目前在圖形渲染領域,游戲畫面渲染為主要應用場景,同時亦包括圖形工作站等場景, 獨立顯卡為主要硬件載體。IDC 數據顯示,目前全球獨立顯卡出貨量,近 5 年穩定在 8000-9300 萬部。按獨立顯卡的類型劃分,其中臺式機用獨立顯卡比例約 40%-53%,筆 記本&工作站獨立顯卡比例約 47%-60%。按照品牌商來看,英偉達獨立顯卡近 5 年市占率 一直穩步提升,市占率由 2018 年的 58.8%提升至 2021 年的 74.3%,AMD 市占率由 2018 年的 31%降低至 2021 年的 19%。

          市場規模判斷:預計 2025、2030 年將分別達到 278、568 億美元。2021 年,英偉達 游戲顯卡業務實現銷售收入 105 億美元,專業視覺收入(圖形工作站)21 億美元。我們 假設英偉達在全球游戲顯卡領域收入占比 80%,專業視覺領域收入占比 80%,則 2021 年, 在圖形渲染(含游戲、專業視覺等)領域,全球 GPU 市場規模為 158 億美元。同時為了 測算該領域中期市場規模,我們作出如下簡化假設:1)假設圖形渲染領域,中期應用場 景仍主要由游戲畫面渲染、專業視覺構成,其他長尾場景忽略;2)顯卡 ASP,參考英偉 達產品價格走勢,考慮到產品性能、制造成本等因素,預計顯卡 ASP 年復合增速在 10%~15% 之間,取中位值 12.5%;3)游戲用戶,疫情期間,全球高端游戲玩家出現大幅增長(預 計增幅 1 億人),中期預計保持平穩增長,每年增速 0~5%,取中位值 2.5%;4)假設專 業視覺的市場規模占游戲比例維持在 20%左右。綜合上述假設,中性情形下,我們預計全 球 GPU(圖形渲染)在 2025、2030 年的市場規模有望分別達到 278、568 億美元。

          數據中心:AI&高性能計算等,預計中期保持 25%以上年均復合增速

          市場格局:英偉達 GPU 在 AI 訓練、高性能計算領域占據主導地位。作為圖形渲染之 后另一主要應用場景,目前客戶主要通過在數據中心部署英偉達、AMD 的 GPU 芯片,實 現 AI 訓練、高性能計算等,同時輔以自研加速卡等,服務于特定場景的 AI 訓練、推理等。1)根據 Liftr Insights 數據顯示,2021Q1,在全球 TOP 云廠商數據中心 AI 加速芯片市場, 英偉達份額占比為 78%,近年來基本穩定在 80%附近,市場領先地位穩固。同時根據 Lifter 2019 年 5 月的數據顯示,全球四大云計算平臺阿里云、AWS、Azure 和谷歌云(GCP) 中,英偉達 TESLA 系列 GPU 產品的市場占有率大幅領先。其中,阿里云采用英偉達 TESLA 系列 GPU 比例為 81%,AWS、Azure 和 GCP 使用比例分別為 89%、100%和 100%,市 場份額絕對領先。2)另外據 Top500.Org 數據顯示,英偉達 GPU 產品在全球 Top 500 超 算中心的滲透率逐年提高,由 2013H1 的 72.2%提升至 2021H2 的 90.3%,幾乎處于壟斷 地位。



          市場規模:我們測算全球數據中心 GPU芯片市場規模,2021年約為 100億美元左右。FY2022(對應 CY2021)英偉達數據中心營收約 106 億美元,其中 Mellanox 營收約 25.7 億美元,則英偉達數據中心 GPU 相關產品營收約 80.3 億美元。在市場競爭段落中提到, 英偉達在數據中心領域中的市占率約 80%,依次測算,2021 年,全球數據中心 GPU 芯片 市場規模約為 100 億美元左右。

          GPU 數量:我們測算 2021 年,全球數據中心 GPU 芯片市場出貨量約 200 萬個。依 據英偉達在數據中心領域中 GPU 產品的價格測算,假設對應產品的 ASP 約 5000 美元/ 個,對應 FY2022 年(對應 CY2021 年)英偉達 GPU 產品出貨量約 160 萬個。在市場競 爭段落中提到,英偉達在數據中心領域中的市占率約 80%,依次計算,全球數據中心 GPU 市場出貨量約 200 萬個。

          數據中心 GPU 市場規模:預計 2025、2030 年將分別達到 245、828 億美元。結合 既有的認知和判斷,我們做出如下簡化假設:1)假設中期全球數據中心大算力邏輯芯片 市場增速和過去相似(2014~2021 年),年市場規模復合增速維持在 15%~20%之間,取 中位值 17.5%;2)數據中心領域,并行計算需求占比持續提升,預計每年相對份額提升 3%左右。基于上述簡化假設,我們中性預計,全球數據中心 GPU 市場規模將在 2025、 2030 年分別達到 245、828 億美元,同時若中期 AI 技術進步、高性能計算需求超出我們 的預期,則最終市場規模將顯著高于我們當前的預測。

          國內 GPU 市場:中期潛在空間可觀,本土廠商開始 規模崛起&產品落地

          國內市場現狀:和全球市場同步,預計 2030 年規模將突破 300 億美元

          圖形渲染:當前國內市場規模約 27 億美元,預計 2025、2030 年將分別達到 47、97 億美元。由于缺乏直接的統計數據,我們做出如下簡化假設:1)IDC 數據顯示,2016-2021 年,全球 PC 出貨量為 2.6-3.5 億臺,同期國內 PC 銷量占全球銷量比重約在 17%左右, 我們假設在圖形渲染領域,國內 GPU 出貨量占比亦和 PC 表現相對一致,并保持和全球 市場相似的增速,以及應用場景分布等。參考我們在上文中的測算,我們測算、預測 2021 年、2025 年、2030 年,國內 GPU(圖形渲染)的市場規模約為 27、47、97 億美元。當 然,若考慮到國內龐大的游戲用戶數,以及專業視覺等領域的旺盛需求等,最終的實際數 據料將大幅優于我們當前的測算&預測。



          數據中心:我們測算國內數據中心 GPU 市場約占全球 20%左右比重,對應 2021 年 整體出貨量約 40 萬個,對應市場規模約 20 億美元。1)從互聯網云廠商 Capex 支出來看, 阿里巴巴+騰訊+百度三家互聯網廠商的 Capex 占全球主要互聯網云商場(微軟、亞馬遜 (含租賃)、谷歌、Meta)總 Capex 比例的 7%-13%。若扣除亞馬遜在租賃領域中的 Capex 支出,我們預計中國三家互聯網廠商的 Capex 占比將超過 10%。2)Top 500.Org 網站顯 示,截至 2021 年 11 月,全球 Top 500 超算中心,中國擁有 173 個超算中心,為全世界 最多的超算中心國家,占有率約 34.6%。3)綜合考慮中國互聯網云廠商 Capex 占比約 10%, Top 500 超級計算機個數市占率約 34.6%,我們認為中國數據中心 GPU 需求量約占全球數據中心總 GPU 需求量的 20%左右。4)如前面章節測算,我們判斷 2021 年全球數據中 心 GPU 加速器市場出貨量約 180-200 萬個,2021 年全球數據中心 GPU 加速市場規模約 100 億美元。按照 20%市占率計算,我們預計 2021 年中國數據中心 GPU 加速器市場出 貨量約 40 萬個,對應市場規模約 20 億美元。

          中期展望:我們預計 2030 年國內數據中心 GPU 芯片市場規模有望增長至 250 億美 元,對應 CAGR 為 32%。如前所述,我們預計全球數據中心 GPU 加速市場規模有望由 2021 年的 100 億美元增長至 2030 年的 828 億美元(對應 CAGR 為 26%)。綜合考慮國 內 AI、高性能產業的發展,以及頭部科技公司的資本開支,Top 500 超級計算機數量等, 我們認為未來中國數據中心 GPU 芯片需求量將占到全球數據中心總 GPU 需求量的 25%-30%左右。依此計算,我們預計中國數據中心 GPU 芯片市場規模有望由 2021 年的 20 億美元增長至 2030 年的 250 億美元(對應 CAGR 為 32%)。當然考慮到國內企業在 AI、高性能計算領域的積極努力和進展,最終實際數字大概率會好于我們當前的中性預期。

          國內市場格局:本土廠商快速崛起,產品亦逐步上市

          國內 GPU 廠商:開始快速崛起,大多數企業目前已發布 1-3 款相關產品,大部分核 心團隊具有英偉達、AMD 工作經歷。1)2014-2020 年,國內成立若干 GPU&云端 AI 芯 片相關企業,目前此類企業已發布 1-3 代產品,產品落地進度不斷加快。2)從國產 GPU 相關企業創始人的團隊背景來看,大部分企業創始人團隊均有在英偉達、AMD 等企業有 多年的工作經驗。



          產品競爭力:國內廠商產品核心參數約落后英偉達、AMD 1~2 代左右,正逐步從“可 用”走向“好用”。1)通過對比海外 GPU 廠商和國內 GPU 廠商相關產品的參數,可以看 出國內 GPU 廠商在半精度&單精度領域中的計算能力,相差約 1 代差距;國內 GPU 廠商 在雙精度(64 位)計算領域能力近乎空白,但雙精度運算更多應用于復雜科學計算。2) 考慮到英偉達、AMD 在 GPU 架構中加入了張量核 TensorCore 或 Matrix Core(可用于執 行融合乘法加法運算),這種計算單元層面的 DSA 架構設計,亦使得他們在 AI 訓練、推 理環節具有更高的計算效率:

          英偉達 Tensor Core:2017 年公司發布的 Volta 架構首次引入了張量核 Tensor Core 模塊,用于執行融合乘法加法,支持 INT32 計算;2018 年公司發布的 Turing 架構對 Tensor Core 進行了升級,并增加了對 INT8、INT4、Binary(INT1)的計算 能力;2020 年公司發布的 Ampere 架構對 Tensor Core 再次升級,增加了 TF32 和 BF16 兩種數據格式的支持,也增加了對稀疏矩陣計算的支持。2022 年公司 發布的 Hopper 架構對 Tensor Core 再次升級,增加了 TF8 數據格式的支持。

          AMD Matrix Core:2020 年英偉達推出張量核 Matrix Core,對標英偉達 Tensor Core,并用于 MI100 加速器(可支持 FP64、FP32 計算格式);2021 年底,AMD 發布 MI250/250X 加速卡,基于 Matrix Core 的加持下,FP64/FP32 計算能力可 提升一倍。

          本土 GPU 廠商:有望率先在 AI 領域實現落地,并逐步擴展至圖形渲染、復雜科學計算等場景

          市場機遇:基于上文對英偉達歷史的復盤和分析,作為典型的通用芯片,產品技術、 軟件生態是 GPU 廠商不斷做大做強的核心基礎和支撐。同時在 GPU 實際落地應用中,需 要將硬件、軟件應用、游戲引擎、操作系統、OEM 等眾多環節匹配到一起,才能更好地 發揮性能作用。目前國產 GPU 廠商正處于起步階段,市場需求、產業政策均有利于其發 展&壯大:

          1)國產 GPU 廠商開始切入相關客戶產品中:英偉達最新公告背景下,倒逼國內相關 客戶開始使用國產 GPU 產品,在一定程度上能夠幫助相關企業與客戶建立密切聯系,進 而幫助相關企業進行快速的技術和產品迭代。2)市場需求:依據我們前文預測,2030 年全球 GPU(圖形渲染)市場規模為 568 億美元,中國市場規模約 97 億美元;2030 年全球數據中心 GPU(AI、高性能計算等)市 場規模為 828 億美元,中國市場規模約 250 億美元。

          面臨挑戰:目前國產 GPU 廠商大多仍處于早期發展階段,仍需要在技術、產品商業 化落地等方面不斷努力:1)核心技術人才招募。(a)從英偉達 GPU&AMD 的發展歷史來看,公司 GPU 架構 基本可以做到兩年更新一代,這對于架構師對于芯片研發的理解和應用場景的全判斷要求 較高。如:Jim Keller 于 2012 年左右加入 AMD,幫助涉及了 Zen 微架構,大幅提升公司 產品在數據中心領域的競爭力。(b)GPU 下游應用領域,并非是單純的硬件算力比拼, 對于軟件開發及軟件生態的建設亦相對重要。未來如何招聘大量的軟件&AI 人才,仍是國 產 GPU 廠商目前需要面臨的重要問題。2)產品設計、流片、客戶驗證,再到量產交付的全流程跑通。(a)GPU 是一種技術 門檻極高的細分賽道領域,前期投入資金成本相對較高,這對于企業的融資能力要求相對 較高。(b)從 GPU 的開發及使用流程來看,GPU 從最初設計到制造、流片、量產,周期 通常不會低于 18-24 個月。從產品點亮到推出,再到后續的大量出貨和用戶驗證,再到 后續找到可持續落得的應用場景,仍面臨著較多的挑戰。

          技術路線選擇:AI 為中短期最可能突破&落地場景,并可逐步向圖形渲染、復雜科學 計算等領域擴展。目前 GPU 的應用場景,主要應用于圖形渲染、AI 訓練&推理、復雜科 學計算等領域,結合市場規模、客戶結構、技術特性等要素,對于本土 GPU 廠商而言, 我們判斷,AI 將是最可能率先獲得突破的領域,并在此基礎上,不斷向圖形渲染、復雜科 學計算等領域進行延伸:

          AI 訓練:大模型逐步成為 AI 領域的主流,疊加下游自然語言理解、計算機視覺、 推薦系統等應用場景的不斷擴展,AI 訓練料將成為中期國內 GPU 最大的需求領 域。同時 AI 模型更多基于神經網絡結構,因此對計算精度要求并不嚴苛,亦使 得本土 GPU 廠商面臨的技術門檻相應降低,我們預計這將是本土 GPU 廠商最容 易實現突破的領域。

          AI 推理:從英偉達&谷歌等科技巨頭的產品參數來看,AI 推理環節對計算精度的 要求顯著低于 AI 訓練環節,一般 4~8 位即可滿足,但 AI 推理本身對實時性要求 較高,且下游場景過于碎片化,如何實現靈活性、細分場景之間的有效平衡,是 當前面臨的主要難題,因此初創企業更多在自動駕駛、安防等領域尋找市場機遇。

          圖形渲染:主要場景包括游戲畫面渲染,以及專業圖形創作&渲染等領域,作為 典型的 2C 市場,客戶更專注產品的性價比、品牌、生態支持等,且 GPU 圖形 管線設計復雜度相對更高。

          復雜科學計算:主要應用場景包括國防、航天、氣象等高性能計算領域,為控制 累計誤差,需要較高的計算精度,一般需要 64 位雙精度運算,整體技術架構復 雜性遠大于 AI 訓練、推理環節。



          國內部分重點 GPU 企業介紹

          摩爾線程:專注于研發設計全功能 GPU 芯片及相關產品

          英偉達背景出身,打造研運一體 GPU 公司。成立于 2020 年 10 月,致力于構建視覺 計算及人工智能領域計算平臺,研發全球領先的 GPU,建立高性能計算生態系統。摩爾線 程擁有能夠覆蓋 GPU 研發設計、生產制造、市場銷售、服務支持等完整成熟的團隊,逐 步成為國產現代全功能 GPU 實現的核心力量。創始人張建中是前英偉達全球副總裁,中 國區總經理,英偉達中國公司創始人,曾任惠普、戴爾公司高管。全功能 GPU 蘇堤問世。公司成立不到 300 天的時間,于 2021 年 11 月公布首顆國產 全功能 GPU 芯片研制成功,開創國產 GPU 研發速度先河。2022 年 3 月 30 日,公司推 出基于其統一系統架構 MUSA 的首款 GPU 蘇堤、基于蘇堤的首款臺式機顯卡 MTT S60、 首款數據中心級產品 MTT S2000,開拓 GPU 在中國市場的生態系統,助力驅動數字經濟 的發展。

          沐曦集成電路:國產高性能 GPU 芯片解決方案領先公司

          公司概述:沐曦集成成立于 2020 年 9 月。公司專注于設計具有完全自主知識產權, 針對異構計算等各類應用的高性能通用 GPU 芯片,致力于打造國內具有商用價值的 GPU 芯片,產品主要應用方向包括人工智能、云計算、數據中心等高性能異構計算領域。公司創始人團隊背景。公司匯聚頂尖技術、量產經驗、管理能力人才,創始人陳維良 曾任AMD GPU設計高級總監、AMD全球GPU SOC設計總負責人、AMD全球通用GPUMI 產品線(高性能計算、云計算)設計總負責人。公司擁有國內最完整的 GPU 設計研發團隊, 參與過 AMD 從圖像到高性能計算應用 GPU 的架構設計和量產,團隊構建完整,且有多年 合作共事基礎。

          目前公司有兩款產品,MXN 系列的 MXN 100 和 MXC 系列的 MXC 500。(1)MXN 系列是面向云端數據中心應用的人工智能推理產品,采用先進工藝結合高帶寬內存,提供 強大的 AI 算力和領先的視頻編解碼能力,可廣泛應用于智慧城市、公有云計算、智能視頻 處理、云游戲等場景。目前的 MXN 100 是一款 7nm 芯片,于 2022 年 8 月已經流片,成 功點亮。目前在正常測試軟硬件,公司預計年底送達客戶側測試。(2)MXC 系列通用 GPU(GPGPU)芯片是針對 AI 訓練和推理及科學計算的完美解決方案,沐曦自主知識產權 架構提供強大高精度及多精度混合算力,可廣泛應用于人工智能、數據中心以及科學計算、 教育和科研等場景。MXC 500 是一款 6nm 芯片,公司計劃 2022 年 10 月流片,2023 年 上半年回片。



          瀚博半導體:從 AI 與視頻轉向更廣闊的通用計算市場

          公司概覽:專注于高性能通用加速芯片的 AI 與視頻芯片廠商。公司成立于 2018 年 12 月,創始人錢軍曾在思科、AMD 擔任高管,具備 25 年以上的芯片設計經驗。公司曾于 2020 和 2021 年間完成 A 輪、A+ 輪和 B 輪融資,總募資額超過人民幣 24 億元。其 中最近一筆融資發生于 2021 年 12 月,由阿里巴巴集團、人保資本、經緯創投和五源資 本聯合領投,包含 B-1 和 B-2 輪,共計人民幣 16 億元。產品布局:從加速卡向 GPU 邁進。目前公司擁有 VA1 通用 AI 推理加速卡與 SV100 系列芯片。VA1 加速卡具備高效的 AI 推理能力,INT8 峰值算力超 2000TOPS,并能夠滿 足高密度視頻的解碼,支持 FP16 的浮點數運算。SV100 芯片則聚焦云端的推理,支持深 度學習與計算機視覺等場景。根據公司在 2022 年世界人工智能大會的披露,公司發布了 瀚博統一計算架構、全新數據中心(云端)AI 推理卡載天 VA10、邊緣 AI 推理加速卡載 天 VE1、以及瀚博軟件平臺 VastStream 擴展版等產品,并將繼續整合統一計算架構,在 邊緣計算、云計算以及軟件平臺上持續進行投入,并預覽了云端 GPU 芯片 SG100,正 式進入到 GPU 市場。

          商業化:簽約多家政企客戶,并與快手等互聯網廠商建立合作。根據公司在 2022 世 界人工智能大會的披露,2022 年以來,公司先后與福建大數據集團、國寧瑞能,高新興、 超聚變等行業領先企業,在智慧城市、智慧政務、智慧交通、智慧園區、智慧能源等多元 場景,開展深入合作,為企業智能化、數據化提供國產 AI 算力解決方案。而公司依靠在視 頻領域的特色,亦與快手等互聯網廠商建立合作關系。

          壁仞科技:專研通用計算體系,向圖形渲染進發

          公司概覽:聚焦高性能算力芯片,專研通計算體系。GPU 壁仞科技創立于 2019 年, 主要從事 GPU、DSA(專用加速器)的研發和銷售,致力于開發原創通用計算體系,提 供智能計算領域一體化解決方案。創始人張文曾任商湯科技總裁,具有哈佛大學法學博士 及哥倫比亞工商管理碩士學位;聯合創始人焦國方是圖形 GPU 產品線總經理,具有超過 25 年的 GPU 產品架構及研發經驗,曾任高通 GPU 團隊負責人;聯席 CEO 李新榮曾任 AMD 全球副總裁、中國研發中心總經理。

          由通用計算向圖形渲染全功能發力,補齊 GPU 全領域能力。1)公司聚焦云端通用智 能芯片,并逐步擴展產品線至人工智能訓練和推理、圖形渲染等多個領域,實現 GPU 芯 片的全功能全領域覆蓋。2)目前公司產品線主要為 BR100 系列的通用 GPU,針對人工 智能(AI)訓練、推理,及科學計算等更廣泛的通用計算場景開發,包含 BR100 與 BR104 兩款產品。其中 BR100 產品形態為 OAM 模組,搭載一顆 BR100 GPU 芯片,制程為 7nm, 在 FP32 精度下能夠實現 256TFLOPS 的計算峰值。BR104 產品形態為 PCIe 板卡,搭載 一顆 BR104 GPU 芯片,用于數據中心 GPU 服務器,采用 7nm 制程,FP32 精度下可達 到 128TFLOPS 計算峰值。此外,公司提供 BIRENSUPA 軟件開發平臺,為旗下硬件提供 完整功能架構的軟件開發平臺。后續看,公司將繼續圍繞通用計算芯片,進行硬件與軟件 的開發。



          商業化:GPU 芯片已經點亮,客戶拓展進行時。2022 年 3 月,公司點亮了國內算力 最大通用 GPU 芯片,2022 年 8 月發布首款通用 GPU 芯片,產品線逐步進入到落地階段。在客戶資源方面,根據公司在 2022 年世界人工智能大會上的披露,公司正在積極布局 BR100 商業化落地,目前已有平安科技、浪潮信息、萬國數據等建立合作。

          阿里平頭哥:專注云與 AI 的芯片研發廠商

          技術驅動產品創新,打造智聯網芯片平臺。平頭哥半導體有限公司成立于 2018 年 9 月 19 日,是阿里巴巴集團的全資半導體芯片業務主體,由中天微和達摩院合并而來。平 頭哥擁有端云一體全棧產品系列,涵蓋數據中心人工智能芯片、處理器 IP 授權等,實現芯 片端到端設計鏈路全覆蓋。平頭哥堅持以技術驅動創新,以芯力量擁抱數智未來的研發理 念,主要打造面向汽車、家電、工業等領域的智聯網芯片平臺。

          AI 芯片:以 CPU 為主,兼顧部分 ASIC 芯片。平頭哥目前產品分為四大類:1)玄鐵 系列的 CPU 芯片,此類芯片包含 8、9 以及無劍三大系列,基于 RISC-V 架構進行設計, 由于 RISC-V 本身的架構特性,適用范圍較廣,既能用于智能監控、機器視覺、人工智能、 5G、邊緣服務器等對處理器性能要求很高的應用領域,又能用在對功耗和成本極其敏感的 IoT、MCU 等領域。2)倚天系列的服務器芯片,倚天 710 采用 2.5D 封裝,分為兩個 DIE, 總計 600 億晶體管。包含 128 個 Armv9 高性能 CPU 核,用于服務器。3)含光 AI 芯片, 含光 800 基于 12nm 工藝, 集成 170 億晶體管,性能峰值算力達 820 TOPS(INT 8), 支持 Tensorflow、MXNet、Caffe、ONNX 等主流深度學習框架。4)羽陣 RFID 芯片,羽 陣 600 是一顆低功耗、高性能超高頻 RFID 電子標簽芯片,用于智慧物流、智慧倉儲、智 慧零售、資產管理等應用場景。

          商業化:服務阿里巴巴自身業務的同時,對外進行輸出。作為阿里巴巴旗下的芯片平 臺,平頭哥高性能產品直接用于阿里云相關產品,例如含光 800 已經廣泛用于阿里云、阿 里電商搜索與營銷等領域。但在 AI 之外,平頭哥 RISC-V 架構芯片由于適用范圍大,亦廣 泛用于其他場景,根據阿里平頭哥公開披露,截至 2020 年,玄鐵系列 CPU 已經出貨 20 億顆,自研嵌入式 CPU IP 核授權客戶超 100 家。根據納思達在 2021 年 6 月公開披露, 公司是阿里平頭哥國產玄鐵系列 CPU 的最大客戶, 基于玄鐵系列 CPU 的芯片出貨量累計 已超過了 5 億顆。2022 年阿里平頭哥與國內 MCU 廠商愛普特達成合作。在服務阿里自身 業務的同時,對外進行多維度拓展。

          昆侖芯:產品聚焦 AI 加速芯片,自研 XPU 架構賦能智慧應用

          專注 AI 加速,打造全鏈路服務體系。昆侖芯科技是一家 AI 芯片公司,于 2021 年 4 月正式從百度獨立出來,當前已完成 130 億人民幣和 20 億美元兩輪融資。昆侖芯前身是 百度智能芯片及架構部,于 2011 年 6 月設立,期間在實際業務場景中持續深耕 AI 加速領 域,是一家在體系結構、芯片實現、軟件系統和場景應用均有深厚積累的 AI 芯片企業。



          自研 XPU 產品架構,賦能智慧應用場景。昆侖芯科技研發實力雄厚,CEO 歐陽劍是 原百度首席架構師 (T11),智能芯片業務總經理,基礎技術體系聯席技術委員會主席,百 度無人駕駛初始團隊成員。團隊成員擁有全球頂尖學術背景,多數成員來自百度、高通、 Marvell、Tesla 等行業頭部公司,并提出了 100%自研的、面向通用人工智能計算的核心 架構 XPU。目前,昆侖芯科技已與智能產業的上下游企業建立了良好的合作生態,通過向 不同行業提供以人工智能芯片為基礎的算力產品,輻射互聯網、智慧城市、智算中心、智 慧工業、智慧應急、智慧交通、智慧金融等“智慧+”產業。



          (本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

          獲取精品報告請登錄【未來智庫官網】www.vzkoo.com。
          立即登錄請點擊下方“閱讀原文”。


          Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM

        1. <dfn id="njlhd"></dfn><source id="njlhd"></source>

          <source id="njlhd"></source>

            <dfn id="njlhd"><video id="njlhd"></video></dfn>
            <source id="njlhd"><address id="njlhd"><sup id="njlhd"></sup></address></source>

            <b id="njlhd"><small id="njlhd"></small></b>
              <tt id="njlhd"></tt>

                <video id="njlhd"><address id="njlhd"><kbd id="njlhd"></kbd></address></video>
              1. 4438xx亚洲最大五色丁香