(報告出品方/作者:中信建投證券,閻貴成、于芳博)
1.1 人工智能發展歷史:一波三折,深度學習引領第三次發展浪潮
人工智能第一次發展浪潮:推理與搜索占據主導,但由于當時機器計算能力的不足而經歷了第一次低迷期。人工智能(Artificial Intelligence,縮寫 AI),是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技 術及應用系統的一門新的技術科學。這一概念最早由麻省理工學院的約翰·麥卡錫在 1956 年的達特茅斯會議上 提出,隨之迎來了人工智能的第一次發展浪潮(1956-1974)。這一時期的核心在于讓機器具備邏輯推理能力, 通過推理與搜索嘗試開發能夠解決代數應用題、證明幾何定理、使用英語的機器。該階段的成果幾乎無法解決 實用問題,另外實際應用中人工智能計算量的增長是驚人的,特別是模擬人類感知帶來的巨大運算量遠超 70 年 代的計算能力,因此人工智能經歷了第一次低迷期。
人工智能第二次發展浪潮(1980-1987):專家系統開始商業化,場景局限性限制其發展。這一時期的核心 是基于“專家系統”思想,讓 AI 程序能解決特定領域問題,知識庫系統和知識工程成為了這一時期的主要研究 方向,專家系統能夠根據該領域已有的知識或經驗進行推理和判斷,從而做出可以媲美人類專家的決策。典型 代表如醫學專家系統 MYCIN,MYCIN 具有 450 條規則,其推導患者病情的過程與專家的推導過程類似,開處 方的準確率可以達到 69%,該水平強于初級醫師,但比專業醫師(準確率 80%)還是差一些。隨著人們發現專 家系統具有很強的場景局限性,同時面臨著升級迭代的高難度和高昂的維護費用,因而 AI 技術發展經歷了第二 次低迷期。
從 1993 年開始,AI 技術步入了第三次發展浪潮:深度學習引領浪潮。這一時期,計算性能上的障礙被逐步克服,2006 年深度學習這一重要理論被提出,并解決了訓練多層神經網絡時的過擬合問題。2011 年以來,深 度學習算法的突破進一步加速了 AI 技術發展的第三次浪潮,標志性事件是 2012 年 ImageNet 圖像識別大賽,其 深度 CNN 網絡的錯誤率僅為 15%左右,遠遠好于第二名支持向量機算法的 26%,這一結果迅速點燃了產業對 神經網絡和深度學習的興趣,深度學習也快速的實現了商業化。
1.2 人工智能產業鏈:關注 AI 芯片國產化,看好 AI 與金融、工業和醫療等方 向結合
人工智能產業鏈:主要分為基礎層、技術層和應用層。基礎層主要包括人工智能芯片、傳感器、云計算、 數據采集及處理等產品和服務,智能傳感器、大數據主要負責數據采集,AI 芯片和云計算一起負責運算。技術 層是連接產業鏈基礎層與應用層的橋梁,包括各種深度學習框架、底層算法、通用算法和開發平臺等。應用層 則是將人工智能進行商業化應用,主要提供各種行業解決方案、硬件和軟件產品。
基礎層之 AI 芯片:CPU 憑借通用性,依然在 AI 訓練中占據重要位置;GPU 憑借生態優勢和強大的計算 能力在 AI 應用中占據主導地位,FPGA/ASIC 未來占比將不斷提升。AI 芯片是 AI 加速服務器中用于 AI 訓練 與推理的核心計算硬件,主要可以分為 CPU/GPU/FPGA/ASIC/NPU 等。CPU 是目前常見的計算單元,具有很高 的靈活性,但在大規模運算方面的性能和功耗表現一般。GPU 因具有大規模的并行架構而能夠在 AI 計算任務 中實現較好的性能表現,但同時他會帶來不菲的能耗成本。ASIC 指的是人工智能專用芯片,在 AI 任務中有著 最優秀的性能表現,其缺點是靈活性較低同時具有高昂的研發成本和能耗成本。與 ASIC 相反的是靈活性很高 的可重復編程芯片 FPGA,其高效的異步并行能力幫助其在 AI 計算加速中扮演重要的作用,但其成本較高。目 前,GPU 因其更強的計算能力和更為成熟的編程框架(如 CUDA、OpenCL 等),已經成為當前 AI 應用中的重 要處理器和通用解決方案,而 FPGA 和 ASIC 則在特定的應用場景下有著各自的優勢。AI 芯片國產替代空間大。AI 芯片是目前人工智能產業鏈中與國外差距較大的一個環節,CPU 基本被 Intel 和 AMD 所壟斷;GPU 基本被英偉達、AMD 所壟斷;FPGA 全球 90%份額集中在 AMD(Xilinx)、Intel(Altera) 和 Lattice 等公司。
除 AI 芯片以外,基礎層還包括光學、聲學傳感器,公司包括舜宇光學、禾賽科技等;計算平臺主要指的是 能夠為人工智能計算提供所需的專用算力的數據計算中心,主要包括浪潮、阿里云、騰訊云、華為云等。數據 服務主要指的是為各業務場景中的 AI 算法訓練與調優而提供的數據庫設計、數據采集、數據清洗、數據標注與 數據質檢服務,主要公司包括海天瑞聲、愛數智慧、云測、標貝科技等;硬件設施主要指的是 AI 芯片和傳感器。
技術層為包括核心算法在內的關鍵技術研發和生產企業,主要分為 AI 軟件框架、理論算法、通用技術三 個方面。軟件框架簡單來說就是庫,編程時需導入軟件框架,里面有各種模型或算法的一部分,主要提供給使 用者設計自己的 AI 模型。目前市場上主要的深度學習開源框架有 Google 的 TensorFlow、Facebook 的 Pytorch, 而國內企業參與 AI 軟件框架開發較晚,主要有百度的飛槳 PaddlePaddle、騰訊 Angel 等。底層算法典型代表如 GNN、CNN、RNN、Transformer 等底層理論,相關參與方包括 DeepMind、OpenAI、阿里達摩院等。通用技術 主要指的是感知、認知、思維、決策等不同的應用方向的技術,包括計算機視覺、自然語言處理、知識圖譜、 推薦系統等,相關公司包括商湯科技(計算機視覺)、云從科技(計算機視覺)、科大訊飛(自然語言處理) 等。隨著底層理論算法的不斷創新和通用技術的不斷成熟,人工智能算法模型所需算力呈現指數級增長趨勢。2012 年以前,模型的算力需求以接近摩爾定律的速度增長(兩年翻一倍)。2012 年以后,模型訓練所需計算量 增長接近一年翻 10 倍。
應用層:安防占據 AI 應用主要場景,金融應用 AI 較好,醫療、工業具有一定快速應用前景。在應用場景維度,目前人工智能已在安防、金融、教育、交通、醫療、家居、營銷等多垂直領域取得一定發展,尤其是 AI+ 安防、金融、交通領域發展較快,典型公司有海康威視、商湯科技等;應用產品維度廣闊,包括自動駕駛汽車、 無人機、智能語音助手、智能機器人等,典型公司包括小馬智行、科大訊飛等。從下游需求方來看,安防依然 占據著 AI 主要需求,金融賽道則是下一個應用較好的場景,金融行業本身有較好的信息化基礎以及數據積累, 并且對精準營銷、智能風控、反欺詐和反洗錢等機器學習產品有強烈需求,因此金融賽道應用 AI 較好。醫療、 工業等賽道未來具有一定快速增長潛力,如 AI 在新藥研發、手術機器人等領域的應用,工業領域也從機器視覺 質檢進一步拓展至更多領域。
從整體市場規模上來看,人工智能行業整體市場呈現穩步增長的趨勢。2021 年全球市場人工智能市場收入 規模(含軟件、硬件及服務)達 850 億美元。IDC 預測,2022 年該市場規模將同比增長約 20%至 1017 億美元, 并將于 2025 年突破 2000 億美元大關,CAGR 達 24.5%。中國人工智能市場規模(含軟件、硬件及服務)達 82 億美元,占全球市場規模的 9.6%,在全球人工智能產業化地區中僅次于美國和歐盟,位居全球第三。數據顯示, 中國人工智能市場規模由 2016 年的 154 億元增長至 2020 年的 1280 億元,年均復合增長率為 69.9%。2022 年中 國人工智能市場規模將達 2729 億元。
計算機視覺和自然語言處理是商業化落地較快的兩項人工智能通用技術。計算機視覺相關技術已經十分成熟,技術落地效果超過人類水平,目前國內有 35%的 AI 企業聚集計算機視覺領域,2020 年市場規模近千億, 在所有領域中占比最高,是目前最具商業化價值的 AI 賽道。自然語言處理技術逐步實現從學術研究發展到商業 應用推廣的轉變,核心產品及帶動的相關產業規模均穩步增長,2021 年自然語言處理核心產品規模預計達到 219 億元,相關產業規模達到 514 億元,未來幾年年增長率均維持在 20%左右。
1.3 人工智能產業 2023 年投資策略
人工智能本質上是工具,要結合算法成熟度、數據積累和算力情況等多方面去判斷其在不同領域的應用情 況,同時下游行業發展的不同周期也一定程度上影響 AI 的應用,我們認為未來 AI 投資方向主要來自四個方面:
第一,算法相對比較成熟,數據訓練也達到商業化要求,處于從 1 到 N 滲透的階段,典型的如深度學習算 法在金融、教育、工業等領域的應用,重點關注教育行業復蘇以及工業領域的 AI 應用。深度學習在視覺、自 然語言處理均屬于發展多年且成熟度較高的算法,隨著數據的不斷積累和硬件邊際成本的降低,在該領域不斷 滲透,尤其是以安防、金融、教育和工業等領域滲透較好。展望明年,我們認為,安防、教育等行業今年受疫 情以及政府支出縮減等影響,明年有望復蘇,同時受益于財政補貼等因素影響。工業和 機器視覺的結合,是未來幾年 AI 應用最重要的方向之一,核心成長邏輯有三方面:一是下游高成長帶動需求, 如新能源領域快速發展帶動了相關智能視覺檢測設備;二是國產替代,成本疊加服務優勢,有望逐步替代基恩 士、康耐視等;三是新冠疫情下,制造業對機器替代人的訴求更強了,該領域公司都具備品類拓張的能力。由 于多數工業領域的機器視覺公司主要收入來自消費電子領域,今年受下游需求影響增速較慢,明年有望復蘇。
第二,算法尚不成熟,數據積累量不夠,算力也剛剛突破,整體看仍處于從 0 到 1 階段,典型的如自動駕 駛。我們認為智能駕駛是明年重要景氣賽道之一:一是展望明年,消費需求有所復蘇;二是智能駕駛的滲透率 繼續提升,明年下半年比亞迪、廣汽 Aion、吉利極氪等傳統車廠明年都會有硬件達到 L4 級別的自動駕駛車型 量產;三是人民幣進入升值通道,板塊毛利率將逐步修復。因此,明年整個板塊在總量、滲透率還有盈利水平上都將有向好的邊際變化。
第三,新算法的應用,實現從 0 到 1,創造出新的需求。如 Diffusion Model(擴散模型)的推出,基于擴 散模型的文本生成圖像模型越來越多,并很快擴展到文本生成視頻、文本生成 3D、文本生成音頻等,創造出 新的業態和應用。
第四,AI 軟硬件平臺的國產化比例提升。在中美貿易戰、科技戰持續深化的背景下,加強對卡脖子的關鍵 核心技術研發的支持,加速國產替代的步伐,重點看好 FPGA、EDA 等細分板塊。
2.1 深度學習引領風潮
深度學習是多層人工神經網絡和訓練它的方法。人工智能是個大范疇,機器學習是人工智能的一個研究分 支——通過計算模型和算法從數據中學習規律,機器學習有很多種算法,包括神經網絡、kNN、樸素貝葉斯、 支持向量機(SVM)等算法。其中,神經網絡經過不斷的迭代,從一層迭代到多層,因此可以實現更準確的判 斷,標準性事件是 ImageNet 圖像識別比賽中,深度神經網絡戰勝支持向量機算法,并在此后逐步超越人類。其 中,深度學習的理論基礎就是神經網絡,神經網絡層數夠深就可以稱為深度模型。
深度學習是過去十年 AI 研究最熱方向,也是商業化應用最廣泛的算法之一。根據人工智能發展報告(2020) 數據顯示,過去十年中,有 5405 篇以卷積神經網絡為研究主題的論文在人工智能國際頂會頂刊論文中發表, 其總引用量達 299729,并且在這些頂會頂刊論文引用量排名前十的論文中出現過 125 次,是 2011-2020 年最熱 門的 AI 研究主題。深度學習通過學習樣本數據的內在規律和表示層次,這些學習過程中獲得的信息對諸如文字, 圖像和聲音等數據的解釋有很大的幫助。深度學習在包括計算機視覺、自然語言處理、推薦系統等相關領域都 取得了優異成果。
神經網絡的研究是深度學習發展的基礎,上個世紀 50-60 年代神經網絡只能處理線性分類,因此應用領域 狹窄,使得神經網絡研究陷入 20 年停滯。在深度學習概念被明確提出之前,針對神經網絡的研究為后續深度學 習的提出和發展完成了基礎性工作。第一代神經網絡從 1958 年感知機算法被提出開始,其可以對輸入的多維數 據進行二分類,并通過梯度下降(使網絡的預測值與網絡的實際/期望值之間的差異不斷縮小)的方法從訓練樣本中自動學習更新權值(模型進行分類的參數),由此引發了第一次神經網絡研究的熱潮。1969 年,Minsky 在 著作中證明了感知機本質上只是線性模型,對于即使是最簡單的非線性問題都無法正確分類,隨后導致了對神 經網絡的研究陷入了近 20 年的停滯。
上個世紀 80-90 年代神經網絡具備持續優化和解決非線性能力后,開啟第二代神經網絡研究熱潮,但由于 存在梯度消失問題,研究也逐漸冷淡。Hinton 于 1986 年提出了反向傳播算法(從最后輸出的神經元開始,反向 更新迭代每一個神經元的權值,計算當前數據通過神經網絡后的結果與實際結果的差距,從而根據差距進行參 數優化),并采用 Sigmoid 作為激活函數進行了非線性映射,讓神經網絡具有了解決非線性問題的能力,由此 開啟了第二代神經網絡研究熱潮。但后續由于神經網絡缺乏相應的嚴格數學理論支持,甚至被指出存在梯度消 失問題(隨神經網絡層數增多,靠近輸入層的層之間的權重無法得到有效修正),嚴重影響深度神經網絡的訓練 效率和效果,因而神經網絡的第二次熱潮也逐漸冷淡。這一時期中,也出現了具有革新意義的模型,如 CNN-LeNet 和 LSTM 模型,其分別在手寫數字識別、序列建模兩個方面取得了良好效果,但由于神經網絡研究整體處于下 坡而并沒有引起足夠關注。解決了梯度消失以及利用 GPU 進行深度學習訓練后,深度學習圖像識別準確率大幅提升,掀起深度學習 第三次研究熱潮,并持續至今。2006 年 Hiton 提出了梯度消失的解決方案以及利用 GPU 進行深度學習訓練,首 次提出了深度學習這一概念。2011 年,新的 ReLU 激活函數被提出,有效抑制了梯度消失的問題。2011 年,微 軟首次將深度學習應用在語音識別上,取得了重大突破。2012 年,Hiton 課題組參加 ImageNet 圖像識別比賽, 其深度學習模型 AlexNet 奪得冠軍,識別率遠遠超越了基于 SVM 方法的第二名。理論上的不斷完善和硬件算力 (GPU)的突破共同在全世界范圍內掀起了研究深度學習的熱潮并持續至今。
2012 年開始,在計算機視覺領域內,深度學習不斷迭代出性能更好的架構。如 2014 年的 VGG、GoogleNet。與之前的模型相比,VGG 通過增加網絡深度的方法,在一定程度上提升了神經網絡的效果。其中 VGG-16 包含 了 16 層,參數量達到了 1.38 億。而 GoogleNet(Inception)則采用寬度代替深度,并引入了模塊化思想,其核 心思想是分別用不同大小的卷積模塊對前層的輸入進行運算,再對各個模塊運算的結果進行通道組合。最終 GoogleNet(Inception)以遠小于 VGG 的參數量實現了相當的性能效果。
2015 年的 ResNet 通過殘差結構進一步優化了神經網絡的性能,而后 MobileNet 的提出讓神經網絡嵌入到 移動端成為可能,NAS 和 RegNet 等算法及模型的應用,使得神經網絡可以由機器自動設計。ResNet 的核心思 想在于在輸出跟輸入之間引入一個短路連接(殘差模塊),讓每一層的輸入在網絡深度增加的時候也能得以保 留,進而解決了由于網絡深度過大帶來的梯度消失問題,讓訓練出成百上千層的神經網絡成為可能。2017 年, 谷歌團隊提出 MobileNet 這一輕量級網絡結構,相比于傳統的卷積操作能夠大大的減少參數量和提高網絡運行的特性,進而讓其能夠有效嵌入到移動端使用的網絡模型中。2019 年開始,神經網絡架構搜索(Neural Architecture Search,簡稱 NAS)開始興起,核心思路是從手工設計神經網絡到機器自動設計神經網絡。此后,RegNet 進一步 優化這種機器自動設計神經網絡的過程,RegNet 也是搜索最優的網絡結構,但是又與 NAS 有明顯區別,NAS 在定義的搜索空間內找到一個最優網絡,RegNet 則是在一個巨大的初始搜索空間中,不斷縮減,最終獲得一個 高性能模型更加集中的子空間,在這個過程中,發掘網絡優化準則,增強網絡優化的可解釋性。
自然語言處理領域中的 Transformer 結構的提出是深度學習發展過程中的重要里程碑,為后續深度學習的 進一步發展奠定基礎。2017 年,為 NLP 下游任務中的機器翻譯而提出的 Transformer 模型成為了新的重要創新。其利用多個注意力模塊的組合,讓神經網絡得以利用有限的資源從大量信息中快速篩選出高價值信息,不斷提 取并學習目標對象中更為重要的特征,進而實現性能的提升。后續 OpenAI 和 Google 基于 Transformer 分別提出 了 GPT 和 BERT,提升了諸多自然語言處理下游項目的最優性能。后續 Transformer 強大的特征提取能力被包括 計算機視覺在內的其他人工智能領域廣泛采用,其核心注意力模塊逐漸成為深度學習中不可或缺的部分,大幅 推進了各領域人工智能算法的性能表現。后續人工智能深度學習中的大部分模型框架也都是建立在 Transformer 的基礎上,包括引發熱議的 GPT-3 和 ChatGPT(2.3 節)。至此,深度學習便從最初簡單的感知機算法,簡單 的神經網絡,發展到目前參數量達到數千萬億的龐大而復雜的神經網絡,成為當下人工智能技術、應用、產業 中的主流解決方案。
深度學習這一技術所展現出來的變革世界的潛力超越了過去的科技創新,預計將以前所未有的方式改變世 界的生產生活方式,創造大量的經濟價值。根據 ARK 數據顯示,過去二十年來,互聯網為全球股票市值增加了 13 萬億美元。而截至 2020 年,深度學習已經創造了 2 萬億美元的市值。根據 ARK 測算,深度學習將在未來 15-20 年內,為全球股票市場增加 30 萬億美元的市值。
2.2 計算機視覺:AI 下游最好的應用方向
計算機視覺是“賦予機器自然視覺能力”的學科。實際上,計算機視覺是研究視覺感知問題的學科:視覺 感知是指對“環境表達和理解中,對視覺信息的組織、識別和解釋的過程”。核心問題是研究如何對輸入的圖 像信息進行組織,對物體和場景進行識別,進而對圖像內容給予解釋。更進一步的說,就是指用攝影機和計算 機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖像處理,用計算機處理成為更適合人眼觀 察或傳送給儀器檢測的圖像。從計算機視覺的整理發展歷程上來看,在研究對象的豐富、研究方法的革新、研究數據的完善等過程中不 斷發展。50 年代,主題是二維圖像的分析和識別。60 年代,開創了三維視覺理解為目的的研究。70 年代,出 現課程和明確理論體系。1989 年,Yann LeCun 將一種后向傳播風格學習算法應用于卷積神經網絡結構。在完成 該項目幾年后,LeCun 發布了 LeNet-5——這是第一個引入我們今天仍在使用的一些基本成分的現代網絡。90 年代,特征對象識別開始成為重點。21 世紀初,出現真正擁有標注的高質量數據集。隨后便是 Hinton 提出深度 學習,其學生于 2012 年贏得 ImageNet 大賽,讓 CNN 真正家喻戶曉,也讓深度學習方法計算機視覺研究領域流 行,在應用端實現了百花齊放。
計算機視覺領域中早期的重要算法同時也是深度學習發展中的重要革新(2.1 節),后續計算機視覺在內容 生成、特征提取兩個方面又向前邁出了一大步。2018 年末,英偉達發布的視頻到視頻生成(Video-to-Video synthesis),其通過精心設計的發生器、鑒別器網絡以及時空對抗物鏡,合成高分辨率、照片級真實、時間一致 的視頻,實現了讓 AI 更具物理意識,更強大,并能夠推廣到新的和看不見的更多場景。2019 年,更強大的 GAN, BigGAN 被提出,其擁有更強的學習技巧,由它訓練生成的圖像連它自己都分辨不出真假,被譽為史上最強的 圖像生成器。2020 年,隨著 VIT 的提出,Transformer 開始在計算機視覺領域進行應用,顛覆了傳統的 CNN 結 構,后續 Swim-Transformer 被提出,通過分而治之的思想解決了 Transformer 應用到圖像領域時面臨的:視覺實 體變化大影響不同場景下性能和圖像的高分辨率帶來的高計算量問題,在計算機視覺的多個下游任務中實現了 對 CNN 結構的壓倒性優勢。
隨著計算機視覺算法和技術的不斷成熟,下游應用場景也逐步滲透和拓展。從 2018-2021 獲得投資的計算 機視覺企業來看,其業務領域遍布公安、交通、金融、工業、醫療等各行各業。從核心產品和產業規模來看, 計算機視覺產品技術在泛安防中的應用深受政策及財政支持,多年以來一直是計算機視覺乃至整個國內人工智 能產業實際落地的重要基石。2021 年,國內泛安防領域計算機視覺核心產品市場規模已達到 531 億元,占計算 機視覺總核心產品規模的 70.7%,這一領域的代表公司有商湯科技、海康威視、大華股份;金融領域主要通過 計算機視覺產品技術完成人臉識別、證照識別及行為動作檢測等工作,代表公司有云從科技(人臉識別),格 靈深瞳(行為動作識別);醫療領域中,主要借助計算機視覺技術進行 AI 醫學影像輔助診斷及新型智能醫療器 械開發,代表公司為依圖科技;互聯網領域中,計算機視覺算法技術主要基于 AI 技術開放平臺,通過 API 調用 模式開放給更廣泛的開發者,代表平臺有阿里云(阿里巴巴)、騰訊云(騰訊)、華為云(華為)。工業領域 中,視覺算法被應用在生產過程中的工況監視、成品檢驗、質量控制等方面,主力打造生產制造智能化,主要 代表公司為凌云光(零件生產監測)、奧普特等。隨著計算機視覺相關技術及硬件設施的加速發展與成熟,以 及各行業數字化程度的不斷提升,計算機視覺有望在更多具體場景中創造更大的經濟價值。
從競爭格局上分析,目前中國計算機視覺行業主要分為三大陣營:1)AI 算法公司,多以細分賽道為具體 發力點,提供定制化的解決方案,代表企業為“CV 四小龍”商湯科技、曠視科技、云從科技、依圖科技及格靈 深瞳等;2)互聯網巨頭,借助更完整的產業生態逐步在各個領域進行滲透,代表企業包括阿里巴巴、百度、騰 訊、華為等;3)傳統安防巨頭,在云邊融合的架構下,借助原有的硬件優勢和市場優勢,逐步引入算法,研發 智能化解決方案,代表公司包括海康威視,大華股份等。目前我國計算機視覺市場呈現出市場集中度高的特點, 以“CV 四小龍”為代表的頭部企業已逐漸占據國內 CV 的主要市場份額,2020 年,商湯科技市場份額排名第 一,達到 17.4%;其次為曠視科技,市占率為 15.2%;云從科技及依圖科技分別占比 9.8%、9%。目前 CV 四小 龍等公司憑借算法享有一定的先發優勢,但隨著計算機視覺技術進一步走向具體場景的商業化應用,在場景應 用層面享有更多資源的互聯網巨頭和擁有硬件優勢的傳統安防巨頭也將獲得更大發展機會,未來的核心比拼仍 將是應用端的商業化落地。
2.3 AIGC 成為人工智能新方向,擴散模型引發研究熱潮
AIGC 即 AI-Generated Content,是一種新的內容生產方式。AI 從理解內容,走向了可以生成內容,甚至 能夠創造出獨立價值和獨立視角的內容。事實上,使用計算機生成內容的想法自上個世紀五十年代就已經出現, 早期的嘗試側重通過讓計算機生成照片和音樂來模仿人類的創造力,但是與當今合成媒體不同的是,早期階段 生成的內容很容易與人類創建的內容區分開來。人工智能經歷數十年的重大飛躍,目前使用計算機生成的內容 已經達到高水平的真實感。根據中國信通院劃分,AIGC 經歷了早期萌芽階段(1950s-1990s),沉淀積累階段(1990s-2010s)以及快 速發展階段(2010s-至今)。其中,早期萌芽期受限于科技水平,AIGC 僅限于小范圍實驗,并沒有取得重大 突破,例如通過將計算機程序中的控制變量換成音符完成了歷史上第一支由計算機創作的音樂作品——弦樂四 重奏《依利亞克組曲(Illiac Suite)》,或者世界第一款可人機對話的機器人“伊莉莎”等。沉淀積累階段受益 于深度學習的重大突破,自然語言處理、語音識別等領域開始向實用性轉變,例如此階段誕生了全世界第一部 完全由人工智能創作的小說;微軟推出全自動同聲傳譯系統。快速發展時期,AIGC 迎來百發齊放階段,該階 段人工智能算法可以生成極高質量的圖片、視頻、繪畫作品等。
AIGC 當前快速發展得益于生成模型的飛躍。與用于監督任務的判別模型不同的是,生成模型通過學習某 個樣本生成的概率對新數據進行建模,即判別模型可以識別圖像中的人,而生成模型可以生成一個以前從未存 在過的人的新圖像。生成模型的飛躍是 GAN(生成對抗網絡)的出現,自 GAN 推出后,AI 生成的媒體模型已 經實現了逼真的合成,包括照片級圖像的生成、聲音克隆以及面部識別等。AI 內容創作也已經完成了從文字到 圖畫再到視頻的躍遷。
GAN 網絡包括兩部分,一個生成器和一個判別器。生成器負責生成類似輸入數據的新內容,判別器是將生 成的輸出與真實數據區分開來,這兩個部分在一個 GAN 網絡反饋循環中相互競爭并試圖超越對方,導致生成輸 出的真實性逐漸增加。在 GAN 網絡基礎上有兩個經典的延伸,一個是 StyleGAN,能夠通過將圖像不同部位進 行區分,從而能夠直觀控制生成圖像的細節;另外一個是 in-domain GAN,支持對 GAN 生成圖像進行編輯,從 而可以在現有圖像進出上進行增添元素。除了用于圖像處理上,GAN 網絡也被用于視頻配音、圖像動畫等應用 中。AIGC 中,文本生成領域也得益于 GPT-3 等語言模型的出現而大放異彩,GPT-3 在用于文本處理之外,也 可以用于文本到圖像的生成。
AIGC 已被廣泛用于多種行業,包括娛樂、客戶服務與營銷。例如在移動程序 Reface 中,用戶能夠在視頻 剪輯和 GIF 中換臉以與朋友分享;在 Pinscreen 上創建 AI 虛擬助手,在直播中進行面部替換;甚至于可以在視 頻中生成嘴唇運動模型,從而允許將視頻翻譯成另外一種語言,嘴唇運動和配音之間沒有任何明顯差異。根據 Capterra 調研顯示,雖然只有 33%的營銷人員使用 AIGC,但大多數都對 AIGC 內容質量都感到滿意。
AIGC 領域投資力度空前。AIGC 文字生成領域,負責文字生成的 AIGC 公司彩云小夢、聆心智能獲得了天 使輪融資,Jasper.ai 更是在 A 輪融資階段獲得了 1.25 億美元的融資,估值 15 億美元。AIGC 圖像生成領域,負 責 AI 作畫的初創公司詩云科技先后獲得了天使輪、Pre-A 輪融資,ZMO.AI 獲得了 800 萬美元的 A 輪融資,英 國開源人工智能公司 Stability AI 獲得了 1.01 億美元的融資,目前該公司估值高達 10 億美元,成為了行業獨角 獸。AIGC 視頻生成領域,負責產出視頻的小冰公司 A 輪融資由高瓴資本領投,目前估值超過 10 億美元,Meta 的新產品Make-A-Video也可以直接通過文字生成視頻,谷歌也推出了生成視頻的 AI模型Imagen Video、Phenaki。
擴散模型(Diffusion Model)正引起 AIGC 領域新一波浪潮。生成模型主要包括 GAN(生成對抗網絡)、 VAE(變分自編碼器)、基于流的模型以及擴散模型等。GAN 模型具有對抗性訓練性質,具有潛在的不穩定訓 練和較少的生成多樣性;VAE 依賴于替代損失;基于流的模型必須使用專門的體系結構來構建可逆變換。擴散 模型的靈感來自非平衡熱力學,模型定義了一個擴散步驟的馬爾可夫鏈,在正向擴散過程中,將隨機噪聲添加 到數據中,然后學習反向擴散過程,從噪聲中構建所需的數據樣本。與 VAE 或基于流的模型不同,擴散模型是 通過固定過程學習的,并且潛在變量具有高維性。在 web of science 平臺上,通過關鍵字“diffusion model”在 web of science 核心合集數據庫中按照主題檢索(檢索時間為 2022 年 11 月 30 日),2020 年相關主題論文為 446 篇,2021 年相關論文 456 篇,為近二十年高峰。
擴散模型成為 ICLR 熱門關鍵詞之一。根據人工智能頂級會議 ICLR 2023 發布的評審結果,擴散模型成了 今年ICLR的熱門關鍵詞之一,以擴散模型為研究主題的投稿論文數量出現暴漲。擴散模型引發了席卷式的 AIGC 熱潮,今年 4 月 OpenAI 發布文本生成圖像模型 DALL·E 2,之后谷歌推出 Imagen,直接對標 DALL·E 2,文本 生成圖像領域開始出現激烈競爭。今年 8 月,初創公司 Stability.AI 發布深度學習文生圖模型 Stable Diffusion, 開源后更是一石激起千層浪,后續基于擴散模型的文本生成圖像模型層出不窮,并很快擴展到文本生成視頻、 文本生成 3D、文本生成音頻等。
擴散模型主要包括三個子類別,已應用于各種生成建模任務。第一類擴散模型為 DDPM(去噪擴散概率模 型),DDPM 是一種潛在變量模型,利用潛在變量來估計概率分布,可以看做是一種特殊的 VAE;第二類擴散 模型是 NCSN(噪聲條件評分網絡),通過評分匹配訓練共享神經網絡來估計不同噪聲水平下受擾數據分布的 評分函數;第三類擴散模型是 SDE(隨機微分方程),代表模擬擴散的方式。當前擴散模型已用于各種生成建 模任務,如圖像生成、圖像超分辨率、圖像填充、圖像編輯等領域。未來,擴散模型將在圖像去霧化、視頻異 常檢測、物體檢測、視頻模擬等領域有所突破。
2.4 NLP 發展情況
自然語言處理(natural language processing,NLP)是基于自然語言理解和自然語言生成的信息處理技術, 近些年來,自然語言處理在機器翻譯、智能語言助手、文本自動分類都取得了突破性進展。1950 年,圖靈發表論文“計算機器與智能”,其中提到著名的用于衡量機器智能程度的圖靈測試,可以被 認為是自然語言的開端,自然語言處理的技術發展大致可以分為三個階段:規則—統計—深度學習。20 世紀 50年代到 90 年代,研究人員重點關注語言的規則,從語言學的角度來解析自然語言的規則結構,從而實現自然語 言的處理,但是這個階段還不能處理復雜的語言問題,因而沒有太大的應用價值。20 世紀 90 年代以后,隨著 互聯網的高速發展,語料庫的日益豐富、計算機運行速度的提升以及統計方法的成熟,極大地推動了自然語言 處理技術的發展。
2006 年深度學習算法提出,隨后很快被應用到自然語言處理領域,取得了驚人的成績和廣泛的應用。誕生 了多種神經網絡語言模型,包括多層感知機(MLP)、卷積神經網絡(CNN)、循環神經網絡(RNN)和長短 記憶(LSTM)網絡,但是都存在一定的不足,MLP 難以捕捉局部特征,CNN 難以獲得遠距離特征,RNN 難 以充分利用并行計算加速,LSTM 減少了網絡的層數,相對來說更容易優化。2017 年,采用注意力機制的 Transformer 模型被引入到自然語言處理以后取得了極大的成功。注意力機制 更加關注上下文的相關程度和深層的語義信息,因而 Transformer 模型在長距離建模和訓練速度方面都優于傳統 的神經網絡模型。近年來,在 Transformer 模型的基礎之上,衍生出了 GPT、BERT 等超大規模的動態預訓練語 言模型,除此以外,還有基于 Word2vec 的詞向量方法提出的 ELMo 模型也得到了大規模的應用,ELMo 考慮了 上下文的詞向量表示,較好的解決了多義詞的問題。
GPT 模型是 OpenAI 公司于 2018 年 6 月提出的動態預訓練模型,版本也在不停更新迭代,最新版本 GPT-3 是目前最為強大的預訓練模型之一,于 2020 年 5 月提出。GPT 每代模型的參數數目不斷提升,初始 GPT 版本 只有 1.17 億個參數,GPT-2 參數超過 10 億,GPT-3 參數高達 1750 億,使用了高達 45TB 的訓練樣本。GPT-3 已經商業化落地,基于 GPT-3 產生的 APP 達 300 多個,覆蓋傳媒、營銷等領域,OpenAI 以 API 的形式向開發者提供有償的 GPT-3 模型使用權限,按照 token(1000 tokens=750 words)使用量收費,1000 tokens 收費在 0.0004~0.2 美元之間。BERT 模型由 Goegle 于 2018 年 10 月提出,BERT 使用包含 1.1 億個參數的 BERTBASE 和包含 3.4 億個參數 的 BERTLARGE,在自然語言識別的 SQuAD 測試中,BERT 模型的表現甚至超越了人類。基于 BERT 模型衍生出 了更多具備特定優勢的模型,例如增強長文本理解能力的 XLNet,具備強大文本生成能力的 BART 等。
隨著預訓練語言模型的提出和計算機算力的快速提升,自然語言處理技術已經進入全新的發展階段。預訓 練模型通過無需人工標注的大規模文本庫進行高算力的預先訓練,得到通用的語言模型和表現形式,再經過特 定應用環境對預訓練模型進行微調,從而在各種下游應用領域得到目標任務的快速收斂和準確率提升。各種預 訓練語言模型還在快速的更新迭代,不斷刷新自然語言處理任務的表現記錄,預訓練模型已經在自然語言處理 中得到了廣泛應用。當前自然語言處理技術在某些領域已經可以媲美人類水平,同時具備多種功能應用,包括 文本檢索、信息過濾、機器翻譯、客服問答、文本生成等,在金融、教育、醫療、互聯網行業當中得到了廣泛 的應用,隨著自然語言處理和傳統行業的深度融合,將人力從部分重復性的語言工作當中解放了出來,實現了 人工智能替代。
2022 年 11 月 30 日,OpenAI 發布了 ChatGPT 人機對話交互模型,相比過去的人機對話模型,ChatGPT 展 現出更貼近人類的思維邏輯,可以回復用戶的連續問題,具有一定的道德準則,減少了錯誤問答的出現概率, 具備代碼的編寫和 debug 功能。ChatGPT 在人機對話上到達了前所未有的高度,模型開放測試一周用戶便突破 了百萬級別。ChatGPT 作為 GPT3.5 的微調版本,采用了人類反饋強化學習方式(RLHF)和近端優化策略(PPO), 通過獎勵模型的設定,極大減少了無效的、編造的、有害的答案出現概率,更多輸出了人們期望的答案。當前 ChatGPT 已經在諸多問答環節里表現出極高的擬人化,足以以假亂真。目前 ChatGPT 處于免費的開源公測階段, 仍在優化迭代過程中。我們預計,超大規模的自然語言預處理模型將率先在傳媒營銷、搜索引擎增強、代碼編 程等領域實現商業落地。當前自然語言處理的快速發展已讓我們更加臨近圖靈測試的奇點,未來人工智能將深 刻地改變我們的生產生活方式。我們應當重點關注自然語言處理的技術進展、大規模商業的落地途徑以及我國 超大規模預訓練模型的發展進展。
3.1 自動駕駛:技術不斷突破,滲透率不斷提升
3.1.1 自動駕駛技術不斷突破,Transformer 模型應用進一步提升準確率
視覺 Transformer 正推動自動駕駛向前邁進。自動駕駛初期階段,主要目標是讓汽車在單車道內行駛,隨 著駕駛復雜性,需要對路況進行影像提取與 3D 建模等。特斯拉自動駕駛算法使用的是多任務學習 HydraNets 架構,從而讓汽車共享相同神經網絡或特征提取器的 同時能進行交通燈檢測、車輛避讓等多項任務。特斯拉自動駕駛算法中,首先讓車載攝像頭使用 RegNet(殘差網絡)對路況/汽車進行原始圖像提取。在每個攝像頭都處理完單個圖像后,使用具有多頭自注意力的 Transformer 模型進行處理,Transformer 模型不僅解決了 CNN 算法在 BEV(鳥瞰圖)遮擋區域預測問題,同 時還有更高的性能和算法準確度。后續將處理結果進行多尺度特征、視頻神經網絡等處理,從而完成整個自動 駕駛算法。近年來 Transformer 憑借傳統 CNN 算法所不能企及的感知能力以及其優秀的魯棒性和泛化性,已 逐步取代 IPM、Lift-splat、MLP 成為 BEV(鳥瞰圖)感知領域的主流算法。
特斯拉中的 Transformer 模型側重于使用交叉注意力。根據特斯拉 2021 人工智能日,特斯拉 Transformer 算法主要原理為:首先初始化一個輸出空間大小的柵格,在輸出空間中利用正弦和余弦的位置編碼進行填充, 用多層感知機將其編碼成一組查詢向量。所有的圖像及其特征均生成屬于自己的鍵和值。最后將鍵和值查詢輸 入到注意力中。我們認為 Transformer 模型因其注意力機制解決了 CNN 中卷積層遮擋區域檢測問題,成為了自動駕駛領 域的首選,交叉注意力機制目前也更有利于 Transformer 模型在汽車上進行部署,Transformer 模型正推動自 動駕駛技術實現飛躍式的迭代。2022 年 6 月 2 日,馬斯克發布推特稱,Transformer 正在取代 C 啟發式算法去處 理視覺神經網絡中大量的節點,特斯拉全自動駕駛正在使用運行在 TRIP 芯片上的 GPT 算法實現計算機視覺。根據特斯拉 2022AI 開放日,特斯拉全自動駕駛(Full Self Driving(beta))客戶已從 2021 年的 2000 個增長到 2022 年的 16000 個。
2022 年 11 月 24 日,馬斯克發布推特稱,特斯拉全自動駕駛(Full Self Driving(beta))已經可以提供給 北美任何一個購買相關服務的車主使用,成為特斯拉 Autopilot/AI 團隊一個重要里程碑。在特斯拉的引領下, 自動駕駛功能滲透率將不斷提升,其中智能駕駛域控制器率先放量。
3.1.2 智能駕駛滲透率繼續提升,L3 車型開始落地
深圳發布《深圳經濟特區智能網聯汽車管理條例》,自動駕駛政策放開臨近。近些年來,為了支持自動駕 駛等智能汽車行業的發展,我國政府陸續發布了許多政策。例如,2018 年工信部發布《車聯網(智能網聯汽車) 產業發展行動計劃》,指出要加快建設智能網聯汽車制造業創新中心,促進產業鏈上下游及與相關行業之間的 融合。2022 年 11 月,工信部發布《關于開展智能網聯汽車準入和上路通行試點工作的通知(征求意見稿)》,將 在全國智能網聯汽車道路測試與示范應用工作基礎上,選出符合條件的企業和智能網聯汽車產品,開展準入試 點,其中智能網聯汽車搭載的自動駕駛功能為 L3 和 L4 級。2022 年 6 月,深圳市發布《深圳經濟特區智能網 聯汽車管理條例》,這是國內首部關于智能網聯汽車管理的法規,對智能網聯汽車的準入登記、上路行駛等事 項做出具體規定。北京、上海、重慶、四川等多地也均發布相關支持政策。
L2 級別自動駕駛前裝滲透率不斷提升。根據上險量數據,2022 年 10 月我國智能汽車銷量 39.73 萬輛,同比增長 68.1%,滲透率為 24.78%。在 2022 年世界智能網聯汽車大會上,工信部副部長辛國斌介紹,今年上半年 具備組合駕駛輔助功能的乘用車銷量達 288 萬輛,滲透率升至 32.4%,同比增長 46.2%。國內自動駕駛正進入發 展快車道。根據高工智能研究院數據,截至 2022 年 9 月,我國前向 L2 級 ADAS 前裝滲透率已達 27.7%,2019-2021 年該數據分別為 2%、12%、19.4%。未來國內自動駕駛級別將從 L2 向 L3/L4 轉換,例如上海市發布《上海市 加快智能網聯汽車創新發展實施方案》指出,到 2025 年,上海市初步建成國內領先的智能網聯汽車創新發展體 系,產業規模力爭達到 5000 億元,具備組合駕駛輔助功能(L2 級)和有條件自動駕駛功能(L3 級)汽車占新 車生產比例超過 70%,具備高度自動駕駛功能(L4 級及以上)汽車在限定區域和特定場景實現商業化應用。
2023 年新出自動駕駛車型中 L2 依舊為主流,L3/L4 開始落地。2023 年多家車廠推出 L3 級別自動駕駛汽 車,從半自動駕駛階段跨越至特定場景中完全自動駕駛階段。例如現代汽車將在 2023 年推出包括捷尼賽思 G90 和起亞 EV9 在內的多款 L3 級別自動駕駛汽車;寶馬 L3 自動駕駛系統“Personal Pilot”將在 2023 年底推出,并將 在寶馬 7 系列上使用;小米純電汽車搭載 L3 級別自動駕駛系統,目前正處于測試階段,預計 2024 年上半年量 產;奇瑞與華為將合作在 2023 年推出搭載 L3 級別自動駕駛系統的 E03 與 E0Y。部分自動駕駛汽車車廠直接跳 過 L3,直接從 L2 邁向 L4 級別。例如通用公司旗下的 Cruise 支持 L4 級別駕駛,推出 Origin 車型;百度發布 Apollo RT6,支持 L4 級別自動駕駛,并將于 2023 年開始試運營。
3.2 FPGA:高成長、高壁壘的優質賽道,看好 FPGA 芯片國產替代
3.2.1 FPGA:時延低、單位能耗比低、并行運算更高效的可編程芯片,中國市場快速增長
FPGA 的全稱為 Field-Programmable Gate Array,即現場可編程門陣列。主要由可編程的邏輯單元(LC)、 輸入輸出單元(IO)和開關連線陣列(SB)三個部分構成。可編程邏輯單元通過數據查找表 LUT 中存放的二進制數 據來實現不同的電路功能,開關陣列通過內部 MOS 管的開關控制信號連線的走向。
FPGA 的無指令特征,使其具有時延低、單位能耗比低、并行運算更高效三大特征。1.時延低:因無指令 的特征,所有程序都自存儲器讀取結果,不需要像 CPU 一樣進行程序編譯等過程,因此算法運行時間遠小于 CPU 和 GPU,適用于時延要求高的領域。2.單位能耗比低:無指令特征下,節省了編碼、譯碼等過程,因此能 耗比更低。3.并行運算更高效:因無指令特征,FPGA 可以做到異步的并行,如果說 GPU 的計算是 1 名指揮員 協調 10 條生產線,ASIC/FPGA 就是由 10 名指揮員分別指揮自己的生產線。因此在執行并行運算的時候(AI 領域),與 CPU、GPU 相比,FPGA 具有更高的速度和極低的計算能耗,使深度學習實時計算更容易在端側執 行。
FPGA 的最大特點是可編程特性。邏輯單元、開關陣列可編程,使得 FPGA 功能可以隨時改變,從而具有 可編程特性。FPGA 基于的是查找表技術,任何邏輯都儲存在 SRAM 電路中,而 SRAM 電路是易失性存儲器, 斷電后數據則不被保存,因此 FPGA 通過改寫 SRAM 中的數據表以及開關陣列,即可實現不同功能。
全球市場快速增長:根據 Frost&Sullivan 數據,2019 年全球 FPGA 芯片產業規模約為 56.8 億美元,2016-2019 年復合增速為 9.38%。隨著全球新一代通信設備部署以及人工智能與自動駕駛技術等新興市場領域需求的不斷 增長,FPGA 市場規模預計將持續提高。中國市場增速快于全球市場:根據 Frost&Sullivan 數據,中國 FPGA 市場從 2016 年的約 65.5 億元增長至 2019 年的 129.6 億元,復合增速為 25.48%。
工業、汽車電子、數據中心成為 FPGA 增長最快的細分市場。FPGA 芯片因其現場可編程的靈活性和不斷 提升的電路性能,擁有豐富的下游應用領域,包括網絡通信、工業控制、消費電子、數據中心、汽車電子等。2020 年中國 FPGA 市場下游應用中,通信領域和工業控制占比最高,分別達到 41%和 32%。隨著智能汽車、 AI 推理的不斷滲透,汽車電子、數據中心、工業成為 FPGA 增長最快的細分市場,預計 2022-2025 年汽車 FPGA 市場復合增長率將達到 13.3%,數據中心 FPGA 市場復合增長率將達到 12.7%,除此之外,工業視覺也有較快 的增長。
海外龍頭 AMD 和 Intel 的 FPGA 產品價格上漲,凸顯行業景氣度。根據國際電子商情的消息,由于疫情 沖擊、供需情況緊張和產品成本上漲,AMD 將從 2023 年 1 月 9 日起對旗下 Xilinx 品牌的 FPGA 產品進行漲價, 其中 Spartan 6 系列漲價 25%,Versal 系列不漲價,其他 Xilinx 產品全部漲價 8%。此外 Xilinx 產品的產能也受 到影響,產品的交貨周期存在不同程度的延長,16nm UltraScale+系列、20nm UltraScale 系列、28nm 7 系列都需 要 20 周,預計到 2023 年第二季度末才能緩解交付壓力。剩余 Xilinx 成熟節點產品的標準交貨周期持續到 2023 年第一季度末。2022 年 7 月底,Intel 也通知其 FPGA 產品從 2022 年 10 月 9 日起全線漲價,其中 Arria V、Arria 10、Cyclone IV、Cyclone V、Cyclone 10、MAX V、MAX 10、eASIC 等新款漲價 10%,Arria II、 Cyclone II、 Cyclone III、MAX II、Stratix III、Stratix IV、Stratix V、EPCQ-A 等舊型號產品漲價 20%。兩家海外龍頭的漲價 主要集中在舊產品和中低端市場,屬于國產替代的可覆蓋范圍。海外 FPGA 產品的漲價將提高國內公司的使用 成本,從而推動國產替代的節奏。
全球 FPGA 公司均呈現快速增長,:1)AMD:全球第一大 FPGA 公司 Xilinx 于 2020 年以 350 億美元的 價格被 AMD 收購,該交易于 2022 年 2 月 14 日完成。去掉原本屬于 AMD 嵌入式芯片業務合并報表因素影響, 2022 Q2 和 Q3 的 AMD 的 FPGA 業務營收達到 12.01 億美元和 12.62 億美元,與對應的 Xilinx 財年數據比較, 同比增長 36.63%和 34.83%;2)Intel FPGA 業務預計今年增速達 26%,持續推出新產品,行業成長空間廣闊。2022 英特爾 FPGA 中國技術周上,公司預計今年 FPGA 業務收入超 24 億美金,同比去年 19 億美金增長 26%,是過去五年來增速最快的一年;3)Lattice 營收近五年持續增長,2021 年后增速加快,主要增長點為工業和汽 車、通信與計算兩大板塊。2021 年收入 5.15 億美元,同比增長 26.3%,2022 年前三季度收入 4.8 億美元,同比 增長 29.8%,增速進一步加快。工業和汽車主要用于工業自動化和機器人、ADAS 和信息娛樂應用,在 2021 年 收入 2.26 億美金,同比增長 34.4%。2022Q1-Q3 收入 2.3 億美元,同比增長 38.6%,是增速和占比最大的一塊。通信和計算主要用于數據中心服務器、客戶端計算和 5G 基礎設施,在 2021 年收入 2.18 億美元,同比增長 24.8%。2022Q1-Q3 收入 2.05 億美元,同比增長 29.7%。消費和許可與服務業務開始增長,在 2021 年分別同比增長 11.3% 和 4.4%。FPGA:高成長、高壁壘的優質賽道:隨著架構、先進制程的迭代,FPGA 從傳統通信密集領域的應用拓展 到了計算密集領域,包括 AI、邊緣計算、自動駕駛等新領域的應用,整個行業打開了新的成長空間。
3.2.2 FPGA 呈現寡頭壟斷市場格局,國產替代空間大
全球 FPGA 市場呈現寡頭壟斷格局:從全球 FPGA 市場競爭格局來看,相關市場目前基本由龍頭企業把控, Xilinx 和 Intel 占比達到 80%,目前中國廠商在全球市場中所占份額較低。中國 FPGA 市場由賽靈思(Xilinx)和英特爾(Intel)兩家供應商主導,兩家公司在中國的市場份額超過 70%。目前本土供應商也占據了一定市場份額,2021 年在中國的總份額超過 15%,隨著國產化的推進,國內市場具有 廣闊的提升空間。
美國限制國內 AI 芯片發展,FPGA 最大下游通信領域頻受制裁:2022 年 10 月 7 日,拜登政府宣布了一項 關于人工智能(AI)和半導體技術對中國的新出口管制政策。此外,部分公司也受到制裁。以華為為例,美國 政府禁止華為購買美國元器件和軟件。通信是 FPGA 最大的下游市場,在中國市場中占比超過 40%,華為是全 球第一大通信設備商,2021 年占全球通信設備市場 28.7%的份額,是通信 FPGA 主要需求方,以華為為主的這 些受到制裁的大客戶無法或受限制使用國外 FPGA。信創快速推進,FPGA 將受益于信創發展:自 2021 年以來,繼黨政信創展開后,包括三大運營商及金融機 構持續展開國產化服務器集采,表明信創產業正在不斷向行業延伸。信創產業龐大,其中芯片、整機、操作系 統、數據庫、中間件是重要的產業鏈環節。2022 年下半年開始信創將繼續快速推進,整體大趨勢已經形成。FPGA 作為重要的計算芯片,服務器中將其應用于后端的通信板卡。同時,FPGA 是電力、交通領域重要的通信部件, 在銀行系統中應用于企業級交換機路由器,在云計算中也起到運算加速作用。
3.3 AI+工業:助力制造業轉型升級,看好國產替代機會
我們認為,在人工智能和工業制造的結合過程中,應當重點關注工業機器視覺、工業互聯網和 EDA。
3.3.1 工業機器視覺助力制造業轉型升級,技術突破加速國產替代
根據美國自動化協會定義:機器視覺是光學、機械、電子、計算、軟件等技術一體化的工業應用系統,其 利用相機和計算機代替人的視覺感知和判斷能力,自動采集并分析圖象,以獲取用于控制或評估特定活動所需 的數據。主要由成像、信號分析與處理、決策與執行三個關鍵環節構成。功能上具體可以分為識別、測量、定 位和檢測四種。
在工業應用場景中,機器視覺相比人眼視覺在識別精確度、識別速度、環境要求、識別客觀性、可靠性、 工作效率、數據價值方面均存在顯著優勢,能夠較好的替代人工進行工作。隨著深度學習、3D 視覺技術、高精 度成像技術和機器視覺互聯互通等技術的持續發展,機器視覺的性能優勢將進一步擴大,應用場景也將持續拓 展。同時,在人力成本日益增長的背景下,機器視覺在成本端上也具有明顯優勢,機器視覺也將助力企業實現 降本增收。此外,通過機器視覺設備可以收集生產過程中的各種數據,進而推動工業互聯網的發展進程。
工業機器視覺產業鏈上游為零部件及軟件算法,是產業鏈中價值較高的部分,中游為視覺裝備及方案,下 游為具體的應用場景與行業。上游零部件主要包括光源(及其控制器)、工業鏡頭、工業相機及機器視覺軟件 算法。根據華經產業研究院數據,零部件及軟件算法為機器視覺系統主要的成本來源,占比之和達到 80%。組 裝集成和維護占比較少,分別占 15%和 5%。
隨我國工業制造轉型升級和數字化不斷推進,工業機器視覺產業市場規模增長迅速。GGII 數據顯示,2021 年中國機器視覺市場規模 138.16 億元(未包含自動化集成設備規模),同比增長 46.79%。其中,2D 與 3D 視 覺市場規模分別為 126.65 億、11.51 億元。出于宏觀經濟回暖、新基建投資增加、制造業自動化等推進因素, 根據 GGII 預測,2022 至 2025 年,中國機器視覺市場規模同比增速維持在 30%-40%之間,至 2025 年我國機器 視覺市場規模將達到 468.74 億元,市場潛力巨大。下游應用領域上,GGII 數據顯示,3C 電子行業是工業機器 視覺應用最多的下游領域;半導體、汽車、鋰電池、食品飲料、物流倉儲等行業亦為主要應用領域。
國產工業機器視覺企業在各自領域不斷發展成熟,逐步實現國產替代。機器視覺海外龍頭康耐視、基恩士 均有較為完整的產業鏈布局,且技術實力領先,國產廠商則有所側重,如精測電子和華興源創主營視覺設備、 奧普特從光源等核心硬件拓展核心零部件完整布局、凌云光基于軟件算法能力發展可配置視覺系統、視覺設備 業務。隨著技術的不斷成熟,國產廠商已在行業的細分領域中打破國外企業壟斷,例如奧普特已成為光源的龍 頭企業,天準科技、矩子科技、凌云光已成為視覺系統及裝備的頭部廠商。整體上看,根據 GGII 數據顯示,2021 年國產品牌機器視覺市場份額占比 58.43%,國產滲透率逐步提升。隨著新能源、汽車電子及半導體等下游行業 的擴產加速,工業機器視覺的國產化替代進程將進一步提速。
3.3.2 全球 EDA 行業呈現寡頭壟斷格局,國產廠商迎來發展機遇期
EDA 板塊:增速穩定、高壁壘、高估值板塊。1)增速穩定:EDA 公司商業模式大多數為按年付費,一般 收費在 IC 設計公司收入的 1%-3%之間,占 IC 公司收入比重較低,并且 EDA 公司議價權較高,因此對于成熟 穩定的客戶,每年給 EDA 公司付費基本穩定或者略有增長,商業模式和高壁壘決定了 EDA 公司受下游需求波 動影響較小。EDA 行業增長一是受益于 IC 設計門檻降低,IC 公司數量越來越多,二是 IC 品類不斷拓張,比如 第三代半導體的出現,三是伴隨著先進制程迭代,產品復雜度提高帶來的單價提升。加上盜版等因素的存在, 實際上有部分需求并未體現在 EDA 公司收入中,通過盜版的不斷轉化,EDA 龍頭公司中長期均保持穩定增長。2)高壁壘;技術壁壘本身較高,需要強大的數學物理基礎理論支撐,對算法要求很高。同時用戶協同壁壘較高, 制造、設計、EDA 廠商三方形成穩定的生態圈,新進入者極難打破。因此,高壁壘以及良好的業務穩定性和成 長性,使得 EDA 公司如新思科技、Cadence 在美股半導體板塊中估值一直相對較高。
EDA 行業保持穩定增長,國內增速更快。根據賽迪數據,2020 年全球 EDA 行業實現總銷售額 72.3 億美元, 同比增長 10.7%。預計至 2024 年,全球市場規模有望達到 105 億美元,2020-2024 年復合年均增長率為 7.8%。2020 年國內 EDA 市場規模為 66.2 億,預計至 2024 年,我國 EDA 工具市場規模有望達到 115 億元人民幣,2020 至 2024 年的市場規模符合年均增長率近 17%。
EDA 結合人工智能是趨勢。EDA 問題具有高維度、不連續、非線性和高階交互的特性,機器學習等算法 能夠顯著提高 EDA 的自主程度,提升 IC 設計效率,縮短研發周期。人工智能賦能 EDA 主要從 Inside 和 Outside 兩方面實現,從 Inside 方面,通過機器學習對 DRC、能耗、時序等預測,在參數模型建立過程中實現參數的優 化,同時實現更高效的物理空間設計。Outside 方面,通過機器學習方式,減少人工干預,極大釋放勞動力。
EDA巨頭積極進行人工智能與芯片設計的深度融合。EDA巨頭Cadence發布了內嵌人工智能算法的Innovus, Project Virtus,Signoff Timing 等工具,實現了全流程數字化智能化。Mentor 通過機器學習 OPC 將光學鄰近效應 修正(OPC)輸出預測精度提升到納米級,同時將執行時間縮短 3 倍。Synopsys 推出業界首個用于芯片設計的自 主人工智能應用程序——DSO.aiTM。國產 EDA 產商迎來新戰略機遇期。目前全球 EDA 工具上大約有近百家,排名前三的公司分別是新思科技 (Synopsys)、鏗騰電子(cadence)和明導(Mentor),三家巨頭占據著全球近 7 成左右的市場份額,在中國 的市占率更是超過 95%。2022 年 8 月生效的《2022 芯片與科學法案》對 EDA 軟件進行了出口管制,芯片核心 技術自主可控勢在必行,國產 EDA 廠商迎來重要的發展機遇。
(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)
文章轉發自未來智庫微信公眾號,版權歸其所有。文章內容不代表本站立場和任何投資暗示。
Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM