中咨視界
趙穎君 | 我國發展人工智能面臨三方面挑戰及其建議
| |||||
| |||||
人工智能(AI)的發展已達60余年,涉及范圍非常廣泛,擁有比一般科技領域更復雜、更豐富的內涵?,F階段人工智能技術研究將圍繞算法、框架軟件、芯片三個方面。未來十年是人工智能產業發展的重要時期,也是人工智能芯片技術突破的關鍵時期,遠期人工智能技術的發展路徑將會沿著算法、算力兩條主線向前發展,并逐步帶領人類進入到人機協同時代。發展人工智能的最終目標并不是要替代人類智能,而是要與人類智能形成互補,使得人類從繁重的重復性工作中解放出來,從而專注于推動人類自身文明的進步。 一、我國發展人工智能面臨三方面挑戰 我國發展人工智能當前面臨的挑戰主要在AI算法、AI框架軟件及AI芯片三個方面,詳細論述如下。 (一)AI算法 人工智能技術常見的算法技術有決策樹、隨機森林、邏輯回歸、支持向量機、樸素貝葉斯算法等,國內各大高校團隊一直有深入研究,但是在科研成果轉化領域一直發展緩慢,難點在于如何將算法和實際工程應用結合,實現技術向生產力的轉化。目前以華為、阿里、騰訊等公司主導的技術研發團隊,將自身應用和算法技術結合,從產業領域實現算法的技術成果轉化。 底層數學庫的研究一直屬于冷門行業,一方面因為技術成果轉化不易,另一方面因為研究領域狹窄,國內僅有少數科研團隊專注于此。企業領域,主要是嘗試從底層硬件開發角度,通過優化數學庫實現硬件效率最優化的方式進行研究,如美國NVIDIA公司開發了cuDNN的深度學習庫,是專門針對其CUDA GPU的優化,但是并沒有對大規模機器學習場景中分布式并行的支持。美國IBM (PML)和Intel (DistML)在前些年均開發了機器學習/深度學習相關框架、庫和工具集,但均限內部使用或者是簡單版本的開源。Databricks公司以Spark為核心開發支持機群學習相關的庫?;陂_源軟件Caffe擴展了基于MPI的分布式并行實現。從面向市場的產品角度看,這些目前還處于研制階段,性能和穩定性改善空間潛力巨大。 算法領域的技術突破,我國科研機構和企業的關注點是不一樣的??蒲蓄I域針對目前的已有算法進行深度優化,實現更好的處理效果,或者另辟蹊徑,對原有算法進行脫胎換骨。而企業則更多立足于產業發展需要,將成熟的算法應用到實際的工程項目中,實現人工智能產業化。 (二)AI框架軟件 國內的AI框架軟件逐漸起步,也開始擁抱開源,并正在培育自己的生態環境??蚣苘浖侨斯ぶ悄苌鷳B中最重要的因素之一,我國需要促進國產自研框架軟件的發展和推廣,擺脫國外的軟件生態標準制約。國產AI框架軟件需要和國產AI芯片及硬件進行相互適配、性能優化和應用推廣,能夠形成面向行業應用的軟硬件一體化平臺,促進這種融合技術在各行業的產業推廣。 1.AI框架軟件 AI框架軟件是相關算法、庫、工具的集合。AI框架軟件的出現降低了使用門檻,開發人員借助計算框架,不需要從復雜的神經網絡開始編寫代碼,可以依據需要,使用已有的模型,快速實現應用。框架軟件提供了一系列的機器學習、深度學習組件,其中,通用的AI算法已集成實現,若需要使用新的算法可根據自己的需求去定義,然后調用深度學習框架的函數接口使用戶自定義的新算法。隨著這些開源框架在全球范圍內的廣泛使用,互聯網巨頭開始逐漸掌控了人工智能的應用生態,形成了幾乎所有的AI芯片、系統、平臺都需要與這些主流框架適配的局面。AI算法的生產與程序生產不同,是一個系統工程,需要能夠協同優化數據、算法、算力的平臺級產品。深度學習對算力有較高需求,因此相繼出現了一些專門的計算框架軟件和平臺,如谷歌的TensorFlow、伯克利大學的Caffe、Facebook的PyTorch(基于Torch推出)、微軟的CNTK、亞馬遜的MXNet、百度的PaddlePaddle等。 2.國內AI框架軟件主要研發廠商 國內人工智能產業也是大面積采用國外研發的這些框架軟件,自研的AI框架軟件相對比較小眾,主要集中在從事AI算法研究比較早的幾個公司內部使用,但是隨著技術進步,逐漸開始進入實用環節,并開源發布。國內比較知名的幾個框架軟件的情況如下。 百度飛槳PaddlePaddle:是國內開發較為完善的AI計算框架,是集深度學習核心框架、基礎模型庫、端到端開發套件、工具組件和服務平臺于一體的開源深度學習平臺。目前百度有超過30個主要產品都在使用 PaddlePaddle,從市場接受程度判斷,目前還處于起步階段,使用群體相對較少,還需要加大研發投入和市場培養。 曠視Brain++:擁有自主研發深度學習框架,自主研發的AI算法平臺Brain++作為統一的底層架構,為算法訓練及模型改進過程提供重要支持。在算法開發方面,曠視自研開源深度學習框架MegEngine(Brain++核心組件之一),Brain++幫助曠視構建了一條不斷自我改進、不斷更加自動化的算法生產線,并能夠針對不同垂直領域的碎片化需求定制豐富且不斷增長的算法組合。 商湯Parrots:是一個訓練框架,核心是一個動態的編譯與調度引擎,商湯Parrots采用動態實時編譯技術,所有代碼都是在運行過程當中即時編譯,并且放到計算芯片或引擎上大規模地并行執行。具備了傳統靜態深度網絡的伸縮性,以及當代動態編程模型的靈活性,達到了這兩者的最佳結合。 華為MindSpore:計算框架已經正式開源。MindSpore原生適應每個場景包括端、邊緣和云。通過MindSpore自身的技術創新及MindSpore與華為昇騰AI芯片的協同優化,實現運行態的高效,大大提高了計算性能。 (三)AI芯片 早在上世紀80年代,學術界就提出了相當完善的AI算法模型,但直到近些年,模型的內在價值也沒有被真正實現過,這主要是受限于硬件水平難以提供可以支撐深度神經網絡訓練/推理過程所需要的算力。AI芯片的出現顯著提高了數據處理速度,尤其在處理海量數據時明顯優于傳統CPU。一般將AI芯片定義為“專門針對AI算法做了特殊加速設計的芯片”,根據技術體系結構,主要分為GPU、FPGA、ASIC和類腦芯片四大類。AI芯片在邊緣計算中是提供算力的靈魂和大腦,承載了為各種終端提供強大算力的重要任務,直到近年,GPU、FPGA、ASIC等AI芯片被投入到相關領域應用,才解決了算力不足的問題。 1.基于技術架構分類的AI芯片 (1)GPU GPU(Graphics Processing Unit,圖形處理器),是利用處理圖形任務的圖形處理器來計算原本由中央處理器處理的通用計算任務。GPU經過多年的生態發展,已經對機器學習、深度學習類應用具有良好的兼容性,通用性強、精度支持靈活、性能出眾。GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純凈的計算環境。GPU的關鍵性能是并行計算,主流的GPU具有強大的計算能力和內存帶寬,無論性能還是內存帶寬,均遠大于同代的CPU。CPU 由專為順序串行處理而優化的幾個核心組成,而 GPU 則擁有一個由數以千計的更小、更高效的核心(專為同時處理多重任務而設計)組成的大規模并行計算架構。同時CPU相當一部分時間在執行外設的中斷、進程的切換等任務,而GPU有更多的時間并行計算。 (2)FPGA FPGA(Field Programma-ble Gate Array,現場可編程門陣列),作為一種半定制電路,含有數字管理模塊、內嵌式單元、輸出單元以及輸入單元等,對于特定運算,可以通過編程重組電路,直接生成專用電路,用戶可以通過 FPGA 配置文件來實現應用場景的高度定制,可同時進行數據并行和任務并行計算,進而實現高性能、低功耗。FPGA一次性成本遠低于ASIC,在芯片需求還未成規模、深度學習算法暫未穩定,仍需不斷迭代改進的情況下,利用FPGA具有可重構的特性來實現半定制的AI芯片是最佳選擇之一。FPGA可以面向前端推理場景靈活設定功能,目前在人工智能推理市場應用廣泛。 (3)ASIC ASIC(Application Specific Integrated Circuits,專用集成電路),是指應特定用戶要求和特定電子系統的需要而設計、制造的集成電路。ASIC芯片可以面向一些成熟或特定的深度學習算法,定制電路和專用指令集,使效率和能效比達到最優。當前ASIC芯片主要面向人工智能推理應用場景。針對特定用戶場景使用FPGA 進行研發,當算法成熟、芯片設計固定后再以ASIC 的方式進行大規模生產,針對適用應用場景,ASIC的性能和能耗都要優于市場上的現有芯片,包括 FPGA 和 GPU。 TPU(張量處理單元,Tensor Processing Units),是一種定制化的ASIC芯片,TPU的單片存儲器容量是NVIDIA K80 GPU的3.5倍,但是它的體積相對更小。谷歌TPU已為谷歌的主要產品提供了計算支持,第一代 TPU 僅能用于推理,而目前發布的 TPU2.0 既可以用于推理,又可以用于訓練神經網絡。 (4)類腦芯片 類腦芯片(Brain-Inspired Chip),可模擬人類大腦信息處理方式,能以極低的功耗對信息進行異步、并行、低速和分布式處理,并具備自主感知、識別和學習等多種能力,使之能夠在推理、決策、記憶等方面達到類人智能水平。類腦芯片把數字處理器當作神經元,把內存作為突觸,跟傳統馮諾依曼結構不一樣,它的內存、CPU和通信部件是完全集成在一起。因此信息的處理完全在本地進行,而且由于本地處理的數據量并不大,傳統計算機內存與CPU之間的瓶頸不復存在。 類腦智能借鑒大腦中“內存與計算單元合一”等信息處理的基本規律,在硬件實現與軟件算法等多個層面,對于現有的計算體系與系統做出本質的變革,并實現在計算能耗、計算能力與計算效率等方面的大幅改進。IBM已經開始進行顛覆馮·諾依曼體系結構的類腦智能算法與技術的探索,并已成功研制出TrueNorth芯片。 2.AI芯片特征對照及國內外主要研制廠商 不同類型的芯片在通用性、應用兼容性、編程難度、性能、能效比等方面具有各自的優缺點,適用于訓練、推理等不同的應用場景。不同類型AI芯片的特征和優缺點如表1所示。 表1 不同類型AI芯片的特征和優缺點 當前,AI芯片的核心技術和市場被美國廠商壟斷,雖然國內一些廠商也在進行AI芯片研制,但無論是技術成熟度還是市場占有率等方面,與國際巨頭的差距仍然非常明顯。AI芯片國內外主要研制廠商如表2所示。 表2 AI芯片國內外主要研制廠商 GPU:憑借GPU在當前人工智能市場的主導地位,NVIDIA在AI芯片市場一家獨大。AMD新發布的GPU產品已經實現了對主流AI框架軟件的良好支持,上升勢頭明顯。Intel也正在進行GPU研發。在國內,目前海光公司正在按進度推進類GPU(DPU)芯片研制,目前已經取得階段性進展。 FPGA:市場份額排名第二的AI芯片FPGA,當前完全被美國的兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達90%。目前國內從事FPGA芯片研發的廠商有紫光同創(Titan)、復旦微電子等企業,其FPGA產品相比美國廠商落后一代,且產品性能只能達到國外品牌上一代同系列產品的中高端水平,尚不具備可抗衡實力。 ASIC:國內多采用ASIC芯片架構進行創新,ASIC芯片相比國外廠商差距相對較小,特別是在芯片本身的性能和能效比方面,而在高性能 GPU 和 FPGA 芯片領域研發相對滯后。如寒武紀等的ASIC芯片已形成了量產產品。但相比國外巨頭仍然存在一些先天差距,如Google研制的TPU,可以和自己研發并開源的主流深度學習框架Tensor Flow進行深入整合和優化,有軟件生態的加持,將具有更好的生存優勢。 二、我國發展人工智能的三個建議 (一)打造我國人工智能軟硬件產業生態 PC時代的Wintel體系(微軟+Intel),以及移動終端時代的AA體系(ARM + Android),都是通過打造完整的產業生態來把控產業的主導權,并且處于絕對的行業壟斷地位。人工智能產業屬于新型領域,目前尚未形成絕對主導的技術路徑依賴,產業生態也沒有形成絕對的壁壘,軟硬件協同優化已成為提升技術的主要手段,單純的數據與算法優化已不能滿足產業發展需求。 面對這一發展契機,我國應強化人工智能產業發展頂層設計,加強人工智能軟硬件協同布局,如,鼓勵百度飛槳Paddle Paddle、曠視、商湯Parrots、華為Mind Spore等軟件框架企業,與寒武紀(MLU)、華為(昇騰)、阿里(含光)、中星微(NPU)、比特大陸(算豐)、地平線、百度(昆侖)、海光(DPU)、紫光同創(Titan)、復旦微電子等AI芯片企業強強聯合,重點布局我國自主知識產權的“框架軟件+AI芯片”的人工智能生態體系,力爭五年內在人工智能領域占據主導優勢。 (二)采取全面布局、分步突破的芯片發展路徑 AI芯片的核心技術和市場均處于被美國廠商壟斷的狀態,雖然國內一些廠商也在進行AI芯片研制,但無論是技術成熟度還是市場占有率方面,與國際巨頭的差距仍然非常明顯。目前來看我國GPU及FPGA基本完全依賴進口。GPU方面全球70%的市場都被NVIDIA占據。FPGA呈現寡頭壟斷的競爭格局,美國兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達到90%。三款AI芯片總體來看,ASIC國產化程度相對較好。 因此,現階段針對我國AI芯片的現實情況,可采取全面布局、分步突破的發展路徑,近期重點突破專用芯片ASIC,遠期依次突破GPU、FPGA等通用芯片。由于ASIC專用性較強,不同廠商往往會根據特定的應用場景需求進行有針對性的研發,而GPU、FPGA等通用芯片由于目前國外有較為成熟的標準化產品,國內廠商自主研發或國產化替代的意愿并不強烈。因此從產業布局角度來看,政府應加大力度助力有條件有意愿的企業,在GPU、FPGA等通用芯片研制方面投入精力實現分步突破。 (三)加強類腦芯片等前沿領域的布局 類腦芯片研發領域屬于前瞻性領域,目前企業在此方面并不會過多涉及,因此應充分發揮國內高校以及科研院所力量進行充分布局。目前,IBM研制的TrueNorth芯片作為類腦計算領域的突破性進展,極大地推進了人工智能的發展,但類腦計算仍存在很大的發展空間。隨著存儲、邏輯、傳感技術的改進,將來類腦計算芯片有望達到更低能耗、更緊湊結構和更快速度。 我國針對類腦芯片的研究尚處于理論階段,國際龍頭企業還沒有形成明確的技術及知識產權壁壘,因此全球科技產業巨頭都在積極推動人工智能技術生態的研發布局,全力搶占人工智能產業的制高點和話語權。 三、結語 人們對人工智能的期望,絕不僅用來解決狹窄的、特定領域的某個簡單具體的小任務,而是期望能夠真正像人類一樣,解決不同領域、不同類型的復雜問題,并進行判斷和決策。 發展人工智能的終極目標也不是要替代人類智能,而是要與人類智能形成優勢互補,幫助人類處理許多雖然能夠處理但效率不夠高的工作,使得人類從繁重的重復性工作中解放出來,從而專注于推動人類自身文明的進步。 參考文獻 [1] 何寶宏,徐貴寶.人工智能前沿技術應用趨勢與發展展望[J].中國工業和信息化,2019(04). [2] 王煥寧.人工智能芯片國產化路徑淺析[J].科學技術創新,2019(07). [3] 田雨晨.FPGA芯片設計及其應用[J].數字通信世界,2019(04). [4] 譚鐵牛.人工智能的歷史、現狀和未來[J].智慧中國,2019(03). [5] 魏少軍.發展人工智能芯片中國還缺什么?[J].中國集成電路,2017(08). [6] 王鋒.智慧社會治理中人機合作的邊界[J].學海,2020(05). | |||||
相關鏈接
- 楊凱越 | 國際智庫成果特點及對...2020-09-15
- 張瀛瀚 陳淥萍 吳正宇 | 國際...2020-09-11
- 陳雷 朱宇平 胡珂銘 | 加快推...2020-08-31
- 陸君明 | 編制好“十四五”規劃...2020-08-27
- 李開孟 | 經營性基礎設施項目融...2020-08-26