技術解讀為什么百度智能云是“最適合跑AI的云”?
云計算在與人工智能技術的融合發展中,也打破了企業開發的界限。3月27日,百度智能云2021云智技術論壇首次在北京舉行,百度智能云重磅發布云智一體化AI開發全堆棧模式,基于獨特的AI堆棧原生云架構,通過硬件和硬件一體化高性能AI開發基礎設施為企業提供AI開發全堆棧解決方案作為國內AI公有云服務市場第一的百度智能云以云智一體化的獨特優勢繼續領先市場。
百度智能云是百度AI技術落地的承載者和輸出者,顯示了云智一體化的獨特競爭優勢。智是百度大腦,作為智能云的核心基礎,經過十幾年的積累,百度大腦已經發展成為核心技術領先的硬件和軟件一體化AI大生產平臺,為各行業提供能力的AI新基礎設施。為了滿足產業智能應用的規?;a,百度智能云在業界首次提出AI原生云計算結構,構建業界最適合AI的云,結合上層靈活易用、滿足各種開發者應用需求的AI開發平臺,幫助企業提高AI開發效<愛尬聊_尬聊生活>率,加快智能化進程。
硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、硬件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、軟件、為了更好地適應已經到來的AI原生新階段,百度智能云構建了全棧的AI原生云架構,對AI應用場景進行了深度的硬件和硬件一體化合作優化,構建了行業最適合AI的云,在AI基礎設施水平上為企業提供了高性能的AI算力,更簡單、易用、高效的開發過程
百度智能云主要通過AI計算、AI存儲、AI容器三層構建AI開發基礎設施。具體來說,
AI計算層:基于百度太行彈性裸金屬產品,為客戶提供高性能、多規格、高性價比的計算服務。以下分別介紹
-芯片水平,擁有百度自我研究的昆侖芯片和業界多規格的商業GPU和FPGA芯片,以滿足不同場景的AI計算能力需求。
-單體服務器水平,基于X-MAN結構的AI超級服務器,X-MAN是第一臺可與4路CPU組合的超級AI計算機,突破CPU與GPU的配比限制,更好地釋放GPU的能力,使CPU的能力不再成為GPU計算力利用的限制,提高AI計算場景的整體計算能力。同時,單體內部多卡之間的通信基于NVLink的高速連接。
-百度AI超級服務器統一通過百度自主研發的硬件虛擬化技術百度太行彈性裸金屬,以百度太行高性能計算實例的形態,可與其他云服務無縫連接,包括云存儲、云數據庫、云網絡等
AI存儲層:其核心是基于百度對象存儲服務和相關AI場景的加速和處理能力,解決客戶AI開發場景的數據存儲和分析問題。因此,百度智能云特別提供面向AI計算的存儲服務體系結構,分為
-第一層,數據云,幫助客戶的數據如何快速有效地提供云,百度提供面向離線傳輸的磁盤傳輸方式線下傳輸支持單機百TB的數據轉移能力,線上數據流轉cloud、flow兼容行業7種對象存儲接口。
-第二層是數據存儲,百度以對象存儲為中心提供經濟高效的存儲服務。百度對象存儲提供行業第一批四級數據存儲,并提供智能化的生命周期管理和行業領先的讀寫性能,滿足客戶在大數據場景下的性價比需求。
-第三層是數據處理和AI加速層,在加速層面,百度提供Cache服務,基于更快的存儲介質,提供元數據加速、緩存管理等能力,提供更高的性能存儲能力,同時在對象存儲方面默認集成AI智能處理能力。百度的高速緩存能力,在一些場景下訓練速度可以提高4倍以上,同時融合了數十種智能處理能力。
另外,針對視頻、圖片等文件類型,百度智能云在BOS測試更好的封裝集成了百度相關的AI能力,包括數十個圖片的審核能力,以及圖片的提升和特效能力,用戶可以直接通過BOS事件觸發框架,在數據訪問或數據上傳時,直接通過統一的界面擴展調用這些智能處理能力,使數據分析和存儲更近,降低編碼的復雜性,提高管理體驗。
AI容器層:百度智能云容器發動機服務CCE提供基礎Docker容器生命周期管理、大規模容器集群運輸管理、業務應用一鍵發布運行等功能,對AI場景進行了一系列優化具體介紹AI容器服務的重要特性:
-支持GPU共享能力,支持用戶1/2、1/4等粒度的GPU計算能力資源管理。
-在AI作業的調度水平上,支持Gang、Spread、Binpack等調度算法和NVLink等GPU網絡結構的感知調度能力。
-在加速發動機層面,提供計算機和通信加速發動機,計算機加速可以在具體場景下提高數倍的推理效率,通信庫可以支持千卡規模的通信加速能力。
AI原生云基礎設施上層建設AI開發雙平臺的AI開發成為最佳解決方案
隨著產業智能化的大潮,AI成為許多行業變革升級的通用技術,企業級AI開發平臺的作用越來越突出。依托AI原生的云基礎設施,基于百度自我研究的產業級開源深度學習平臺飛槳,滿足企業對場景的定制應用需求,百度推出飛槳企業版,包括面向AI應用開發者的零門檻AI開發平臺EasyDL和面向AI算法開發者建設的全功能AI開發平臺BML。
EasyDL和BML都可以滿足開發者的數據獲取、特征提取、參數優化、模型訓練、模型評價、模型配置、推理服務等全過程需求,具有更豐富的任務場景、方便高效的智能數據服務EasyData、內置百度超大規模預訓練模型帶來的高精度效果
零門檻AI開發平臺EasyDL
EasyDL面向AI應用開發者,支持圖像、文本、視頻、語音、OCR、結構化數據、零售行業版7大技術方向,16種任務類型,支持公有云、本地服務部署、設備端、軟硬一體四種部署方案,已服務超過80萬用戶。從EasyData智能數據服務、模式培訓到服務部署一站式全流程服務,讓用戶無需了解算法細節,5分鐘即可上手,最快10分鐘完成模式培訓。
數據準備:在數據處理中,可以直接使用智能數據服務平臺EasyData的強大能力,實現數據收集、評價、清洗、標記的一站式服務。大大降低了用戶獲取和處理數據的成本。
模型訓練:EasyDL內置百度自研超大型視覺預訓練模型和自然語言處理的預訓練模型文心(ERNIE)2.0,比較開源數據集訓練的預訓練模型
EasyDL新發發布了多角度模型評價能力,進一步幫助模型調整,包括
通過數據統計,可以幫助開發者正確判斷模型在哪個類別中容易出錯,
可以進一步說明模型的決策依據,在整個圖像范圍內給出影響模型識別結果的重要性/p>
模型配置:為了滿足不同場景的需求,百度提供公共云API、當地服務器配置、設備方面的SDK、硬件一體化產品四種配置方式。用戶只需要經過簡單的設置,就可以將培訓好的模式轉化為滿足業務場景需求的服務。在設備方面的SDK上,NVJetson系列、Intel神經加速棒、華為NPU、華為Atlas、高通DSP、RK棒等適應了15種以上的主流芯片和4個操作系統,實現了業界最適應。
另外,EasyDL最近推出了端云協同部署方案。
端云協同部署基于百度開源的智能邊緣BIE框架搭建,開發者可以輕松在云端管理各類端與邊緣。
在端和邊緣設備上,只需一次集成邊緣套件,在本地,就可以輕松獲得AI模型本地推理、視頻流接入等功能。而在云端,可以進行服務的下發和更新,還有報表的統計和節點的管理等功能。
端云協同部署非常適合具有網絡(或部分網絡)條件下的業務場景,開發人員可以訓練模型,在1分鐘內將新模型更新到邊緣端進行驗證或批量部署。大大提高了AI模型開發的配置效率,開發人員可以集中精力于業務本身。
EasyDL端云協同的配置方案可以在箱子、一體機、服務器等各種智能終端中運行,在這些邊緣設備中可以訪問各種傳感器(照相機、MIC等)。結合EasyDL的公有云部署和本地服務器部署,可以方便地構建出云邊端融合的一整套AI解決方案,滿足各種業務場景下的AI應用需求。
全功能AI開發平臺BML
BML則面向AI算法開發者構建,在模型構建和模型管理上,BML提供了高性價比的算力、更加易用多樣的建模方式。在模型管理上也提供了模型存儲、模型轉化、模型評估和模型優化的功能。BML可以說為專業算法開發者提供了更靈活、更強大的AI開發平臺。
BML具有以下四大核心優勢,建模方式全面,預設高性能AI套件,交付靈活,提供多種國產化解決方案,為企業提供自主可控、廣泛適應的AI開發平臺。
建模方式:BML提供預設模式參考、Notebook、定制作業、可視建模等多種建模方式。其中,預設模型參與在實現低代碼建模的基礎上,具有一定的腳本編輯靈活性,同時內置自動超參與搜索功能,提高模型效果。BML提供的自動超級搜索功能是基于隨機微分方程的無梯度優化創新的調查算法,收斂速度快,不依賴光滑的假設,可以支持大規模的并行搜索調查。打開自動超級搜索后,BML在線多場景的模型精度平均可以提高10%以上。
高性能AI套件:
-高性能機械學習套件。用于數據分析機器學習場景下的加速,套件比開源套件產生十倍的效果,其界面非常兼容,使用高性能的機械學習套件后,在一些常見的開源任務中性能大幅度提高。
-槳文心ERNIE開發套件。飛槳的可持續學習語義學習模式,除此之外還提供30個算法工具,20個細化的預訓練模式,20個數據處理工具和20個基礎開發工具,大大降低了整個數據標記投入的算法、開發時間,大大提高了效率。
交付方式:BML有公共云、私有云、混合云、一體機四種滿足不同需求的交付方式。其中一體機提供了通用的機架式的服務器方案和基于天蝎的整機柜方案,對于整體功耗、性能、散熱等都進行了優化,并通過模型加密、代碼加固、TPM可信鑒權、主機防護等方式強化了安全保障。
國產化解決方案:BML全面支持從國產深度學習框架到麒麟等國產操作系統,從國產CPU、GPU、長城、曙光、聯想、浪潮發布的各種硬件形態,構成自主控制、廣泛的BML一體化
企業在智能升級過程中,特別是從單點垂直場景的應用發展到多個業務場景的全面升級階段,企業面臨人工智能能能力的生產、應用和運輸和管理水平的諸多問題,此時企業需要人工智能中心
AI中臺是企業的智能中樞,連接企業內部的數據、知識和業務,更快更有效地支持上層的智能業務應用和業務創新。百度智能云AI中臺的核心是AI能力引擎、AI開發平臺,與之相結合的數據管理、服務管理、全線資源運輸管理系統等,企業可以構筑智能升級的基礎設施。在AI能力引擎方面,企業可以直接從百度已有的270多項成熟AI能力中選擇應用。AI開發平臺包括EasyDL、BML和場景化定制平臺UNIT等,滿足企業多層次開發需求。百度智能云結合具體行業特點,目前已經構建了能源、金融、城市、媒體等多個行業化AI中臺落地解決方案,為不同行業的企業客戶提供建設AI開發和應用的自主能力,集約管理企業AI的能力和資源,統一規劃企業智能升級版圖的有效途徑。
人工智能與傳統行業加快融合,進入快速大規模應用階段,百度釋放基于自己AI技術和生態長期積累形成的領先勢力,以真正滿足智能時代場景應用需求的云智能一體化方式賦予產業能力。云智一體化成為百度智能云的核心優勢,也是擁抱AI的企業和開發商的最佳選擇。
