AI應用
數字生命改變未來生活
恒聯人工智能訓練平臺
Artificial intelligence training platform
恒聯人工智能訓練平臺
發揮GPU優秀的并行計算能力,使用容器可以快速獲得需要的應用環境,是目前推薦的深度學習與數據科學開展研究的方式。它便于資源的分配與調度,優化異構資源調度:提供彈性、高效、細粒度(支持GPU共享)、簡化異構資源管理復雜性;提升可觀測性和使用效率, 可移植、可組裝、可重現的AI流程;可加載多種深度學習預訓練模型模塊,預安裝pytorch、tensoflow等深度學習框架與相關計算庫。

隨著人工智能與邊緣計算的發展,各種數據科學的應用落地,在在線教育行業中部署相關的服務去支持業務開展已成為大勢所趨——深度學習下的圖像識別、NLP等技術給行業帶來新發展空間。

數據規模在不斷增長,使用公有云部署業務是一種便捷的模式。但越來越多企業用戶發現,大規模使用公有云基礎及其深度學習API服務,已成為每年開支中的大頭。混合云部署的模式業務的模式可能成為更合理的選擇,把部分重要業務部署在企業私有云中,不僅可獲得對業務與數據安全的全面控制,據第三方測評,對中小型規模集群、私有部署甚至可能降低高達70%的運維服務費用。把部分業務私有部署,已成為在線教育行業中穩健的選擇。

在混合云部署中,云原生計算成為先行崛起的理念。云原生計算依靠資源云化(虛擬化),應用云化(標準化、自動化、可拓展、高可用),云原生(互聯網規模、敏捷,彈性)的優勢,逐漸成為人工智能深度學習、數據科學等應用及服務的載體。
01 One
全面的集群監控管理,實時掌握CPU/GPU
資源使用情況及運行狀態
可實時監控平臺內服務器、虛擬機、容器的使用情況,合理安排訓練任務與應用業務,提高集群可靠性與資源利用率。
02 Two
持深度學習任務調度功能,便于管理
內置多種計算框架:的pytorch、tensorflow、cntk等深度學習框架與相關計算庫;支持多種深度學習模型:YOLO/BERT/GPT-2/Googlenet/Resnet等
03 Three
支持計算性能測試
提供對不同深度學習模型的gpu計算性能基準測試
04 Four
支持加載深度學習預訓練模型
全部經過真實應用場景的有效驗證,提供用戶快速開展應用工程的可能
05 Five
提供容器服務,快速構建深度學習計算環境與業務流程
人工智能訓練平臺使用主流容器編排工具kubernetes搭建容器集群,并提供RBAC控制,容器及服務的生命周期管理和資源分配
06 Six
定制化的應用商店
可為多用戶提供公開或用戶定制的深度學習應用快速部署
07 Seven
定制化的私有容器鏡像倉庫
可為多用戶提供研究用戶的容器鏡像
08 Eight
方便結合CI/CD工具
如Jenkins,Rancher pipline
QQ
返回頂部