開發與生態層
AI Development Ecosystem Layer
涵蓋IDE、訓練框架、HPC、大語言模型、實驗追蹤、工作流編排與模型推理服務等開源工具,打造高效 AI/ML 流程,從開發到部署全方位支援,讓資料科學家專注創新、加速成果轉化。
控制層
AI-Stack Control Plane Layer
提供 GPU 資源切割與多租戶管理,提升GPU使用率;支援自定義映像檔與批次任務調度,加速 AI 開發和部署;並與 Kubernetes 無縫整合,優化 AI 工作負載調度。
AI-Stack API
Projects
Users
Resource
Quota
Authentication & Authorization
AI-Stack Control Plane
Monitoring Dashboard
Multi-GPU Computing
GPU Partitioning
Multi-Tenant
Multi-Node
Custom Image
Batch Job
Scheduling
SSO/LDAP
Workload Orchestration
實體叢集層
Infrastructure Cluster Layer
在單一平台上可同時納管NVIDIA和AMD GPU伺服器,打造高效能 AI 計算環境,並支援BeeGFS、Ceph 等儲存架構,確保資料高效流通。
AI-Stack Cluster Engine
AI Workload Scheduler
Storage permissions
Container Orchestration
GPU Fractioning
Server Cluster
GPU Server Cluster
Storage Server Cluster
BeeGFS, Ceph,Lustre, NFS, CIFS
AI Developer Ecosystem Layer
涵蓋IDE、訓練框架、HPC、大語言模型、實驗追蹤、工作流編排與模型推理服務等開源工具,打造高效 AI/ML 流程,從開發到部署全方位支援,讓資料科學家專注創新、加速成果轉化。
AI-Stack Control Plane Layer
提供 GPU 資源切割與多租戶管理,提升GPU使用率;支援自定義映像檔與批次任務調度,加速 AI 開發和部署;並與 Kubernetes 無縫整合,優化 AI 工作負載調度。
AI-Stack API
Projects
Users
Resource
Quota
Authentication & Authorization
AI-Stack Control Plane
Monitoring Dashboard
Multi-GPU Computing
GPU Partitioning
Multi-Tenant
Multi-Node
Custom Image
Batch Job
Scheduling
SSO/LDAP
Workload Orchestration
Infrastructure Cluster Layer
在單一平台上可同時納管NVIDIA和AMD GPU伺服器,打造高效能 AI 計算環境,並支援BeeGFS、Ceph 等儲存架構,確保資料高效流通。
AI-Stack Cluster Engine
AI Workload Scheduler
Storage permissions
Container Orchestration
GPU Fractioning
Server Cluster
GPU Server Cluster
Storage Server Cluster
BeeGFS, Ceph,Lustre, NFS, CIFS