SkyForm AIP(应用管理中台)

产品概述

SkyForm AIP 应用管理中台(简称SkyForm AIP)是由北京天云融创软件技术有限公司自主研发的专为工业制造应用管理的中台系统,具有独立知识产权,安全可控,核心技术不依赖于国外开源社区。本平台是基于云资源以及高性能计算物理资源池的工业制造设计、仿真应用管理中台,提供丰富的工业设计仿真应用的集成、快速的应用云服务化能力、端到端的业务流管理,规范的资源、数据和应用许可授权治理,高效的资源管控和调度,像本地一样便捷、灵活地使用工业设计制造应用使用能力。

产品定位

  • SkyForm AIP面向工业设计和制造的应用中台。商业、开源的工业设计、仿真应用软件无门槛支持,无需定制化代码改造,快速实现集成。
  • SkyForm AIP提供完整的工业设计和制造应用上云的各种服务。提供弹性的异构资源(CPU、GPU、InfiniBand,应用许可证等)管理和调度,应用生命周期管理,分布式任务管理,远程可视化,数据文件访问等。
  • SkyForm AIP 提供端到端的设计仿真流程高效协同。通过SkyForm AIP平台把工作站上的应用迁移到云端,将设计、前后处理和求解等工作环节实现了端到端的无缝流转和系统,不影响用户使用软件的体验,还有助于提高工作的效率,缩短了设计周期,加速产品上市时间。

产品亮点

  1. 广泛的集成和兼容生态
  • 融合HPC、AI、大数据等多种并发批处理应用的支持,全面兼容应用厂商已有的应用与资源管理的深度集成,快速部署和上线,包括:如CAE应用ANSYS,FLUENT,ABAQUS,NASTRAN,LS-DYNA,-STAR-CCM+,OptiStruct,SIMPACK等,EDA应用Synopsys、Cadence、Mentor Graphics以及华大九天等,以及机器学习/深度学习框架TensorFlow、MXNet、PyTorch、Intel Caffe、Spark、RapidMiner等
  • 深度集成HPC应用常用的MPI,无需配置免密SSH,远程管理和控制MPI任务分发,自动清理任务进程残留
  • 支持应用在容器中调度
  • 支持各种操作系统、云环境、国产CPU、GPU软硬件平台
  • 支持2D/3D远程高保真、低延迟可视化技术
  1. 最大化应用许可利用率
  • 基于应用程序许可证的调度
  • 基于策略分配许可功能
  • 最大化许可利用率和吞吐量
  • 确保及时完成重要工作负载
  1. 增强的调度功能
  • 确保SLA的抢占调度
  • 多级别的公平分享调度
  • 基于许可或资源的抢占
  • 作业阵列
  • 队列分派和运行窗口
  • 独占调度、交互作业支持
  • 用户、队列和主机的作业限制
  • 多步骤工作流的作业依赖
  • 支持根据实际资源使用阈值的调度
  • 支持大作业资源预留、小作业回填等
  • 简化深度学习分布式任务资源分配和部署
  1. 管理功能
  • 易于使用的web界面
  • 用户可以在不改变使用习惯的前提下完成前后处理和求解,利用HPC集群加速仿真进程
  • 支持项目、用户、作业、主机等多维度多指标监控和分析
  • 支持作业使用的软硬件资源进行计量计费
  • 灵活的报表子系统
  • 作业组支持(按组管理作业)
  • 增强的NUMA环境支持
  • 支持多集群管理
  • 支持多种底层调度技术
  1. 卓越的可伸缩性和可靠性
  • 支持数百万个作业,数千台主机
  • 动态主机选择,多路故障转移
  • 低延迟、高吞吐量调度
  • 并行事件处理带来更快启动速度
  • 针对可伸缩性的附加调整参数
  • 增强的inter-daemon通信
  • 可插拔的身份验证
  • 主机宕机时的作业重启
  1. 灵活部署
  • 避免限制性许可证协议
  • 支持在本地和在云中运行
  • 保持灵活性,降低许可成本
  1. 高品质的服务和支持
  • 拥有数十年相关经验的支持团队
  • 标准和高级支持选项
  • 安装、配置和调优的援助
  • 可选的现场实施服务

客户价值

  • 用户体验提升:提供优于本地工作站应用软件使用体验,支持大规模多目标、多参数批量任务并行计算,弹性的高性能计算资源供给,减少因资源限制而导致的串行执行等待时间
  • 业务能力提升:打破以往因资源受限而无法实现产品精度持续提高的局限,便捷灵活的资源获取,缩短了设计周期,加速新产品上市交付时间
  • 协同管理提升:设计和仿真(前、后处理和求解分析)等应用的业务流程、数据流转通过本应用中台进行协同管理
  • 管控能力提升:通过应用管理中台和数据中台的集中管理,不仅有助于提高协同效率,而且可以增强业务安全管控能力
  • 可用性提升:免维护的内置高可用、故障自愈机制,避免人工干预所浪费的时间成本
  • 总拥有成本(TOC)降低:实现昂贵、稀缺的软件(如应用许可证)和硬件的资源(如GPU)的共享,提升软件许可的利用率,降低计算资源的浪费,节约工程师设计时间

产品功能

SkyForm AIP 产品介绍-1

工业制造云平台为用户提供应用控制台、项目管理、数据管理以及账单管理,通过社区服务进行知识分享和知识管理等功能;管理人员可以通过该平台进行资源池运维、对应用进行集成和管理、对用户进行角色和权限控制、对调度器和作业进行管理,对资源和作业的监控和统计分析,用户作业计量计费等操作。

主要功能描述:

  • 应用管理:通过设计仿真类应用进行无编码式的快速集成,并提供应用上架、下架、删除以及权限访问控制等管理功能
  • 任务管理:支持对批处理和交互式应用任务的提交、暂停、停止、重启的管理操作
  • 用户数据管理:支持通过WEB浏览器对数据进行上传、下载、拷贝、删除、重命名、移动等管理操作
  • 远程会话管理:通过VNC和NICE DCV实现图形交互式应用的三维远程可视化,并且支持GPU图形处理的加速;同时也支持基于WEB的SSH远程字符终端会话
  • 调度器管理:内置成熟、稳定、可靠的完全自主可控的百万级超大规模作业高性能调度系统,技术已达到行业领先水平,支持主流的商业和开源高性能计软件;同时也支持其他商业或开源的作业调度器,如IBM LSF、PBS、SLURM等
  • 用户管理:支持用户以及部门的资源配额以及访问控制管理
  • 监控告警:从项目、主机、用户、用户等多维度的资源、作业多指标进行采集、分析,并进行告警和报表分析,为不同视角的用户提供了数据管理和辅助决策的功能
  • 资源管理:可以对x86高性能计算物理服务器和云服务器的CPU、内存、存储、应用和License以及多种加速器的资源进行分配和管理,并且支持物理服务器和云服务器之间进行弹性切换
  • 计费账单:支持对应用作业的多维度的软件(如软件许可证)、硬件资源消耗进行计量和计费,并支持从时间、用户、任务、项目、队列、集群等多维度进行账单汇总

应用场景

SkyForm AIP 产品介绍-2

高性能计算系统的应用领域非常广泛,包括CAE仿真(结构分析,流体分析,电磁场分析)、EDA、动漫渲染(图像处理、三维渲染)、高校课题研究、电力、物理化学、石油勘探、生命科学、气象环境(海洋预报)、航空航天设计以及人工智能等等。


场景一:工业制造设计仿真系统解决方案

随着新一代信息技术(如云计算、物联网、大数据等)与制造业的融合与落地应用,世界各国纷纷出台了各自的先进制造发展战略,如美国工业互联和德国工业4.0,与此同时,在“制造强国”和“网络强国”大战略背景下,我国也先后出台了“中国制造2025”和“互联网+”等制造业国家发展实施战略,加快建设制造强国,加快发展先进制造业,其核心是借力新一代信息技术(如数字孪生体Digital Twin),充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,实现制造的理世界与信息世界的交互与共融,进而促进制造业先进化水平的整体提升。

数字孪生面向产品全生命周期过程,发挥连接物理世界和信息世界的桥梁和纽带作用,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。通过工业辅助设计CAD、工业仿真CAE、虚拟转配和制造DMU/CAM的辅助工具,由漫长传统工业设计制造的物理过程向数字化的虚拟过程迈进。因此,在此建设过程中,亟需高效、灵活、高性能的云服务能力的支撑,来加速产品发布周期、提升产品交付质量,优化全生命周期成本。

业界解决方案的现状

目前工业制造设计仿真应用支撑系统形态各异,主要面临如下问题和挑战:

  • 仿真系统复杂度高,资源和应用的管理、运维的难度大、复杂性高;
  • 常规HPC方案所能解决的问题有限,提供软件运行环境,但操作性相对传统落后,与用户本地环境相比使用体验差;
  • 普遍的仿真云基于虚拟桌面方案,因此缺乏高性能、分布式并行计算能力的支持;
  • 公有云服务提供商只提供硬件资源环境,用户仍需自行解决应用部署、与本地资源连接等问题。

解决方案

SkyForm AIP 产品介绍-3

天云工业制造云平台以天云软件的两大核心产品云管理平台SkyForm CMP和应用管理中台SkyForm AIP为依托,提供从底层资源管理到上层工业应用管控的一体化的工业制造云解决方案。在该云平台上提供工业设计CAD、分析和模拟CAE、数控加工CAM以及产品数据管理PDM端到端的工业制造软件SaaS服务能力,用户可以像本地一样便捷、灵活地访问和使用工业制造应用软件,同时提供按需供给的弹性计算能力。

多云管理平台SkyForm CMP实现对底层异构计算资源进行统一管理,包括私有云、公有云、裸金属服务器,为上层应用提供支撑。

应用管理中台 SkyForm AIP 基于云资源以及高性能计算物理资源池,提供丰富的工业制造应用的集成、快速的应用云服务化、业务协同管理,规范的资源、数据和应用许可授权治理,高效的资源管控和调度。


场景二:一流半导体设计公司高性能计算解决方案

天云软件北美研发中心与在美国、欧洲和亚洲设有中心的跨国半导体公司合作,协助在40,000个内核上部署SkyForm AIP for EDA,为客户带来战略灵活性,协助迁移服务和全球支持服务。

根据业务运算的复杂性,平台面临以下挑战

  1. 计算节点数量多,部署复杂,安装过程容易出错。
  2. 计算节点管理调度不灵活,造成任务排队,资源浪费。
  3. 各部门作业任务计算量大,需良好的调度软件满足等级较高的作业任务优先使用计算资源。
  4. 业务计算关联性强,满足资源共享能力。

解决方案

SkyForm AIP 产品介绍-4

  • 快速部署:大量计算节点几分钟部署完成。
  • 计算能力:容纳数千个计算节点,数十万个内核和数百万个作业并行计算,SkyForm AIP可以调度和动态分配任务。
  • 设置策略优先级:多级别分享调度,设置不同等级的作业优先级别。
  • 资源利用率高:在100,000核的集群上负载1,000,000个作业,达到99%的资源利用率。

场景三:动漫渲染领域高性能计算解决方案

渲染是动漫、影视制作的核心环节之一,是实现创意和前期设计构想的关键环节,直接决定作品的视觉效果,高水平的渲染可以细致地显示出材质纹理和光景效果,使形象更加生动逼真。目前,渲染已经成为全球重要的高性能计算应用领域,且近些年我国动漫、影视产业发展迅猛,全国各地兴建动漫影视基地或创意文化产业园区,为渲染应用的普及与推广提供了极好的契机。

随着电影、动画制作的不断精细化与高清化,渲染消耗的时长以及产生的原始数据量都在飞速增长,这也对渲染农场的各方面性能提出严苛的要求。

目前渲染主要面临以下几方面挑战

  1. 单机渲染视图和动画非常耗时,占很大的制作时间比例;
  2. 计算密集型特征要求系统运算能力高;
  3. 海量存储需求,并发读写压力大,容易出现I/O瓶颈;
  4. 动漫渲染管理繁琐,账号控制和用户记账统计复杂。

解决方案

SkyForm AIP 产品介绍-5

  • HPC集群资源管理方面,将分散在不同节点上的物理资源聚合起来,根据内存、闲置CPU容量、磁盘空间、临时空间、软件可用性,以及用户定义的资源限制来调度并分配工作负载,支持数百万个作业,数千台主机超大规模的运算能力。
  • 卓越的可伸缩性和可靠性,作业调度动态主机选择,多路故障转移,主机宕机时的作业重启。
  • Maya, 3Dstudio MAX, XSI专业的三维建模软件分布在多台计算资源节点上,实现更高效的渲染;并行存储系统提供海量、高带宽的数据访问;SkyForm AIP对硬件平台提供全面、完善的作业调度分配、运维管理与监控管理功能。
  • SkyForm AIP可对用户插拔进行身份验证。

场景四:高校教学模拟研究高性能计算解决方案

各大院校都希望通过HPC强大的计算能力计算或模拟实验运算出来的结果,来辅助完成学术和探索方面的研究和证实,这些学术和探索方面的研究课题包括生物计算,基因研究,航空航天,分子动力学,材料化学,计算化学,物理化学,结构力学,流体力学,有限元领域,气象领域,石油勘探以及人工智能等领域。这些课题的研究成果都是高校研究能力的重要体现。

 目前高校的高性能计算主要面临以下几方面挑战

1、院校各专业学生较多,需要跨多个集群、调度管理。

2、需满足不同专业学术的模拟需求,满足多租户的实验场景,实现多租户之间的安全隔离,每个用户使用时的体验是自己独享一个集群。

3、需满足资源灵活分配要求来满足不同课题研究环境。

4、需满足系统批量自动发放并部署教学环境。

解决方案

SkyForm AIP 产品介绍-6

  • 海量计算能力:基于SkyForm AIP作业调度的海量规模计算,模拟实验平台能够快速高效获取计算资源,大大缩短排队和实验模拟时间。
  • 多租户:学术和探索方向课题研究都不同,每个课题都是一个私有的运算环境,采用多租户的实验场景,实现多租户之间的安全隔离。
  • 集群计算能力:强大的集群并行计算能力,100,000核的集群上负载1,000,000个作业,达到99%的资源利用率。
  • 降低TCO成本:开源的技术优势,降低采购成本。