10月21日至23日,以“智算赋能 · 共赢未来”为主题的2021 CCF全国高性能计算学术年会(简称CCF HPC China 2021)在珠海·横琴召开。

 

CCF HPC China是高性能计算领域全球最具影响力的三大盛会之一,与德国ISC、美国SC并驾齐驱 。

 

 

如今高性能计算几乎出现在各个领域,早已不仅限于科学计算等传统领域,自动驾驶,能源勘探、天气预报、基因检测、机械设计、芯片设计、新药研发、电影特效等等,背后都有高性能计算的身影。

 

未来,高性能计算将向云计算、AI、行业等方向跨界融合,面对日益复杂的应用场景,将挑战多元的算力供给能力

 

 

本次大会上,天云软件发布了天纺应用管理平台2.0,天纺应用管理平台的产品经理也在现场接受了腾讯视频的专访。

 

本次天纺应用平台发布了最新的2.0版本,能介绍下新版本带来了哪些变化吗?(产品发布的历史和版本功能、设计理念、核心价值等)

 

正如今年天云软件的slogan——“纳百云,算未来”,我们的目标是帮助客户上云以及用好云,这些云包含资源云和计算云,天云有两条核心产品线去支撑这些业务,而天纺应用平台就是支撑客户超算及超算云的产品线。

 

天纺应用平台在2018年就开始规划建设,主要包含调度系统和应用门户两个软件,在2020年我们完成了平台V1.0的发布,形成了可以销售的核心软件包,近一年来我们根据现场的需求不断的迭代完善,同时快速跟进市场的变化,在第三季度完成了产品的更新换代。

 

这次产品的变化主要集中在以下几个方面:

产品架构的演进:我们对1.0的架构进行了优化,让系统更轻量,只要非常小的资源就能运行系统,同时我们新版本采用了更科学的高可用模式,提供负载均衡和横向扩展性,可以支持大规模的互联网用户访问,系统在设计时考虑到与其他系统的集成,提供基于OpenAPI3.0标准接口,保证系统扩展性和生态。

 

产品能力的增强:现在产品支持多资源池多调度器的管理,可以更好的帮助用户利旧集群,应用门户和调度器解耦可以为用户提供更灵活的方案组合,产品从专一的小而美软件变成开放式的计算平台,站在平台角度来解决客户的实际问题,同时为了更好的用户体验,在新版本中增加了动态应用集成、图形可视化方式选择以及多种文件传输方式支持等功能。

 

产品方向的扩展:以前的版本主要面向高端制造业,现在新版本不但可以支持高端制造业,而且可以对公有云进行支撑,根据用户的实际需求可以快速响应云资源弹性伸缩、桌面云集成及管理等等。

 

以上概括了产品的重大变化,具体功能上的变化就不一一说明了。

目前天纺应用平台主要面对哪些客户群体?为他们提供哪些服务呢?(产品服务目标客户)

 

在上面的回答中其实应该也看到我们产品的定位,下面我再做详细的说明,天纺应用平台是一个面向多个行业和领域的国产自主可控、且国际领先水平的高性能计算平台,最终目标是提高用户和组织的生产效率,帮助客户用好计算云。

 

按照我们的产品定位,天纺应用平台可以应用于高端制造、汽车制造、医疗、水利、气象、生物等各个领域,只要这些行业使用数字化仿真或远程图形可视化软件,天纺应用平台都能提供支撑,在我们产品中已经集成了CAD、CAE、CFD、生命科学和气象环境等领域常见软件,用户可以通过产品快速搭建自己的私有计算集群,在自建的集群内可以实现远程设计桌面,类似于云桌面的效果,同时可以为用户提供了可视化的仿真计算功能,用户可以通过工业应用内部直接提交计算作业或者通过WEB页面提交作业,降低使用复杂度和集群推广难度。

 

对于部分需要使用公有云或超算资源的客户,我们的产品同样可以满足需求,天纺平台在研发过程中一直和各大超算中心有紧密合作,产品在设计之初就考虑了超算资源或公有云资源的弹性利用,产品在自建集群资源不足或某些条件下会自动动态开通公有云计时资源,利用开通的资源完成计算任务,一定程度中帮助客户节省成本、削峰填谷。

 

天纺应用平台在几个超算中心都已部署实施,平台本身包含租户管理和计费、报表功能,对于一些有云资源且想租转售的客户来说,天纺是最适合的产品,原因在于它在各超算中心完成了超算公有云的运营试炼,无需试错就可以直接进入到资源转化为利润的阶段。

 

经过近几年的不断耕耘,我们产品目前已经在航空、航天、教育、医疗、汽车制造、芯片制造等行业得到应用,同时我们产品也在各大超算中心已经部署上线,帮助我们的客户管理近万台计算节点,提供超算云服务,这也证明天纺应用平台是一个稳定、成熟的产品。

 

您能介绍一个比较典型的项目吗? (案例介绍,讲无锡超算)

这几年天纺应用平台在不少客户那边已经实施应用,也得到了客户的一些积极反馈,我下面就讲一个对我们和客户实现双赢的案例。

 

无锡超算中心由科技部、江苏省和无锡市共同投资建设,是江苏省首个重大科技基础设施,在中心不但部署了神威·太湖之光超级计算机,也有一部分x86的超算资源,无锡超算中心希望能够将这些计算资源面向社会开放,尤其为长三角的制造业提供工业仿真算力,超算中心和天云就这个任务目标形成了一个合作协议,希望天云能够充分利用既有资源建立面向工业仿真的超算云平台“神工坊”。

 

我们根据这个任务目标组织了两个团队,一个团队专门负责方案设计、实施,由长期奋战在HPC一线20余年的专家团队根据客户的需求重新设计集群架构,另外一个研发团队主要负责天纺应用平台的集成和移植,在此过程中和客户不断的沟通改进,为产品增加了非常多的超算公有云功能,比如租户计费、科学计算应用集成等,最终帮助客户发布了神工坊超算云,在试运行期间就有3000多个用户进行了测试使用,反馈良好。

 

这个项目对于无锡超算来说,他们有效的使资源为社会提供服务,扩展了中心的影响力和品牌力,走在超算中心技术探索和应用的前列。对于天云来说,不但锻炼了团队、完善了产品,而且让我们为济南超算客户超算云落地提供了参考,这就是我说的双赢,我们希望和未来的客户一直是合作双赢。

 

天纺应用平台相对于其他同类产品来说优势是什么?(与竞品的差异化、天云公司的整体优势)

我这边主要从以下几个方面来回答下这个问题:

首先是云+HPC的优势:众所周知我们公司不但有天纺应用平台产品,还在云计算领域深耕了近十年,我们公司有云基因和云产品,天纺平台和我们的多云平台可以实现其他竞品没有的云资源+HPC模式,对于客户来说选择天云不但可以实现公有云资源弹性利用,而且可以将天纺平台发布成园区云或公有云,最大化资源利用的同时形成规模效应。

 

其二是产品能力优势:天纺平台不但包含市场上常用的设计、仿真计算功能,我们还有其他解决方案不具备的多租户计费、密级控制、团队协作管理功能,同时我们产品可以看作一个应用集成中台,提供应用表单和集成脚本的动态管理。最后我们产品和工业应用实现了兼容,在工业应用内部直接就可以启动作业任务,这是一般解决方案无法做到的,这个功能可以帮助用户不改变现有习惯的情况使用计算集群,有助于降低企业HPC计算平台的推广难度。

 

再次是产品的自研能力和国产化集成优势:目前国内很多厂商的调度软件都不是自研的,他们要么直接使用国外产品,比如LSF、PBS,要么就直接找开源社区的产品进行封装售卖,基本没有二次研发能力,我们公司的调度软件是由10余年HPC经验的核心开发团队研发,在济南超算的8500节点的单集群超算系统中得到验证,无论是产品性能以及二次开发能力都不是其他厂商可比拟的,另外我们产品目前已经和国内常见的国产化服务器进行了兼容认证,比如申威、长城飞腾、天津飞腾、鲲鹏、兆芯等,而目前其他厂商的产品还没有完成这些认证,在这方面我们有国产化先发优势。

 

最后是团队优势和方案能力:我们的产品不是盲目研发出来的,我们有一个20余年HPC方案和实施经验团队进行把关,我们的研发团队来自全球领先产品的核心研发组,二次研发和支持能力有保障;另外天云与其他厂商的巨大区别是我们是方案提供方、实施方,而不是单纯产品原厂商,我们有其他厂商没有的人才优势,作为中立的厂商我们为用户提供最优化、最合理、最平衡的落地方案,每一个项目都是交钥匙工程,这就是我们给客户的核心价值。

 

您怎么看当前国内HPC市场的发展?天云软件未来有哪些规划呢?

这些年随着硬件设备的不断更新换代,HPC市场发展很快,以前由于基础硬件造成的问题也得到了解决,加上近几年国产化进程的不断推进,我认为国内的HPC市场会迎来一个爆发期,一方面是国产化推进时原来国外的一些调度软件受限,国产HPC产品迎来了机会;另外一方面是因为越来越多的企业对仿真技术越发重视,甚至一些中小企业也开始使用超算云和公有云的HPC资源,这在十年前是无法想象的,随着社会的发展,各行各业的社会职能不断细分,企业产品的竞争越来越激烈,这些社会进步和竞争将推动企业使用提高竞争力的技术和产品,而HPC就是快速提高产品竞争力的一项技术。

 

天云针对可能面临的市场也做了一些规划,一方面我们将继续深耕既有的市场,不断的提升产品竞争力,未来将针对行业发布专用的版本;另外我们也将尝试与一些计算资源提供商合作,一起推动超算云的落地,为更多更小的企业用好计算云,最终实现“纳百云、算未来”的初衷,希望能为咱们国家的制造业尽一份力。

谢谢!