EDA作业调度和负载监控解决方案

行业背景

近些年来,电子产品已然成为人们日常生活中不可或缺的一部分,对人们的生活以及国民经济发展都产生了深远的影响,电子行业也抓住机遇随之获得了前所未有的蓬勃发展。作为电子产品的核心部件半导体同样发展前景非常可观,同时随着科技的不断发展,生产工艺的不断提高,在生产过程中的EDA(电子设计自动化)仿真模拟计算资源的需求随着半导体业的不断发展呈指数级增长。

EDA作业调度和负载监控解决方案 (1)

DRC: Design Rule Checking

数据来源:ElectonicDesign


半导体设计制造生态系统

纵观国内外半导体设计制造生态系统,如下图所示,可大致分为四个部分:

EDA作业调度和负载监控解决方案 (2)

  • 以高通、联发科技、苹果、德州仪器等为代表的设计企业,其拥有或购买核心IP,借助设计工具完成半导体产品的设计。
  • 以台积电、中芯国际等为代表的生产企业,其多为设计企业代工;当然,有些企业兼备设计与生产双重角色,如Intel、三星、华为等。
  • 以Cadence、Synopsys、华大九天等为代表的EDA设计工具提供商,借助计算平台向设计企业和生产企业提供优秀的EDA工具。
  • 以天云软件等为代表的计算平台提供商,提供计算平台,其产品或解决方案可与EDA工具捆绑,助力EDA工具效率的提升,加快上线速度,为设计和生产企业带来竞争力。

半导体设计制造流程

EDA作业调度和负载监控解决方案 (3)

  • “规格设计”、“EDA设计工具(使用者)”是由半导体设计生产企业进行,比如高通、联发科技、苹果、华为、三星等;
  • “EDA设计工具(提供者)”是由EDA工具厂商提供,比如Cadence、Synopsys、华大九天等;
  • “计算平台”由高性能计算厂商提供,天云软件提供的计算平台为EDA作业调度和负载监控平台。

半导体行业产品设计速度的影响因素

随着国内外半导体设计制造领域中各厂商的能力成熟度的不断提升,在竞争日趋激烈的同时,产品同质化程度也日渐升高,因此产品推向市场的速度便成了各厂商角逐的焦点,直接影响商业利益的得失。EDA(电子设计自动化),作为一种以计算平台为基础,融合了应用电子技术、计算机技术、信息处理及智能化技术进行电子产品自动设计的工具,在现代半导体设计制造领域里被广泛使用。可以说,EDA的出现就是为了缩短产品上市的时间。

影响半导体行业产品设计速度的因素归纳为以下三方面:

  1. 工具:即使用了哪种EDA工具以及其效率如何。
  2. 流程:即完整的设计自动化流程以减少人为错误的发生。
  3. 集群管理:即整个环境的准备时间以保证EDA所需资源得到及时响应。

方案概览

SkyForm AIP的作业调度器和负载监控平台是北京天云融创软件技术有限公司面向半导体设计和制造公司自主研发的高性能、高可靠、高可扩的企业级应用平台系统,具有独立知识产权,安全可控。本平台的功能包括应用管理、作业管理、主机管理、队列管理、调度器管理、用户管理、文件管理等,此外还提供监控控分析系统,实现对集群内主机、任务、队列、项目等多种维度关键性能采集、报表展示、实施监控分析告警功能,并可对集群和任务健康状态进行深度分析,为不同视角的用户提供了数据管理和辅助决策的功能。

图 1 解决方案架构

EDA作业调度和负载监控解决方案 (4)

  1. 调度软件、应用软件以及用户的设计数据都存放在共享存储中,这样可以实现集群中服务器之间实现程序、文件和数据的共享。
  2. 计算集群无需向所有用户开放SSH登录权限,用户只需通过登录服务器进行作业递交和作业的控制和查看;
  3. 登录节点通过内部协议经过业务网与调度器通信以及进行作业的分发和管理;
  4. 系统管理员可以通过管理网实现对登录节点、管理节点以及计算集群节点的系统管理和运维工作。
  5. 用户可以通过SkyForm AIP的Web门户进行作业提交和作业管理,也可以通过SSH或者VNC的方式通过登录服务器提交作业到后端计算集群,并对作业进行管理。

方案优势

EDA作业调度和负载监控平台从工具、设计自动化流程、集群管理三方面为提升EDA的效率带来价值。


工具方面

EDA作业调度和负载监控平台由天云软件全球研发团队研发,并首先在国外市场推广应用,目前已与Cadence、Synopsys、Mentor Graphics等常用的EDA工具良好集成。在国内,天云软件正力求通过与著名EDA提供商华大九天的紧密合作,将平台与EDA工具高度集成,提升效率。

 

EDA作业调度和负载监控平台于EDA工具而言,其价值在于高效利用EDA license及计算资源,通过分布式计算及作业管理来提升设计效率。通过优秀的工作负载调度管理,可以以非常高效、合理的方式管理分布式任务,确保每个作业高速运行并避免“长尾问题”,从而加速了仿真作业。


流程方面

在EDA作业调度和负载监控平台中实现自动化的持续集成。当作业通过EDA作业调度和负载监控平台分发到服务器时,设计人员可以轻松地从持续集成工具中进行管理和监视编译、合成、仿真。通过从复杂的EDA流程中消除人为因素导致的错误。EDA作业调度和负载监控平台的价值在于加速整个设计过程,并允许更多的仿真运行以提高设计质量。设计自动化流程为天云软件独有的解决方案。


集群管理方面

这里所提到的集群(server farm)并非简单的规模上的集群,而是指针对半导体研发所需的复杂的异构环境。在这种服务器集群的管理中,工作负载管理是设计人员使用资源的关键组件,而EDA作业调度和负载监控平台在这方面有着突出的竞争优势。

  1. EDA作业调度和负载监控平台拥有企业级的作业调度系统,稳定可靠且自主可控,不会被国外同类厂商绑架,对国内的企业来说至关重要。
  2. 研发维护团队能够提供高质量的支持。这就意味着可以减少故障排除时间,从而保证整个集群环境的就绪时间。
  3. EDA作业调度和负载监控平台是一款具备高性能工作负载管理的轻量级产品,相较于同类的调度软件过重的体量,更易于改造、维护和升级。
  4. 相对于同类产品,操作更简单,易于管理且具备可扩展性。
  5. 基于现代大数据架构的作业负载监控与分析系统有效地帮助客户分析集群效率、提高集群服务质量、缩短排错时间。
  6. 在全球的实际应用已证实EDA作业调度和负载监控平台的产品成熟度和对生产质量的帮助。

成功案例——某顶级半导体设计和制造公司

天云软件全球研发中心与在美国、欧洲和亚洲设有中心的跨国半导体公司合作,协助在40,000个内核上部署EDA作业调度和负载监控平台,为客户带来战略灵活性。除了迁移服务和全球支持服务,天云软件全球研发中心还开发了增强的自定义调度以满足客户不断变化的业务需求,同时允许客户对产生的知识产权保留所有权和控制权。

 

“通过使用天云软件EDA作业调度和负载监控平台,我们已经能够为我们的客户提供他们所需要的高水平的支持,同时降低工作负载管理的许可证成本。”——某EDA服务公司CEO