OpenStack云计算与HPC之一: 前言和OpenStack与HPC虚拟化

openstack
 ■ 译/ 天云软件 王艳东此篇文章翻译编辑自OpenStack全球悉尼峰会《Crossroad of Cloud and HPC》。 一、前言 OpenStack®是领先的开源云计算IaaS平台,助力世界上许多非常著名的科学研究机构。令人惊讶的是,科学研究学科包含了一些最流行的OpenStack云应用案例,面对科学研究计算IT基础设施的挑战,OpenStack提供了令人信服的解决方案。 在科学研究工作中,高性能计算(HPC)和高吞吐量计算(HTC)工作负载要求大规模扩展能力和集群网络:大量的存储、高性能的计算和高速的网络,并且作业和基础设施需要具备可管理性。OpenStack开发社区正在迅速扩展服务以支持这些需求。通过OpenStack私有云管理资源,研究人员能够在满足业务需求的IT环境中工作。软件定义的基础设施具有动态性、自动化的特性,减少了浪费在安装和配置过程中的时间,使研究人员能够最大限度地投入到研发工作上。 本文旨在介绍高性能计算系统架构师和研究计算经理,他们通过探索云计算的优势为HPC工作带来好处,也可以被当前的OpenStack用户用来深入研究OpenSt...
More

腾讯云重庆黑石数据中心开服,为西南工业智造提供超算云助力

黑石1
1月8日,腾讯云重庆黑石数据中心正式对外开放服务。该数据中心依托黑石服务器集群搭建高性能计算(HPC)专区,全面满足工业制造等场景中的超大计算需求,助力西南地区工业向智能化转型,推动互联网、大数据、人工智能与实体经济的深度融合。 1.云计算赋能工业智造 推动西南实体经济转型 在“中国制造2025”战略和“工业4.0”浪潮下,云计算、大数据等新一代信息技术正在和传统行业深度融合,全球加快进入以智能制造为核心的智能经济时代。 西南地区是我国重要工业基地。其在装备、机械、电子、化工等领域中已具相当规模,整体构建了机械工业为主、轻重工业结合的工业生态体系。 基于服务西南地区工业制造转型的整体目标,腾讯云重庆黑石数据中心将形成以重庆工业为中心向西南区制造业辐射的格局。以黑石服务器计算集群为依托输出超算云解决方案,以云服务的方式,向为西南地区工业制造业提供科研级的高性能计算力和互联网科技能力,助力西南企业智能化转型。 腾讯云重庆黑石数据中心是重庆市与腾讯公司一系列合作的延续。此前,重庆市与腾讯已经在 “互联网+政务”、众创空间、智慧交通、智慧城市等方面展...
More

专题四:分布式机器学习的集群方案介绍之HPC实现

专题封面1
■ 文/ 天云软件 系统架构师 李崇民 伴随着人工智能技术的发展,尤其是深度学习的兴起,许多之前机器学习领域的问题与难点逐步的得到了解决,训练效率与学习准确率都得到了质的提升。深度学习的实现,需要多种技术进行支撑,比如服务器、GPU、集群、集群管理调度软件、深度学习框架、深度学习的具体应用等。我们把这些技术进行归类,认为服务器、GPU、分布式集群、集群调度管理软件等作为深度的学习的系统支撑平台,也是机器学习领域的必备技术。天云软件作为国内较早做云计算、分布式集群计算、集群调度管理软件等的公司,在机器学习系统支撑平台上也有自己的独特的理解与实现。因此,本次分享将作为一个系列,内容罗列如下: 第1篇:深度学习简介,GPU计算的原理,分布式机器学习原理(to see ); 第2篇:分布式深度学习的两种集群管理与调度的实现方式简介(to see see );  第3篇:分布式机器学习集群方案介绍之基于Kubernetes的GPU调度(to see see again) ; 第4篇:分布式机器学习的集群方案介绍之HPC实现。 本次介绍第4篇—分布式机器学习的集...
More