运营商私有云

项目背景

为了满足运营管理的需要,电信运营商建设了大量的IT系统,而这些系统大小规模不一、用途各异且又相互独立,每年以数以万计的规模递增。引入云计算技术,将有利于快速部署业务,提高IT系统的资源利用率,可有效降低企业建设和维护成本,使经济效益实现最大化,更为企业技术、业务和管理创新带来了新的契机。

H省移动公司采用天云SkyForm云平台构建私有云管理平台,实现以一个为中心、异地多资源池管理架构,为网管支撑、信息安全、企业信息化提供基础IT资源服务。

案例意义与必要性

运营方面

  • 优化资源使用:资源整合,提高利用率、降低成本;资源共享,动态分配和调度,更快的响应业务需求
  • 提升管理能力:统一化、集中化管理,实现资源统筹规划;自动化、智能化、精细化管理
  • 向IT服务化转型:IT资源标准化、服务化、流程化;建立完善的IT服务体系与标准,提升IT服务能力,使IT成为企业生产力

业务方面

  • 资源方面:资源的采购和系统建设以应用为导向,周期长、资源分散在多处,异地资源无法有效共享;资源采购成本高,运营维护成本高,对需求响应缓慢;
  • 管理方面:管理员手工处理各个业务部门的资源申请,手工管理和部署资源,自动化程度低;粗放式管理,被动式响应,对分配给业务部门的资源缺乏持续管控能力;
  • 使用方面:各业务部门分散式、独占式使用资源,很难进行资源动态调配和共享,资源利用率低;资源分配和使用粒度以物理机为主,应用环境与硬件紧密耦合

业务需求分析

需求一:计算资源调度

  • 云平台提供计算资源指标利用率信息,实现VM计算资源的根据使用情况自动弹性伸缩;
  • 提供资源使用报表,对于计算资源分配过高,使用率过低的服务器,实现在线资源调整;
  • 云平台应超卖系数自动配置,提供节能减排能力。

需求二:报表功能

  • 云平台提供业务、资源双视图报表:
  • 业务角度包括业务名称、类型、VM/物理机个数,每个VM/物理机的配置/性能等信息;
  • 资源角度,包括Cluster、物理机、虚拟机、业务、配置/性能、存储等信息

需求三:业务生命周期管理

  • 云平台对虚拟机的所有操作进行记录,如创建、资源调整、关机、开机等;
  • 提供按业务对虚拟机的操作历史事件进行查询,查询条件上,提供时间等多种组合查询条件

需求四:业务测试区

  • 在每个业务域中增加测试区域功能:
  • 云平台可以配置一个或多个测试区域,业务系统上线之前,在测试区域安装、配置服务器;
  • 测试工作完成后,可以迁移VM至生产区域

需求五:网管采集信息处理

  • 为实现统一网管信息的展现,需通过云平台采集服务器信息
  • 私有云平台,通过系统统一接口将采集数据上传至网管平台

整体解决方案

H 省移动公司私有云管理平台,通过部署一套云平台,统一运营、各资源池分布部署管理。针对网管、安全、企业信息化等多个部门分区域建立三个机房。共管理物理机320台,小型机30台(中实),虚拟机463台。

运营商私有云01

在云化资源动态使用的创新实践中,结合本省应用的实际特点,共使用了四种技术解决方案:一是基于负载性能调度方案;二是基于规划扩容调度方案,三是基于业务申请调度方案,四是基于任务时间调度方案。

新的技术技术解决方案主要针对应用与资源绑定及超配资源浪费两点不足进行重构,重点解决了资源使用效率及服务高可用两方面难题。

运营商私有云02

支持业务或用户定义高、中、低或更多不同优先级

支持为每个业务或用户定义虚拟机,块存储和网络IP等不同的资源分配额度,当用户请求超出最大额度时启动相应的分配处理策略

资源分配引擎优先满足高优先级请求,同时根据业务的SLA定义选择资源池中对应服务级别的资源。

运营商私有云03

运营商私有云04

应用效果

对资源池动态使用前后的效率对比数据发现,云资源动态调度技术最直观的效益就是,提高资源利用率平均节省资源使用达50%,维护成本基本几乎无增加,而且应用及平台改造都为一次性投入成本。

从技术经济角度来看,随着云计算技术的不断成熟和发展,云平台的技术也在不断标准化和普适化,更多的应用软件厂商也都在将自己的应用可“云化”程度作为发展方向,每个应用软件只需遵循行业相关技术标准开发软件或是适当改造自身的软件之后,都可以快速地实现和云计算、云平台技术的对接和协同工作,同时还降低了应用和物理资源的耦合度,大大提高了应用的移植性。

表现有以下几点

  1. 优化业务流程,提高业务灵活性;
  2. 应用系统业务服务实现SLA,分级分域提供服务资源;
  3. 应用系统资源实现动态伸缩,随时满足业务需求;
  4. 自动化部署,快速实现应用上线,大幅缩减GoToMarket时间;
  5. 共享资源池打破应用孤岛,实现异地资源池统一管理,提供资源整体利用率;
  6. 减少不同应用系统的硬件盲目扩容带来的资源浪费;
  7. 通过云平台对资源的维护更灵活高效,减少维护人员的工作量;
  8. 减少对Scale Up的IOE架构依赖,使用x86架构的设备更易弹性拓展,也能大幅减低硬件成本和运维成本;