智能数据中心  
 
  政策法规
 
智慧数据中心
/    2019-05-09    2019-05-09    被访问次

  数据中心是企业IT系统的核心资产,也是企业IT部门年度预算相当部分的应用所在。随着公有云和混合云的兴起,越来越多的企业IT部门已经、正在或计划将部分业务迁移上去。不论企业自有数据中心、混合云或公有云,IT部门普遍的期望是在安全、合规的前提下,尽量提高数据中心的可用性、效率、灵活性、降低采购和维护成本。但是,企业IT部门常常局限于只在IT系统内部深度挖掘潜能,而未曾结合供电、制冷、场地等基础设施,集成数据、综合分析、从更高抽象层次上发现更大的改进运维管理的空间。

  本文就是从结合企业数据中心IT系统和基础设施系统的角度出发,沿着IT人员容易遗漏的角度,切入数据中心 运维管理的问题空间,并介绍VMware中国研发中心在智慧数据中心领域的尝试和探索。

  企业数据中心的运维管理是个大题目,从规划构建到日常运维,参与的部门和人员非常复杂。我们这里主要关注的是构建之后,日常运维中会遇到的问题。粗粗地看,与数据中心日常运维比较相关的主要是IT部门(负责机架内部的服务器、存储、网络、安全、审计等核心资产)和基础设施部门(负责机架外部提供支撑服务的供电、制冷、环境控制、楼宇、园区保安等系统的管理)。一般讲来,IT部门和基础设施系统是分开管理,相关人员也是分属不同的部门。如果企业把数据中心里的部分业务外包,如托管数据中心或公有云,那么他们甚至会在不同的城市、国家工作,并且服务于不同的公司。

  我们看到企业数据中心的IT和基础设施团队之间的沟通和合作有明显的距离。比如企业的某业务部门需要上线某应用,IT部门根据需求规划容量、采购了若干服务器,可是基础设施部门反馈说虽然机房里有足够的机架位置,但是供电、制冷、网络端口里某方面有限制,导致无法迅速上线,需要重新规划、或者等待基础设施扩容。

  因此如何将IT系统和基础设施系统和团队整合起来高效运作,就成为讨论企业数据中心发展的热门话题。

  Uptime Institute在2017年2月的《数据中心行业调查报告》中预测:IT和基础设施的角色将会结合、演进并有效管理云和托管服务商。公司IT系统可持续发展的势头将更强。数据中心管理将会是数据驱动的、云化的。数据中心经理和高管的技能必须提升,以应用分析、数据驱动的模型和管理现有资产的DCIM(数据中心基础设施管理系统)。

  Gartner在2017年12月发布的《数据中心基础设施管理工具市场指引》中也提到:展望未来,DCIM的客户将会寻找人工智能化IT运维和IT管理工具之间绝佳的集成,以及追踪和可视化远程资产的增强能力。

  基于在新建数据中心内采用和现有数据中心内的装机量,IDC预计2016年-2021年全球DCIM市场综合年度增长率在12.2%。

  AFCOM在2018年3月公布的《数据中心行业趋势调查报告》中指出:12个月内74%的受访公司很有可能会部署DCIM,大多数受访者认为物联网和智能传感器在数据中心内将扮演重要角色,68%的受访者认为DCIM和云/虚拟化技术将会更加深度的集成。

  物联网可以粗略地根据服务客户对象的类型,划分为消费物联网(Consumer IoT)和企业物联网(Enterprise IoT)。企业物联网根据不同行业特征,还有若干细分,其中最主要的是工业物联网(Industrial IoT)。所以,有时不假区别地用工业物联网指代企业物联网。

  在企业物联网的范畴里,从数据中心的角度来看,绝大多数场景内的资产、设备、传感器、执行器都处于数据中心的外部,比如:工厂、街道、车辆、医院、小区等,相对应的物联网场景被定义为智慧工厂、智慧城市、车联网、智慧医疗、智慧园区等。而数据中心内部,其实同样存在大量资产、设备、传感器,管理它们的就是数据中心基础设施管理系统(DCIM)和其它辅助软件(如CMDB)。企业数据中心的管理部门就称它为内部物联网。

  从行业的角度讲,物联网是企业广泛进行数字化转型的必要手段。从系统的角度讲,物联网是进行大数据分析和进一步机器学习与深度学习的基础。对于企业数据中心的内部物联网来说,也是如此。只有从较细粒度上广泛采集了数据中心内部的各种基础设施设备的运行数据,例如供电、制冷、湿度、温度等信息,结合机架内IT系统上已经数字化的IT运维信息,才有可能充分利用大数据和机器学习的方法,从整体上发现提高效率、降低成本、排除故障、预测失效等题目的广泛有效且实用的方法。

  从行业应用实践的角度看,考虑到安全性、有效性和可靠性等原因,企业实际上大多把物联网的使用局限在“只读不回”类型的操作上。也就是主要从生产运行环境中读取数据,进行就地或远程处理和分析,产生足量的信息和知识,为运维管理操作提供建议。整个过程并非完全自动化。

  从企业数据中心内部物联网的场景看,行业内普遍也是如此现象。但是有些领先的企业已经开始了“回写”式的操作,比如应用机器人或机器臂的实践。数据中心内机器人的主要作用是数据采集、远程诊断、巡逻检查等安全相关的用途,而机器臂主要应用在超大规模数据中心内更换失效部件的用途上。

  全球来讲,最著名的智慧数据中心的成功案例是Google节省制冷能源的实践。2014年Google通过物联网和机器学习的方法寻找优化制冷系统能源消耗的方法,节省了10%的制冷消耗。2016年又结合DeepMind的深度学习技术,进一步优化制冷系统,实现节能40%,占数据中心总能源消耗的15%,每年节省费用数十亿美元。

  每年数据中心消耗的能源占全球能耗的2%,而数据中心的PUE(能源有效性指数)普遍只在2左右。也就是说一半的能源用来支撑非IT设备的运行,而其中很大一部分用来支持制冷系统。另一方面,根据Uptime Institute的调查报告和我们对最近5年领先公有云的公开故障报告分析,大约70%的原因来源于人为失误。

  所以如何尽量为企业数据中心节省能源、减少故障和人为失误、提高可用性和效率、提高集成度和自动化、智能化程度,就是我们在IT系统和基础设施系统方面探索的要点。返回搜狐,查看更多

 楼市焦点
 
 行业新闻
 
 热点信息
 
 
 
| 广告服务 | 合作伙伴 | 客服中心 | 诚征英才 | 联系我们 | 网站地图 | 版权说明
Copyright 2018 版权所有 www.g22.com