在今天的全球经济中,企业要面临全球性运作的挑战,24x7x365的业务模式,以及处理电子商务业务,对于连续及不受干扰地存取信息的需求可以是成功与失败的关键。现在,网络可用性和数据存取能力已经成为整个企业价值链的一部分,数据中心已成为企业日常运营的核心与灵魂。对许多公司来说,数据中心已经迅速地成为最关键的资产。
对数据中心的依赖促使企业采用大量设备和策略,促使普通的数据中心成为一个混合了新、老设备的复杂环境。一个现代化的数据中心里同时拥有运行不同的操作系统的入门级和企业级服务器、防火墙、网关、交换机、路由器、环境监控系统、楼宇自动化系统以及不间断电源等,这种情况并不鲜见。而在今天的管理系统环境下,这一清单还在不断扩展。具有讽刺意味的是,每一次提供更快、更普遍地存取企业信息资源,提高工作时间,采用更短恢复窗口的灾难恢复计划的努力,实际上都增加了复杂性,降低了使用率。
Infonetics研究公司在一份对财富100和财富500公司的研究报告中称,普通公司仅5.5个小时的网络停机时间可以造成近4百万收入与生产率损失。
这一研究最近被一家主要在线拍卖门户的网络事故证实,该公司网站停机几个小时,造成超过5百万美元的收入损失,市场份额下降10%。 |
由于具有这些复杂性,需要前瞻性的网络管理与系统管理来完成维护网络的运行、防止系统当机的任务,至少要将当机时间和频率降低到最小程度。因此,对信息技术经理来说,从任何地点、在任何时间对其管理的基础架构进行快速、安全的存取就成为关键需求。要做到这一点,信息技术经理需要有能力管理所有设备,无论它们位于何处。
所幸的是,有许多解决方案可用于现在数据中心的远程管理和控制。在实施远程存取和管理时,必须有一个综合的方案,而不只是实施每日的存取、运转和维护。由于多家供应商的新、老异种设备混杂存在,远程管理解决方案应该尽量保持平台、操作系统和供应商的独立性。最后,信息技术经理和信息技术人员都没有足够的时间学习新的、复杂的专有远程管理工具。由于这一原因,任何远程管理实施方法都应当提供人们熟悉的管理界面,以及直观的交互式操作方法。
为拿出一个有效的远程管理规划,已经在串行或 KVM [1] 控制管理架构上投入巨资的组织必须对一系列问题作出判断:需要管理哪些设备,何时管理,如何管理,使用的工具,所需支持硬件和配置,网络与安全考虑以及补救措施等。
本文将验证实施一个远程存取和管理现代数据中心的有效解决方案的各个相关要素,同时会描述应该考虑的各种因素 ,以及可以集成到整体规划中的各种远程管理解决方案,并保证不影响数据中心的安全性、可用性、维护性与存取能力。最后将讨论 Lantronix 的远程管理解决方案如何协助信息技术经理成功实施远程管理网络基础架构设备。
今天,全球化数字经济的持续竞争需要永远在线式的零延迟信息存取,管理一个数据中心的复杂性以空前惊人的速度在增长。现代数据中心已经不再是放在某个建筑地下室的几台设备,而是包括分布在多个地点的异种环境,不断增加的许多可管理设备。并且这种趋势还在年复一年地持续发展,使局面变得愈加复杂。
表1列出了几种在今天数据中心中常见的设备。虽然这并不是完整清单,但可以从中窥见一点,即管理工具要具备强大的功能才能完全覆盖所有设备。随着数据中心设备规模的扩展,网络“云”也较以往更快速地膨胀,成为一个数据中心的生态系统。伴随增长的是“单点失效”(single-point-of-failure)成为现实,即数据中心里任何设备当机都会造成整个业务的中断。
服务器 |
· 多操作系统(Microsoft Windows、Linux、Unix)
· 应用程序(Web、e-mail、数据库和电子商务)
· 存储(网络文件服务器,SAN)
物理外形(例如:塔式、机架式、刀片) |
网络安全设备 |
· 虚拟专用网(VPN)
· 防火墙
· 代理服务器
认证服务器 |
可管理的交换机与集线器(如:10/100BT、GbE、ATM) |
· 10/100 Mbps设备
· 千兆以太网
异步传输模式(ATM)设备 |
中等的、高端的、多千兆位路由器 |
|
电信设备 |
· Telco 交换机、光纤多路复用器、微波终端
· 信息技术、X-connect、PBX、DSL设备、分布式安全设备
· T-1终端、线路测试设备、农村射频终端
· 射频测试设备
语音邮件设备 |
其它硬件
|
· 不间断电源
· 建筑门禁系统
· 环境控制系统
特殊行业监控与控制设备,如医院的病人病情监控系统 |
一个完整的数据中心安全解决方案包括:认证、授权、数据隐私以及周边安全。然而,在提供加密、认证、目录、网络以及其它安全组件时存在着许多重大的挑战,这些是整个安全数据中心架构需要考虑的因素。在业界争相开发能提供保护功能的技术时,信息技术经理仍然必须疲于应付每日的工作,以减少他们的网络风险。
在考虑远程管理解决方案时,必须仔细设计到外部网络的连接路径以及数据中心内部的每个功能(如网关或广域网的边界、核心、分布与存取等),使得非授权用户无法闯入网络。
信息技术经理不仅要面对日益增长的工作压力,同时其雇员数量和预算也不断受到审核和紧缩的威胁。在今天少花钱多办事的新形势下,信息技术部门一直在缩减规模,人手不足却要应付更大工作量,数据中心经理们必须评估那些能够集中地管理数据中心的工具。毕竟信息技术经理的职责关乎企业的生命,信息技术经理要在信息技术人员日见减少的情况下,仍然具备管理本地与远程服务器和其它信息技术设备接入的能力,这就要求有一种中心化的管理方式。可喜的是,现在有多种可行的解决方案,可以实施本地数据中心的集中管理,您可用较小的投入获得更高的产出。
随着网络规模和范围的持续扩大,更多应用程序与业务的集成需求使这种状况变得复杂。对网络性能与可用性的要求在日益增长。应用与网络的投资回报(ROI)已经被置于更重要的地位,同时,延长信息技术投资寿命的压力也明显增加。最重要的是,信息技术经理必须应付技术人员有限和预算被削减的局面,努力做到“事半功倍”。
一个可以产生显著节约效果的地方是强化基础架构,而一种成效显著的解决方案就是远程管理。远程管理采用中心式配置的人员与应用程序,从一个地点监控、管理与响应分布全球的网络与系统。通过这些工具,信息技术经理可以在很短时间里对全球分散式网络架构上的问题作出响应,可以在任何时间从全球任何地点完成修正工作,从而也解决了可能妨碍系统有效管理的人员短缺问题。
表2 远程管理的重要优势一览表。
优势 |
说明 |
中心化管理一个全球分散的网络架构。 |
· 通知设备的当前状况,无论它们位于何处。
· 消除管理“盲点”,并对不合理的设备配置进行补偿。
· 授权用户使用加密存取。
· 较低的整体网络管理成本。 |
真正前瞻式(预测)管理。 |
· 减少决策时间。
· 确保与企业网络设备的连接,即使网络当机。
· 减少当机时间(更快速的响应)。
· 更低的维护费用。
· 提高客户满意度和生产率。 |
大幅降低服务/维护成本与时间。 |
· 用电子邮件通知和告警,提供即时响应。
· 远程诊断与解决问题。
· 可以在任何时间远程管理和查找故障(下班后、周末或节假日)无需向现场派遣技术人员。
· 将存取生产/企业网络的需求减至最小。
· 资产和人员的更佳使用。 |
· 为增加收入和提高竞争能力提供完整的解决方案。 |
· 业务过程简化。
· 促使业务运作更高效。
· 安全地远程管理机架上的所有设备。 |
远程管理概念
远程管理有两种实施方式:in-band(通道内)或out-of-band(通道外),采用哪种方式要根据远程管理的设备以及被管理设备的性能。
In-band用于传送简单网络管理协议(SNMP)和其它管理信息的数据网络。只有当网络可用且正常运行时它才有效。如果网络结点失效或发生协议堆栈不稳定的情况,in-band管理工具就失去了作用。
今天的业务都具有关键任务的特性,当资产失去了网络连接或网络、服务器当机时,需要有一种替代的(冗余的)管理途径。这就是out-of-band管理。
与in-band管理不同的是,out-of-band管理不依赖网络或服务器的可用性来管理服务器或网络架构。因此,只有out-of-band管理系统才能应付许多基础架构停机的情况。
以下列出了一些可能用到out-of-band管理的情况:
l 服务器断电。
l 操作系统不稳定或被锁定。
l BIOS 正在进行上电自检。
l 服务器挂起或运行不正常。
l 服务器资源非常匮乏,造成网络驱动速度缓慢,或无法响应请求。
l 网卡不正常或出现故障。
l 交换机或路由器端口故障。
l 正在运行的操作系统部件不支持in-band通信,如Loader或Recovery Console(系统恢复控制台)。
l 服务器尚未完全初始化。
当确定哪些设备需要作远程管理时,信息技术经理要面对各种管理存取点。这些管理点包括控制台服务器的串行端口、分布式以太网管理端口、KVM 端口和交换机,以及智能UPS设备的电源端口和提供远程功能(如计算机的上电、断电或复位等)的电源开关。
一旦确认了所有将被管理的存取点,下一步就是考虑一些特殊的要素,它们在规划一个满足需求的安全远程管理方案过程中至关重要。
世界永远处于变化之中,数据中心也不例外。既然网络肯定要增长,所选择的远程管理方案也要随组织的增长而增长。选择的系统可以跟随业务的发展而适应增加的服务器和用户,并且能感知增加远程用户时的整体成本(如增加远程客户认证的附加成本等)。当数据中心扩展时,你的远程管理系统也可以随之增长,你必须对此抱有充分的信心,因为它基于现有的基础架构。
鉴于数据中心将逐步发展和扩展,远程管理解决方案必须设计为能保护您当初在时间及金钱上的投资。既然重新配置可能涉及范围问题,如果选择的远程管理产品有最大的灵活性的话,信息技术员工的工作就会轻松得多。这种灵活性还可以最大限度地利用信息技术资源,避免使用受制于一个供应商上的专有系统,或者增加数据中心部署与维护的隐含成本。
如果数据中心使用了多种服务器和操作系统,你的远程管理解决方案就应该提供对多平台的控制能力。即使现在的数据中心只使用了一种计算机或操作系统(如,运行微软Windows Server的PC机),但网络早晚会包括多平台、服务器、设备和操作系统等。所有远程管理客户均应与操作系统无关,并使用本地管理界面,这样便无需信息技术人员学习使用其它管理界面。
当今数据无计划增长的特性使操作系统的补丁、升级与被管理系统的安全性成为一个相当大的负担,特别是当这些变化频繁时。此外,这些补丁和升级一般要求与远程系统的加密连接与交互。基于这一趋势,有些解决方案供应商声称它们的远程管理解决方案是“安全”的。而事实则正相反,这些产品实际上只支持某些安全特性。例如,有些号称“安全”的控制台服务器只支持SecureShell(SSH)连接。
仅支持SSH或SSL连接都不能算是一种安全的解决方案。要成为一种真正安全的方案,远程管理系统至少应支持以下一种或几种功能:
l 远程认证拨入用户服务(RADIUS)
l 轻型目录存取协议(LDAP)
l 防止侵害模式(可编程对端口扫描和 ping 进行响应)
l IP 与防火墙包过滤
l 双因素认证
l IP Security (IPSEC)隧道
l 综合数据日志与事件通知功能
l 支持安全策略所需其它功能
如果一个设备声称支持这些功能,知道它们的实施方法也同样重要。例如,只连接到一个使用SSH的客户端并不表示数据已经适当加密,足够安全。因此,检查设备支持的加密算法也很重要。
在保护服务器方面,软件的修补(或补丁管理)对防止公开的袭击非常重要,但选择一种能提供授权(防止非法存取)与加密(保护传输中的数据)的健壮方案的管理设备才是至关重要的。
支持故障管理的远程管理设备可以使信息技术经理发现被管理设备、网络和网络运行中的问题。信息技术经理根据这些信息判定故障原因,并采取相应措施。
故障管理提供以下机制:
l 通过电子邮件和/或 SNMP(自动)报告故障的出现
l 记录日志以及事件/端口缓冲状况
l 进行诊断检测
l 纠正问题(可能自动地)
当涉及如何管理远程设备的问题时,信息技术经理有许多需要考虑的要点。在过去,只需在服务器上远行一个单一的软件解决方案,即可满足监控系统的需求,但今天面临的威胁则需要一个全新层次的保护方案。例如,软件解决方案可以确认服务器的运行以及信息技术人员的存取。然而,一个简单的软件崩溃或更改服务器 IP 地址的袭击就能使软件方案完全无用。即使象改变BIOS系统设置这样简单的任务也无法用软件监控,因为在修改这些设置时,软件监控器还没有运行。
所幸的是,信息技术经理们还有许多可选方案,可以用于系统安全与远程管理,以及各种存取点的管理。
远程管理的软件解决方案是一种普通而具性价比的管理选择方案,但也要考虑到它的局限性。例如,这些方案很难缩放,只在服务器运行时才有用(并且消耗系统资源),无法为服务器功能(BIOS,openboot)提供低层次通路,一般只支持单一操作系统。当然,这些解决方案不能为数据中心的非服务器设施提供管理功能。
附加服务器硬件是另一种常见的远程服务器管理方法,如插 PCI 卡和主板上的网卡(LOM)。与远程管理软件方案相同,这些方法一般都具备高干扰性,需要服务器和网络均正常运行才能提供管理功能。此外,采用插卡方案需要关掉服务器,打开机箱才能完成安装、更换和维护工作。
控制台服务器是一个独立于网络的硬件设备,它可以同时为多台服务器提供低层次的冗余管理通路,方法是连接到它们的out-of-band串行口。它可以连续存取远程设备,即使网络出现无法工作的情况。通过网络或调制解调器,用串行口可以实施从任何位置到任何设备的安全的本地或远程存取。
控制台服务器具有下几点关键优势
l 立即存取所有设备,包括无网络端口的设备
l 无需派遣技术人员即可查明问题原因
l 单一地点管理多个场所
l 管理无人值守场所设备的能力
l 最小的停机时间
l 远程解决问题
l 支持各种安全特性,如加密、认证、SSH以及入侵检测
l 对外部网络和黑客的开放程度低
l 无需 VPN 连接。
一台 KVM 切换器可以用一套键盘、监视器和鼠标来控制多台计算机服务器,减少由于多个冗余输入/输出(I/O)设备导致的空间占用和干扰状况。只需一台终端,信息技术经理们就可以用 KVM 存取整个机架或整个房间的服务器。
在多服务器与其它设备的联合控制方面,KVM切换器能提供许多优势。这些优势包括强大的引导前功能,如编辑服务器CMOS设置以及电源循环、BIOS级使用,以及从一台终端控制多个服务器机架。
一种新型非干扰式KVM切换器可以实施通过IP的远程存取。这些KVM切换器可以作用于网络基础架构,使增加用户如增加IP地址一样简单。KVM-over-IP切换器还消除了模拟设备的距离限制。通过使用IP网络的供电和无处不在的特性,无论用户(或信息技术人员)身在何处,都可以控制数据中心的各种设备。
在考虑采购任何远程管理解决方案前,应仔细审查下列表中各项内容:
l 该远程管理系统可以支持所有设备的远程管理(服务器、KVM、SNMP)吗?
l 该远程管理系统需要学习新的管理界面或工具吗 (或它可以远程运行我的“本地管理”界面吗)?
l 如果远程管理系统失效,它会影响我的系统吗 (会导致我的服务器或其它设备当机吗)?
l 远程管理系统可以在不影响被管理服务器和设备运行的情况下,进行升级、维护、更换或维修吗?
l 远程管理系统或其组成部分的失效如何影响你控制服务器与设备的能力?
l 远程管理客户端的操作系统独立性如何? (我可以在任何操作系统上运行远程客户端吗?)
l 远程客户需要专用软件吗? (我需要购买和/或安装专用客户端软件吗?)
l 服务器当机、崩溃或无响应时,远程管理解决方案仍能提供可靠的存取吗?
l 无论在任何服务器类型和操作系统条件下,远程管理系统都能提供一致的界面和功能吗?
l 若出现服务器崩溃(蓝屏)或未授权登录尝试,远程管理系统能提供监控并通过电子邮件发出通知吗?
l 远程管理系统的缩放性如何? (可以不显著增加复杂性和成本条件下,支持在更多的场所管理更多的设备吗?)
l 我的远程管理系统支持多少个并发用户?
l 远程管理系统同时提供 in-band 和 out-of-band 存取功能很重要吗? (我需要在网络和/或服务器当机时使用系统吗?)
l 远程管理系统允许远程维护吗? (该解决方案支持远程固件升级等功能吗?)
l 初始设置是否具干扰性、复杂性? (我必须关掉现有服务器或网络才能安装吗?)
l 远程管理系统与现有管理工具的兼容性如何? (与系统 SNMP 兼容吗,与现有 KVM 切换器兼容吗?)
l 远程管理系统能提供对服务器和设备的低层存取吗? (系统可以提供 BIOS 级、openboot 等存取吗?)
l 还需要考虑哪些与远程管理解决方案相关的隐含成本? (超过 5 个用户的客户软件需要许可证吗?)
l KVM 切换方案能提供用户、管理员和服务器的扩展选择吗?
l 只需要本地机架存取吗?还需要控制离数据中心 100 米甚至几百里外的服务器和设备吗?
l 电缆长度限度是多少?
l 需要多少接线工作?
l 远程管理系统有特殊认证(NEBS)或特殊电源要求(AC、DC、双/冗余 AC 或 DC 电源)吗?
l 需要哪种类型的介质(五类线、特殊加密锁、同轴电缆)?
l 远程解决方案容易部署吗?
l 远程管理方案在本地和远程的多平台能力如何?
l 对非 PC 环境,远程 KVM 解决方案提供键盘映射功能吗?或者允许你使用本地键盘吗?
l 如果远程管理方案的某个部分当机,可以提供冗余吗?
l 你的远程 KVM 解决方案允许使用现有的本地 KVM 切换器吗?
l 你的远程管理解决方案提供 in-band 管理选项吗?
l 你的电源循环需要和选择?
l 你期望用哪种方式存取数据中心设备,TCP/IP 连接或直接模拟连接,亦或两者兼用? |
|