戏说企业成长服务器管理之三国篇(1)

上一篇 / 下一篇  2008-03-25 04:41:44

第一回:作网管刘备择业,求计谋孔明出山

刘备是蜀都大学应届毕业的硕士生,专攻网络工程专业。毕业后,刘备在一个偏远的郊区有一家从事织席子,做草鞋生意的小型企业——蜀都公司找了份工作,任职网管员。

领导希望建设单位网络,让单位网络和外网接轨,从网络上引进新思路,拓展新市场,发展新业务,于是,领导把网络建设这一工作交给了刘备。

一个好汉三个帮,刘备请来了自己的大学同学关羽、张飞和徐庶,几个人经过一整夜的讨论,初步构建了单位的内网建设方案,其他方面都差不多了,就差服务器相关的内容了,可就在这个时候,徐庶的母亲突然的了重病,需要徐庶回家照看,临走前,徐庶向刘备推荐了自己的大师兄——诸葛亮。

刘备找到了诸葛亮,说明了来意,一开始诸葛亮觉得这个事情太小,不想去,但是架不住刘备软磨硬泡的请诸葛亮在“茅庐酒楼”喝了三次酒,面子上过意不去,终于答应帮助刘备。


第二回:定方针诸葛献计,解疑惑关张拜服

关羽和张飞看到诸葛亮本人的时候,兄弟二人不禁面面相觑,本以为徐原直力荐之人怎么样也应该是一幅专家做派,怎料走进一个年纪轻轻的小后生来。想到自己兄弟三人也是硕士毕业,关张兄弟不禁对诸葛亮产生了怀疑。

孔明一见二人表情,直到二人的心理,但是先没有说明。转过头来,开始向刘关张兄弟三人说起了服务器方案搭建的注意事项。

构建服务器方案的思路

构建服务器应用方案,除了需要考虑方案在性价比、稳定性、扩展性、可靠性方面的方案自身技术问题外,应用环境、实际应用需求、方案的可实施性、方案的投入产出比、方案实施后的易于管理及维护问题、以及方案是否能够得到目标用户的接受等外围问题也必须涉及到。如果不能充分考虑这些问题,做出来的方案很可能就没有可应用的市场空间;从性价比上来看根本就不能实施,得不到用户的认可和接受;或者方案本身的产品搭配和技术配合等不协调,达不到理想的应用要求。因此,如果没能完整的考虑到方案应用的内部技术和外围问题,那么所构建的方案就一定不是一个合格的方案。可以说“应用解决方案是技术实力与管理智慧的高度融合”,是个很考察方案作者功力的习题。

从方案本身的科学性和合理性来看,主要从性价比、稳定性、扩展性、可靠性这几个方面来考察。例如构建Web服务器,他的应用特点是涉及到网络连接及数据存储。因为Web服务器还需考虑网络环境下负载的情况,因此在这个方案的构建上,必须考虑到良好的网络连通性和冗余架构。而Mail服务器则更多的突显出一个信息并发数问题,因此,对构建Mail服务器解决方案来说,需要充分考虑CPU及内存大小,以保证访问速度。而作为DNS解析服务器的构建方案,则需要考虑方案构建的稳定性及连通性。

从外围因素具体来说,每一个服务器应用解决方案,都是从解决企业用户在具体应用中的某个或某些具体问题而提出的。从应用角度来说,这个方案是有市场的,是用户所迫切需要的,这就是构建一个服务器应用解决方案的首要考虑因素――方案是否有“用武之地”。

其次,方案还需要考虑实施成本、以及投入产出比。对于用户来说,他们采用解决方案的根本目的,就是借助科技的力量带来更大的企业效益。这个效益不仅包括利用搭建好的方案平台能够有效促升企业的收益、提升企业知名度、加强企业竞争力,从而助力企业发展;而更直接增加效益的一个方面,就是方案实施的成本是否具有最高性价比优势。所以,在构建方案时,必须在充分考虑搭建成本的基础上,最大限度的利用方案平台产生的作用能够为企业带来更多的利益。只有这样的方案,才能带来更多的价值,得到更加广泛的普及应用。再次,一个服务器应用解决方案是否优秀,还要看他有没有创新性和闪光点,这是直接展现方案作者在技术功力基础之上的智慧体现。

总结:由此可见,一个好的服务器应用方案,需要从以下几点进行综合考虑。

可行性(Possibility)——该方案目前或者未来2、3年内是否有实现的可能;

实用性(Usefulness)——该方案能否为企业的信息化进程带来直接或间接的帮助;

创新性(Innovation)——该方案是否具备新颖的思路和方法

普及性(Popularization)——该方案的性价比能否为大部分企业所接受;

易用性(Easy-to-use)——该方案的使用和维护是否足够简便易行。

孔明说到这里,急性子的张飞大喊起来:“这些理论我们也知道,俺大哥请你来不是让你讲理论的,有本事拿出几个方案来看看!”

孔明微微一笑,说道:“光说方案又有何难?天下英雄何其多也?最近举办的华硕服务器方案大赛上有很多好的方案,我们可以借鉴一下。可是你们想过没有?方案落实了以后,服务器的运行维护工作还是我们来做,换句话说,服务器方案是让服务器为单位更好的服务,而我们是要为服务器作出服务。下面我就针对几个常见的简单方案来谈一下方案建设以及运维注意事项。”

服务器的稳定性

对于中小企业来说,一般的网络结构可以分为4层:内部应用层、核心数据层、外部访问层以及网络管理层。每个层次中都需要有服务器支持客户端的持续访问,它们可能包括:

◆内部应用层:DNSServer、ActiveDirectoryServer、FilesServer、DHCPServer、PrintServer等;

◆核心数据层:内部WebServer、ERPServer、DatabaseServer、FilesBackupServer等;

◆外部访问层:WebServer、VPNServer、MailServer、FtpServer、软件防火墙等;

◆网络管理层:SystemsManagementServer、VirusScanServer、UpdateServices、InternetAuthenticationServer等;

当然,这些还不包括企业在分支机构中有可能部署的大量重复性服务设备,在网络业务繁忙的时候,这些服务器的稳定性和安全性可谓重中之重。很多系统工程师压力非常之大,不论是公司高层还是业务人员都要求IT环境下的一切都能“正常运转”。例如:随时随地访问信息资料并收发电子邮件;与内部团队成员及外部合作伙伴实现即时协作;开辟更多门户,召开更多视频会议,并提供其它协作工具,允许以自助方式调用基础架构服务。虽然很多网管员已经算是尽职尽责,但服务无法访问的现象普遍存在。(如图1)

498)this.style.width=498;'onmousewheel='javascript.:returnbig(this)'src="/files/uploadimg/20070717/1124560.jpg">图1:服务无法访问的几种情况

所以,服务器的稳定性将是我们日常管理中最基本的要素。事实上,服务器的稳定性就是要将平均无故障时间(MTBF,TimeBetweenFailure)尽可能地延长。这里面包括硬件的稳定,如:冗余电源、可预报的硬盘和风扇故障以及RAID(独立磁盘冗余阵列)系统等,也包括应用服务的优化和管理。我们举三个典型的应用服务器(Mailserver、PrintServer、DNSServer)作为引子,希望对您在应用服务器管理方面有所帮助。

典型应用服务器部署与管理

(一)邮件服务器部署与管理

1.明确需求

企业在对邮件系统组建的前夕首先是对企业邮件系统的进行全面的需求分析,如企业现有的人员数量、邮箱空间的大小、是否使用多域名解析等等。最主要的是操作系统和邮件系统的选择,比如在LINXU操作系统下大家熟知的QmailorPostfix,Qmail安装简单,配置方便,还有很多工具可以使用,比如说Vpopmail,Sqwebmail等,在这些方面,Postfix显得很不尽人意。但是实际应用中,Postfix却在大容量邮件系统中显示出极大的优越性。

2.服务器配置的选择

当然很多的中小企业在筹建邮件系统时更注重易用性和通用性,正是这些因素的影响,微软的ExchangeServer现如今可谓是尽显风光。如果要部署ExchangeServer2007,必须要做好如下准备:

◆处理器

IntelPentium或兼容的800MHz或更快的32位处理器,当然这是最低配置,在生产网络中服务器的工作效率极低。所以对邮件服务器的性能要求很高,需要配备支持Intel64位扩展内存技术(IntelEM64T)的基于x64体系结构的处理器,或者带有可支持AMD64平台的AMD64位处理器且基于x64体系结构的计算机。

需要注意:IntelItanium处理器无法运行基于x64的WindowsServer2003版本。因此,Itanium处理器不能与Exchange2007一起使用。还有就是多核处理器,多家机构对双核处理器的大量测试表明,使用多核处理器技术时ExchangeServer的性能有极大提高。

◆内存

Exchange2007最小内存需求为2GB的RAM,以及每个邮箱5MB的RAM,如果在4个存储组的基础上设计服务器,需要为每一个存储组提供至少512MB的RAM。除此以外,还应考虑服务器将支持的最大内存模块大小。通常,内存模块越大,价格越高。例如,两个1GB的DDRSDRAM内存模块通常比一个2GB的DDRSDRAM内存模块费用低很多。为了确保最大内存模块大小能够满足Exchange2007的目标内存要求,可能有必要投入更多的资金购买更紧凑的内存模块,以确保能够满足Exchange2007的内存要求。

◆存储空间

要了解的第一个指标是邮箱大小。通过了解允许一位最终用户在其邮箱上存储的数据量,能够确定在该服务器上可驻留多少位用户。具有足够的容量至关重要。当Exchange数据库磁盘空间耗尽时,数据库将脱机。而事务日志磁盘空间耗尽时,也会导致该存储组中的所有数据库脱机。

3.维护案例

影响邮件服务器无法工作和效能低下的原因有很多,最典型的是邮件数据库错误。邮件服务需要获得数据库的支持,对数据库的依赖非常强,因此,受数据库影响而导致性能故障的比例非常高,据统计,将近27的邮件服务问题是由数据库的运行故障引起的,这些故障有:数据库索引不足、索引统计过期、数据库分段错误或数据库应用设计错误等。其次,影响效能低下的原因有很多是网络瓶颈造成的:网络带宽不足,不能满足大量数据流进出的要求,造成网络拥堵,此外,Web站点和ISP之间防火墙、负载均衡、网关和路由配连接瓶颈也会大大降低网络的传输速度。

在日常维护中,管理员不但要对Exchange服务器的数据库和事务日志多加管理,还要对邮件传输代理队列(MTAQueue)和简单邮件传输协议队列(SMTPQueue)进行优化。我见过很多人在安装的时候“一路回车”,所以在邮件用户增加以后,会感觉到服务器响应缓慢,这个时候就需要将这两个队列分别存储在两个独立的分区内,我在几个工程中,都对服务器改变了存储位置,效果十分明显。

(二)打印服务器部署与管理

1.打印服务器发布问题

如果在网络中增加打印服务器,则打印机将变成网络中的一个自主节点,所有接入网络的计算机都可以访问并使用打印机,而无需任何中间环节。但是在用户较多的网络中,打印服务器的定位问题确十分困难,需要每个客户端手工添加打印机位置,然后安装虚拟的驱动程序。当然,很多对ActiveDirectory熟悉的管理员都会用组策略发布打印服务器。

“打印管理”可与组策略一起用于自动将打印机连接添加到计算机的“打印机和传真”文件夹。所以,我们可以将打印机添加到ActiveDirectory中的组策略对象(GPO)中,当组策略在客户端计算机上运行时,自动应用打印机连接设置,这称为发布打印机连接。这种安装打印机的方法很管用,如果拥有多台网络打印机或则传统的打印机共存的时候,我们可以按照功能、工作组或部门(例如市场和财务部门)划分的方法,部署到整个网络中去。如果要建立完成的打印机池管理系统,这种方法也很有用。

2.影响打印服务器的因素

我们抛开打印设备本身的损耗问题,影响打印服务器性能主要包含如下几个方面:

◆客户端的数量

网络打印服务器的可能需要一直开放数小时,或者提供“永久在线”服务。由于存在网络延迟的连接,客户端的数量可能比我们预计想象的要多。只要存在过多的客户端连接,打印服务器就可能受资源约束,服务器上的后台打印程序会被各个连接或命名管道占用。

◆打印作业的数量与频率

在为打印服务器挑选网络访问和磁盘配置时,打印作业的数量、大小和频率扮演着重要角色。与少数较大的作业相比,众多较小的作业对磁盘空间的要求有所不同。如果组织总是需要保存已打印的作业,那么在调整硬盘配置大小时,打印作业的数量、大小和频率就是首要的考虑事项。另外,如果客户端提交的打印作业频率较高,应避免内存用尽,否则很有可能出现如图2所示的日志:

◆打印作业的类型

复杂的打印作业(比如:细腻的图形、PDF文件或包含许多字体的文件)会向打印服务器施加额外的CPU负载。

3.对打印服务器的监控

在日常维护中,用户可以利用带引服务器自带的远程管理软件查看网络中打印机、打印服务器、打印作业的状态,及时根据作业情况调整自己的需求,而不是的被动等待。例如在HPWebJetAdmin网络打印管理软件的支持下,网络管理员能够简便安装并可通过标准网络浏览器检索系统打印资源,对打印机进行过程管理,包括批量更改打印机与打印服务器的配置,批量升级打印机或打印服务器的固件,分组管理打印机,调整打印作业等。这样可以减少用户求助呼叫的次数,缩短了网络管理处理员处理打印机相关问题的时间,因此也就简化了维护,进而减少了维护时间。

如果是建立在Windows操作系统下的打印服务器,可以您利用资源工具包中的性能技术器对打印服务器的全面监控。Windows2003引入了13个新的性能计数器,使得管理员可以监视服务器的整体负载以及有关特定打印机的信息。有关对象和基准的更多信息,请参阅Windows2003Server资源工具包中的“性能监视”相关信息。

(三)DNS服务器部署与管理

DNS服务器作为内部网络和外部网络都需要必备的服务资源,在规划与配置上都存需要慎重规划,但很少有管理员仔细的思考DNS服务器的管理问题。在生产网络中,DNS故障众多,这也是活在IE与EMAIL之间的员工抱怨最多的一部分。

1.DNS服务器规划

在网络上规划和配置DNS服务器,需要检查网络的多方因素以及打算为多少用户提供这样的访问。在进行规划时要考虑如下问题:

(1)DNS服务器加载和存放区域的数量;

(2)该服务器为提供服务而加载的每个区域究竟能有多大(即每一个区域文件中资源记录的数量);

(3)DNS服务器需要启用多少个协议接口以侦听和响应外部和内网DNS客户端的请求;

(4)DNS服务器的物理位置

我们一般将DNS服务器放在客户端可集中访问的网络位置。我曾经管理一个超过2万台客户端的教育网,我建议在每个子网上使用一个DNS服务器,然后启用转发缓存功能。使用这样的DNSServer拓扑非常实用,比如某个学校要建立准备配置DNS以支持ActiveDirectory,这样就可以为他们提供很高的自主性。

(5)DNS容错机制

如果有一个可靠的高速链路,那么企业分支网络不必的需要建立自己的DNS服务器。如果在整个企业网络中使用了大量的客户端节点,就需要在首选DNS服务器停止响应时,提供备份和故障转移。对于大多数安装配置来说,为了实现容错,至少应该对每个DNS区域上使用两台服务器计算机。DNS被设计成每个区域有两台服务器,一个是主服务器,另一个是备份或辅助服务器。

另外,如果在较慢链路上进行区域传输和DNS查询通讯的执行效果。尽管DNS在设计上能帮助减少本地子网之间的广播通讯量,但它确实会在服务器和客户端之间产生了一些新的通讯量,尤其是当它在复杂路由的局域网广域网环境中使用的时候。

(6)DNS服务器内存消耗

下面是WindowsDNSServer的典型内存消耗情况

◆在DNS服务器不加载任何区域启动时将使用大约4MB的内存。

◆每次向服务器的增加区域或资源记录时,DNS服务器都要消耗额外的服务器内存。

◆每向服务器区域中增加一个资源记录,将平均使用大约100字节的服务器内存。例如,如果将一个包含1000个资源记录的区域添加到服务器,则需要大约100KB的服务器内存。

2.DNS服务器故障处理工具

很多人在刚刚配置DNS的时候都会遇到问题,由于是手工配置,出错的几率很高。大多数人都会使用Nslookup程序加以调试解决。如果在BIND9下,我们建议你使用DIG程序替代。另外,还有一个开放源代码的工具:dlint。一个配置不完善的DNS服务器存在很大的安全漏洞。dlint可以帮助分析DNS配置文件中的问题,它是一个专门检查DNS配置文件的开放源代码的软件,要运行它系统须安装Perl语言和dig命令。其他工具包括:Traceroute、Variousweb、InterNicWhois、GraphicalTraceroute等。

建立健康的服务器管理模型

在上述3种应用服务器的建立和管理方面,我们只能大体的进行阐述,在管理细节方面还需要管理员收集更多的经验,提高服务监控手段。这样就可以在应用服务器出现问题的时候快速处理,或者及早发现实际和潜在的服务缺陷问题。凭借自修复能力,快速解决实际和潜在的服务缺陷问题,将事故或潜在事故对企业所产生的影响降到最低。

如何才能建立一个健康的应用服务器管理模型呢?我们的经验如下:

◆全面了解应用程序的管理方法,合理部署服务器的服务架构,这都能够让你获得正确的应用程序行为和内部状态触发机制。

◆合理定义事件严重性,在事件确实需要人为干预来修正问题之前,不要将其标识为错误。

◆衡量可用性或性能,当到达定义的标准或阈值被超越时,便生成事件或报警。

◆建立服务器管理知识库和文档,随时记录健康状态、检测情况、验证步骤、诊断步骤和恢复措施。

不要过度使用监控参数,频繁的数据采集也会降低服务器效率。

孔明言罢,刘关张三人皆拜服于地,刘备更是言道:“先生之高才,吾兄弟不及项背也。”


第三回:虚拟化孔明解惑,寻访法管理无忧

自从刘备在诸葛亮的帮助下帮助公司建立了自己的网络,公司的业务突飞猛进,尤其是刘备运用了诸葛亮的服务器维护策略,公司的服务器极少出问题,服务器的利用效率非常的高。网络帮助公司拓宽了眼界,扩展了业务,尤其是东吴,通过网络和蜀都公司建立了业务,大批量的采购蜀都公司生产的“防真菌草药鞋垫”和“防蚊虫避暑凉席”,使得公司从原本的小公司一跃成为了一个中型企业,刘备也从原来的小网管变成了蜀都公司信息中心主任。蜀都公司的CIO决定,建立自己的ERP、CRM等信息化系统。这样,网络升级的工作自然又落到了刘备身上。

这一天,关羽急匆匆的跑过来说到:“大哥,咱们的机房空间不够,放不下新的服务器了!”刘备闻言大惊,急忙问计于诸葛亮,诸葛亮想了想说到:“这有何难,咱们机房里面还有两台标配的四路双核服务器,把这两台服务器升级,加满CPU,作出虚拟化,就没问题了。”刘备听了以后皱了皱眉,说道:“我也听说过虚拟化技术,但是对这个技术还是不太放心。”接下来,刘备说出了自己的疑惑。

惑一:服务器虚拟化就会不会陷入将多个鸡蛋放到一个篮子的尴尬?通过虚拟化,提高了服务器的利用效率和灵活性。但同时也使得单台服务器上运行了多个独立的虚拟机,也就是多个不同的应用。我们原来在一台服务器上只运行一个应用,服务器维护和升级时只会影响单个应用。通过运行虚拟化,我们在维护和升级服务器时会影响该服务器上运行的所有虚拟机和应用。这导致很多人认为的问题:多个虚拟机放置在一台服务器上的“鸡蛋和篮子”问题。

惑二:数据中心虚拟化会不会极大地降低服务器的性能?

惑三:虚拟化由于引入了新的层次,会不会增加数据中心的管理难度?

惑一:鸡蛋和篮子的问题实际上在虚拟化诞生的时候很多厂商就考虑到了,这个问题可以通过两个方面的能力去解决。一是怎么保证虚拟化后的服务器物理硬件维护和升级的问题。二是物理服务器故障时如何保护这些虚拟机的安全。比方说VMware的VMotion的技术,解决了虚拟化后物理服务器的升级和维护问题。通过Vmotion,可以在服务器需要维护升级时动态将虚拟机迁移到其他的物理服务器,通过内存复制技术,确保每台虚拟机任何对外的服务都不发生中断,从而实现了:停物理硬件、不停应用。再比如VMwareHA的功能,这个功能来保护物理服务器的安全。一旦发生物理服务器故障,VMwareHA可以智能检测到这一事件,及时快速地在其他物理服务器上重新启用这些虚拟机,从而保证虚拟机的安全性和可靠性。通过这些辅助技术来保障服务器虚拟化的稳定性。

惑二:虚拟化有两种基本架构:寄居架构和裸金属架构,两种架构如图1所示。寄居架构由于基于传统的操作系统之上,所以性能消耗大,往往会对服务器性能影响很大。而裸金属架构基于专门为虚拟化而设计的虚拟化层而实现,大大降低了虚拟化引入的损耗,可以极大改善虚拟机的性能,是企业级数据中心进行虚拟化的首选架构。

因此,对用户来说,为了满足应用对性能的追求,建议采用企业级虚拟化架构――裸金属架构,这可以尽可能降低数据中心虚拟化对服务器性能的影响,一般影响可以降到10以下。

惑三:在数据中心引入虚拟化确实增加了一个虚拟化层,但并非因此而增加了管理难度。由于虚拟化的管理软件能够很好的管理控制虚拟平台的同时,简化了杂乱的服务器的管理,从而大大降低了大型数据中心的管理复杂性。如VMwareVirtualCenter就是很好的例证。

听完了诸葛亮对问题的分析,刘备对虚拟化的顾虑打消了一多半,这时候站在旁边的关羽说道:“现在大哥是信息中心的主任,不管维护了,可是我们这些做网管员的人还是比较关心维护工作,请问先生对虚拟化的维护应该注意哪些方面?”

孔明一笑,说出了虚拟化维护的注意事项。

首先,虚拟架构已经形成了完善的管理体系,再次,虚拟化架构是一种架构决策,要购买相应的服务。

当然,一旦碰到问题,可以通过各种渠道获得帮助,比如:厂商的知识库、虚拟化社区、厂商的技术支持中心等等。当然,目前的虚拟架构已经是十分成熟和完善,建议在部署时充分考虑用户的实际需求,安装部署完善的体系,比如:VMwareHA、VMotion、DRS等企业级功能来保护您的虚拟架构。如果真发生问题,这些组件可以轻松保护您的虚拟架构,让虚拟机和应用对外服务器不发生中断,从而为管理员赢得时间,这样管理员就可以不慌不忙地耐心寻找问题所在。

总之,进行虚拟化架构决策时充分考虑用户的实际需求,稳定性和可靠性以及方案成熟度是选择虚拟化时考虑的首要因素,因为虚拟化在改变着您的体系架构,架构出了问题,影响将是惨重的;第二,虚拟化的生态系统也是选择虚拟化方案的要素。任何的虚拟化方案都离不开所有厂商的支持,否则将来的维护就会面临极大挑战;第三,考虑性能、扩展性、管理性等,当然也包括本地支持能力。这些都是保证虚拟化架构方案顺利实施的重要保证。


第四回:规模涨企业扩张,看需求集群应对

自从蜀都公司完善了自己的信息化建设,加之市场导向明确,公司在短短的两年内,业务额翻了数番,蜀都从原来的小公司一跃成为了集团化的大型企业。世界各地的订单如同雪片一样扑向了ERP系统,集团的门户网站访问量高峰期达到了万人以上,公司的服务器不能成在如此大的并发需求,公司的网络在一次的迎来了升级。

和上次不一样,由于公司已经成为了一个集团,自然办公环境也从原来的小作坊变成了宽阔的厂区和漂亮的写字楼,机房面积也大大加大了。刘备经过对自己单位网络需求的分析,决定使用服务器集群来应对多用户并发访问。

经过分析,刘备写出了自己对于集群的看法。

目前的计算机集群系统技术按功能结构主要分为:高性能计算集群、负载均衡集群、高可用性集群三类。

◆负载均衡集群(LoadBalanceCluster)使应用程序在计算机群集中尽可能平均地分摊处理负载,该系统适合于大量用户使用同一组应用程序的工况,所以它是运行大型网络应用程序的理想平台,网站和网络增值服务提供商均用该系统来构建Web和Ftp服务器。负载均衡集群的特点是每个节点都可以处理一部分负载,并且可以在节点之间动态分配负载,以实现平衡。在该架构中,集群中的每个节点都是运行单独软件的独立系统,与其它集群相比,负载均衡集群缺少跨节点运行的单并行程序,所以集群系统中的节点没有必要是一致的,集群软件会检查每个节点的当前负载,并确定哪些节点可以接受新的作业,使用特定的算法来分发负载。

高可用性集群(HighAvailableCluster)是指以减少服务中断时间为目的的服务器集群技术,其在为用户提供尽可能快的运行速度和响应速度外,还提供了更高的稳定性。在架构设计中设有主次服务器,次服务器通常是主服务器的镜像,处于对主服务器的活动监控、观察状态。如果主服务器失效,它的替补将在几秒钟或更短时间内接管其职责。因此,对于用户而言,高可用性群集永远不会停机,即使用户正在使用的节点出了故障,运行的应用程序会在几秒之内迁移到另一个节点继续运行,而所有用户只会察觉到响应稍微慢了一点。

在构建计算机集群时,硬件设备的选择要根据客户的具体需求而定,对应不同的应用场景来选择合适的服务器、存储设备和管理软件。在客户对集群系统的应用中,除对集群整体性能的关注外,还同样关注系统的稳定性、扩展性、兼容性和完整性等指标。

稳定性是IT解决方案中的重中之重,集群本身架构的稳定性不仅体现在运行的连续性上,还体现在应用发展的延续性上。集群在内部发生故障或受到外部干扰的时候,应有一定的自恢复能力和故障设备切换能力,这种能力不是靠外部指令来实现,应是靠集群内部系统机制来完成的。双机热备就是高可用性集群的一种应用方式,其是相对于各个应用服务器都访问统一数据库服务器的纯应用服务器集群而言的,双机热备往往是两台服务器同时使用共享的存储设备。在大多数情况下,服务器是采取主、备的运行方式,但也有高端的系统采用并行方式,在双机软件的相互配合下,使系统能在无人值守的情况下提供秒级的故障设备切换功能。另外,也可通过软件方式实现双机热备,不采用共享的存储设备,而是将数据不再单点存储,本机数据可以向多台主机做实时的数据复制,这种方式可节省昂贵的存储设备投资。如曙光DHA双机热备软件就是一种纯软件的高可用集群解决方案,其以曙光服务器为硬件基础,使关键的业务处理能高效连续的进行,当灾难发生时实现服务的无缝切换。在沈阳航空工业学院网络系统改造工程中,曙光就成功的应用该软件将负载均衡集群做成双机热备系统,有效防止了系统因单点故障造成的整体瘫痪,提高了系统稳定性、可靠性和容错能力。

在发展迅速的信息领域,系统的应用环境、硬件和软件都会不断地更新,对应的集群系统应具有良好的可扩展性。扩展性主要体现在资源的可扩展性、应用的可扩展性和技术换代的可扩展性三方面。做为高扩展性的集群系统一方面应有相当的性能余量来承担突发负载,在低负荷时能高速运行、高负荷时稳定运行,同时能不断提升系统性能,有足够的空间来扩展设备;另一方面,服务器系统设计应采用统一的国际标准,能使不同厂商的设备及系统实现完美对接。在集群系统的应用中,曙光公司在方案设计时就会充分考虑到系统的扩展性,使系统能在更大的范围内满足用户需求,最大限度的适应用户需求变化。在用户对系统性能需求增长的时候,系统中的CPU数量、存储设备、IO设备等硬件设备都可根据需求进行扩展,增强系统的运算能力。同时软件系统也可进行升级,使其能支持更多线程、更大的地址空间、识别更多的新硬件。

集群系统的兼容性包括软件兼容性、硬件兼容性和管理系统的可兼容性三方面,具有良好兼容性的系统能为用户提供更加广泛运用空间。在构建集群系统时,为使系统突破数据运算及传输速度的瓶颈,服务器多采用64位处理器,但许多应用软件是基于32位机的设计架构,且不同的软件也适配于不同的操作系统,如:UNIX、Windows、Linux等等,只有高兼容性的集群系统才能满足各种软件的运行需求。比如,杭州动漫基地需要构建供四十多家动漫公司共同使用的公共渲染系统平台,系统在需满足动漫渲染所需要的高运算速度、大存储量等需求的同时,作为公共平台还应具有良好的兼容性,满足不同用户的需求。在系统的搭建中,曙光公司选用了天阔A830r-F高性能服务器作为计算节点,该服务器配置4颗AMDOpteron8216双核处理器,该种AMD双核Opteron处理器能够平滑过渡到四核,不改变接口类型就可提供更强大的计算能力。该服务器同时能稳定运行多种32位和64位主流操作系统,满足了不同用户对应用软件的需求。曙光公司同时用DCOS系统软件对集群系统进行管理优化,DCOS管理系统是一套多功能、易使用、可扩展的实用集群管理工具,完全符合SUMA标准,可实现对集群系统所有节点的全面整合,并支持各种异构平台。曙光公司的整体解决方案充分体现了该渲染系统做为公共服务平台所应具有的可用性强、易管理的优异性能,成为杭州动漫基地渲染系统平稳运营的坚实后盾。

在集群的计算需求确定之后,选择各种组件构成集群的实现方案常常十分困难,而且经常由于组件之间难以协同工作而导致集群的实现失败,或者最终构造了一个难以使用又难以管理的集群。针对这种情况,应该优先考虑选择一体化的集群产品。这些产品通常会在厂商的工厂中进行组装和测试,然后按机架的方式交付客户使用。集群系统解决方案的完整性包括硬件系统的完整性、应用的完整性、完整的培训文档和全方位的服务。用户采用了高完整性的解决方案后,无需增加额外的硬件和软件就可以保证系统中所有设备正常运转,还可拥有必要的安装维护工具和备件,同时还能获得良好的培训和售后服务。

刘备把自己对集群的想法拿给诸葛亮一看,诸葛亮看罢大喜,说到:“不想主公进步如此之大,如此看来,亮离收山不远矣。”


结束语:诸葛亮闭门总结,刘玄德秘籍到手

通过蜀都集团的发展,诸葛亮感慨良多。服务器是为我们提供服务的,如果利用好服务器这一工具,它可以给我们带来超乎想象的服务。但是,想要让这些服务运行无误,我们作为网管员,必须为服务器提供出良好的维护服务,同时寻找最适合企业自身需求的服务器使用方法,这样才能成为一个好的网管员。服务器,咱谁服务谁?实际上,服务器为我们提供良好的计算服务,我们为服务器停工良好的维护服务,今次而已。思考良多,诸葛亮在家把服务器维护方法以及服务器能为我们提供的服务这两方面内容整理成册,交给了刘备,正当刘备兴奋不已,自以为秘籍到手的时候,突然发现,诸葛亮也把这个“秘籍”投给了网站,所以秘籍也便不秘了。




TAG: windows 操作系统 存储 服务器

引用 删除 Guest   /   2008-06-20 16:07:52
 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2008-11-14  
      1
2345678
9101112131415
16171819202122
23242526272829
30      

我的存档

数据统计

  • 访问量: 41176
  • 日志数: 10257
  • 建立时间: 2008-03-25
  • 更新时间: 2008-03-25

RSS订阅

Open Toolbar