关键词:服务器;数据库;集群系统;双机热备份1引言
对于运行WindowsNTServer的PC服务器来说,可靠性保证措施有以下几种:①使用NTServer软件实现磁盘镜像;②安装阵列卡作磁盘镜像或磁盘阵列;③组装双机热备份系统;④安装WindowsNTServer集群系统。从可靠性级别来说,①的级别较低,④的级别最高,可最大程度地满足客户要求。
2双机热备份系统与集群方案的比较
双机热备份系统需要两个服务器设备和一个磁盘阵列柜,另外需要一个可由硬件设备厂商提供的支持软件。该结构连接如图1所示,两台服务器均引出SCSI接口连接磁盘阵列柜,两台服务器串口之间的连接线用于服务器检测。该系统运行时,一台服务器工作,另一台处于备用运行状态。在运行的主服务器发生硬件故障时,退出运行,磁盘阵列柜自动转接到备用服务器,改由从服务器操作,从服务器投入运行。
如上所述,当服务器发生故障时,该系统不会中断运行,工作站客户一般感觉不到服务器故障的影响。而存储数据硬盘的可靠性,由阵列柜内部解决,通常在磁盘阵列柜中设置磁盘阵列或磁盘镜像,保证数据的安全性。
由于双机热备份系统可靠性高、系统转换快,在电力系统远动数据采集系统中经常采用,但也有一些缺点,其一是设备利用率太低,相当于一台服务器闲置;其二是对两台服务器的要求太高,它要求两台服务器具有完全相同的配置,而且是相同的品牌,同一批产品。使用中,两台服务器实际上在运行相同的操作,如内存的使用达到完全相同,这样当发生故障时才能相互备用。其三是操作系统发生故障时,例如WindowsNTServer内存溢出时,无法解决,因为两台服务器运行的是相同内容。
WindowsNT集群系统,称为ClusterServer,其软件可在WindowsNTServer企业版(EnterpriseEdition)或Windows2000AdvancedEdition中找到,简称MSCS,最小配置与双机热备份相同,两服务器间的检测线也可用网络线代替,即在每台服务器上增加一块网卡,设置为与网络服务不同的网段,用做故障检测信号的传递。
集群的优势是设备的利用率高,平时两台服务器各做各的工作,当主服务器发生故障时,从服务器将其工作接过来继续运行;两台服务器可以采用不同品牌、不同的配置;可以解决软件引起的故障。
3WINDOWSNT集群系统简介
选择微软的WindowsNT集群方案原因是为了最大限度提高系统的可靠性,保证系统的安全运行;当服务器本身条件较差,或者准备采购较廉价品牌的服务器而又要获得较好的服务时,可以选择这种方案。
可以在WindowsNT集群上运行的应用软件大部分是Microsoft公司的产品,如IISWEB服务器,SQLServer数据库,MicrosoftExchangeServer以及文件目录服务、网络打印机等。其他软件较少,如Oracle数据库等。
对于作为工作站的微机来说,WindowsNT集群服务可以使用三个地址或名称的应用服务,其中两个IP地址是两个服务器网卡的地址,从其上可取得两个服务器独立应用服务和资源;另一个地址是集群的IP地址,可获得集群应用服务和资源。
该集群系统的磁盘阵列柜与双机热备份系统一样,不能同时被两台服务器操作。阵列柜中的存储设备一般只存放用于双机容错服务的应用的软件,如数据库的数据文件和一些共享应用软件等。运行时,阵列柜只允许主服务器操作,主服务器发生故障时,系统将阵列柜操作权力转到从服务器,只允许从服务器存取操作。用于非集群服务的应用,可分别安装于两台服务器的本地硬盘上,分别同时运行。
图2为安装微软的ClusterServer后生成的集群管理程序界面,主从服务器分别起名为SERVERA和SERVERB。图中右边DLKFET1网卡用于网络服务,主从服务器上各一块。El90x2网卡用于服务器故障检测,其IP地址与DLKFET1在不同的网段。
4NT集群环境中的ORACLE数据库配置
在WindowsNT集群环境中有两种安装Oracle数据库的方法,一种是利用磁盘阵列柜厂商提供的软件,另一种方法是用Oracle公司的OracleFailSafe支撑软件。
前一种方法使用Oracle数据库企业版中的并行计算功能,再加上磁盘阵列柜厂商提供的一种叫ODS(OracLEDependentSystem)的软件,目前大约十余家公司的这种软件通过了Oracle公司的认证,如Compaq、HP、SUN、IBM等。该方法从磁盘系统入手,将磁盘格式化成Oracle专门磁盘文件格式。其安装步骤较复杂,但运行速度更快,效率更高。
另一种方法采用Oracle公司的FailSafe加Oracle数据库系统,这种方法对磁盘阵列柜一般没有特殊要求,可选用较廉价的品牌。经济上更实用些。下面主要介绍其安装、配置方法。
(1)在安装OracleFailSafe之前,先将WindowsNTClusterServer安装调试好,并在服务器和客户端进行测试。
(2)在两台服务器本地硬盘上分别安装Oracle数据库系统软件,注意在安装过程中,不要创建数据库文件。Oracle系统软件应安装在两台服务器的相同目录中,设置相同的数据库监听地址,该地址的选择与一般Oracle地址不同,不要选择服务器网卡地址,应设置一个新的IP地址,作为后面提到的Oracle虚拟服务器地址。
(3)安装OracleFailSafe软件。该软件也应分别安装在两台服务器的相同目录中。第二台服务器上安装时应选择“查找”和“加入”第一台服务器的FailSafe服务。
OracleFailsafe安装过程中需要输入一个称为虚拟服务器的IP地址和名称,该地址就是客户端访问数据库的IP地址。按通常理解应选NT集群地址,但安装中不允许使用集群地址。
(4)WindowsNT集群系统测试。OracleFailSate安装完成后,在WindowsNT菜单序中增加了OracleFailSafe管理程序项,打开OracleFailSafe管理程序,选择菜单中的“Troubleshooting”、“VerifyCluster”(参见图3),测试WindowsNT集群系统,检查各IP地址的设置及相互映射,即从每个IP地址位置检查其它IP地址,通常需编辑服务器的hosts文件,解决测试中出现的问题;(5)创建OracleFailSafe组(类似于网络用户的组)。在OracleFailSafe管理程序中,选“Groups”、“Create”,创建一个OracleFailSafe组,本文中创建的组名为mis。
(6)创建独立的Oracle数据库文件。在OracleFailSafe管理程序中,选择菜单“Databases”、“CreateSampleDatabase”,在磁盘阵列柜中的磁盘目录中,建立Oracle数据库文件。生成数据库文件后要选相应的菜单项对独立数据库进行测试。
(7)将服务器中安装Oracle数据库系统拖动到创建OracleFailSafe的组中,再对该组进行测试。
(8)在管理程序中,可以设置服务器故障修复后的工作方式。主服务器故障后,主服务器的任务将转换到从服务器,主服务器故障修复后,有三种方式可以选择,立即将集群服务任务切换至主服务器;设置当天某一时间,如下班后的晚7:00,将任务切换至主服务器;不切换则在从服务器上继续运行。
完成上述的测试和配置,应该说N[1][2]下一页