数据库服务器作为业务系统的核心,具有业务量大、存储数据量大等特点。它承担着业务数据的存储和处理任务,因此关键数据库服务器的选择就显得尤为重要。服务器的可靠性和可用性是首要的需求,其次是数据处理能力和安全性,然后是可扩展性和可管理性。
根据应用类型和规模的不同,数据库对于服务器的性能要求也不一样。如对于大型数据库(ERP, OLTP, data mart)来说,服务器往往仅用来运行数据库,或仅运行单一的应用。数据库的容量在1TB以上,需要有较高的CPU处理能力,大容量内存为数据缓存服务,并需要很好的IO性能,使用这类应用时,通常需要有较高的CPU主频。那么,具体到某个行业甚至某个项目,数据库服务器该如何选择呢?
数据库服务器选型五个原则
首先,数据库服务器选型应该遵循以下几个原则:
1)高性能原则
保证所选购的服务器,不仅能够满足运营系统的运行和业务处理的需要,而且能够满足一定时期的业务量增长的需要。一般可以根据经验公式计算出所需的服务器TpmC值,然后比较各服务器厂商和TPC组织公布的TpmC值,选择相应的机型。同时,用服务器的市场价/报价除去计算出来的TpmC值得出单位TpmC值的价格,进而选择高性能价格比的服务器。
2)可靠性原则
可靠性原则是所有选择设备和系统中首要考虑的,尤其是在大型的、有大量处理要求的、需要长期运行的系统。考虑服务器系统的可靠性,不仅要考虑服务器单个节点的可靠性或稳定性,而且要考虑服务器与相关辅助系统之间连接的整体可靠性,如:网络系统、安全系统、远程打印系统等。在必要时,还应考虑对关键服务器采用集群技术,如:双机热备份或集群并行访问技术,甚至采用可能的完全容错机。
比如,要保证系统(硬件和操作系统)在99.98%的时间内都能够正常运作(包括维修时间),则故障停机时间六个月不得超过0.5个小时。服务器需7×24小时连续运行,因而要求其具有很高的安全可靠性。系统整机平均无故障时间(MTBF)不低于80000小时。服务器如出现CPU损坏或其它机械故障,都能在20分钟内由备用的CPU和机器自动代替工作,无须人员操作,保证数据完整。
3)可扩展性原则
保证所选购的服务器具有优秀的可扩展性原则。因为服务器是所有系统处理的核心,要求具有大数据吞吐速率,包括:I/O速率和网络通讯速率,而且服务器需要能够处理一定时期的业务发展所带来的数据量,需要服务器能够在相应时间对其自身根据业务发展的需要进行相应的升级,如:CPU型号升级、内存扩大、硬盘扩大、更换网卡、增加终端数目、挂接磁盘阵列或与其他服务器组成对集中数据的并发访问的集群系统等。这都需要所选购的服务器在整体上具有一个良好的可扩充余地。一般数据库和计费应用服务器在大型计费系统的设计中就会采用集群方式来增加可靠性,其中挂接的磁盘存储系统,根据数据量和投资考虑,可以采用DAS、NAS或SAN等实现技术。
4)安全性原则
服务器处理的大都是相关系统的核心数据,其上存放和运行着关键的交易和重要的数据。这些交易和数据对于拥有者来说是一笔重要的资产,他们的安全性就非常敏感。服务器的安全性与系统的整体安全性密不可分,如:网络系统的安全、数据加密、密码体制等。服务器需要在其自身,包括软硬件,都应该从安全的角度上设计考虑,在借助于外界的安全设施保障下,更要保证本身的高安全性。
5)可管理性原则
服务器既是核心又是系统整体中的一个节点部分,就像网络系统需要进行管理维护一样,也需要对服务器进行有效的管理。这需要服务器的软硬件对标准的管理系统支持,尤其是其上的操作系统,也包括一些重要的系统部件。
实例解说数据库服务器选型
为了让大家对上述原则有更清晰的认识,下面我们以金保工程某省级数据中心交换区数据层服务器为例,来详细阐述其数据库服务器选型的方法。
省级数据中心交换区数据层服务器中作为社会保险关系异地转移、离退休人员异地数据交换和异地就医数据交换的数据库服务器,支持在职人员社会保险关系跨市转移的信息交换,以及异地领取养老金相关信息(如人员的基本状况、支付标准、生存状况等)的交换,同时保存死亡信息和公共服务信息、临时缓存宏观决策上报数据和基金监管信息。考虑其作为中央、省、市三级数据中心信息交换的枢纽,所支撑应用的关键性,应采用高端服务器系统,具体配置要求如下:
1)服务器处理能力
为支持本省的异地转移、异地就医和异地领取养老金等业务,需要较高的交易数据处理能力。TPC计算如下:
假设全省参保总人数C=980万,交易日平均交易人数比例a1=1‰,每笔交易对应数据库事务数a2=5,则:每日实际交易量M= C×a1×a2;交易日集中交易时间T=120分钟;交易日集中期内交易量比例Ct=80%;基准TPC指标值对应实际交易值的比例M0=6:1;CPU处理能力余量M1=30%-45%,取35%;3年内每年处理能力增长率P=30%。
根据经验公式计算得出TPC=(M×M0×Ct/(T×(1-M1)) ×(1+30%)3=89,435。也就是说,服务器选型应该考虑采用TPC值不低于100,000的高端服务器系统配置。
2)内存容量
根据经验和类似业务量和环境,内存容量应为1G/CPU×CPU数,从目前主流硬件厂商的指标来看,TPC值要达到100,000,一般需要配置8个CPU,因此内存建议配置8GB。
3)总线I/O带宽
在高CPU、大容量内存的配置下,必须要求主机系统总线带宽、I/O总线带宽都达到很高,否则,系统性能将形成瓶颈。
4)存储容量
交换区平均数据量为164.8GB,峰值数据量为164.8GB×1.5,考虑0.2倍的数据库索引和系统占用空间;作RAID保护后60%存储利用率;以后数据增长,需提供30%的数据扩充能力等因素,总存储容量约为:164.8×1.5×1.2/60%/70%=706GB,采用SAN中的光纤通道阵列作为数据存储。
5)可靠性、扩展性等
由于作为生产型数据库服务器,支持异地经办业务,属于实时性服务,该服务器系统在可靠性方面要求较高,可靠性必须达到99.99%以上,提供全年7×24的可用性,配置为双机集群方式。系统采用多部件的冗余结构设计,具有高速差错校验和纠错的存储器,并有监控和诊断功能。
因此,对于服务器的选型,首先需对其业务系统的业务类型、业务复杂度等方面做系统的需求分析,其后根据需求在数据容量、数据处理的强度等方面进行估算,并兼顾服务器的可靠性、扩展性、安全性、可管理性等方面综合考虑,完成最终的产品选型。
新思维:RISC还是Nehalem-EX?
由于数据库服务器,尤其是金融电信等关键业务领域的核心数据库,对服务器的可靠性和性能要求非常高,这也使得过去这类应用的数据库系统往往会选择RSIC小型机来承担。而X86服务器虽然有很好的性价比,在总体市场中占据了95%的保有量,但仍然有一些核心领域没有攻克。
不过,2010年,随着英特尔新一代Nehalem-EX至强7500系列服务器平台的发布,这一格局即将被打破。至强7500有8 个内核,每个核心支持双线程,每颗处理器最多可支持16个线程并行处理;每处理器最多带有4条QPI高速互联,可轻松扩展至8路系统,如果加入第三方节点控制器则可扩展至更多路系统;每处理器最大共享24MB L3缓存,借助可扩展内存缓冲和可扩展内存互连技术,每个处理器可支持16个内存插槽,四路服务器最大内存容量可达到512GB DDR3。而且,Nehalem-EX引入了22条RAS特性,并首次在至强平台上实现了IA64上才有的MCA恢复功能,提供更强的可靠性。无论是在性能、可扩展性和可靠性上,都已经逼近RISC,甚至在某些指标上有所超越。
因此,随着IBM、HP、戴尔、浪潮等多家厂商推出基于至强7500的四路和八路服务器,核心关键用户将多出许多选择。下面,我们也会推出一系列文章,来帮助解读至强7500在数据库领域的应用表现、产品推荐、方案案例等等。
新闻热点
疑难解答
图片精选