数据库高可用实战案例架构优化清爽一夏

说到高可用,看官们会想到很多方案,也许是自亲身经历过系统从单机变成高可用的痛苦过程,也许有的看官只是在自己的虚机上搭建过测试的玩具。

本篇用我自己的真实经历给大家讲述,不管怎么样实战和测试玩耍还是很大的区别的!可能你觉得搭建一套高可用方案很简单,配置配置就OK了,但在真正的复杂系统中一切就没有那么轻松了!

背景

客户的现有方案是一套使用发布订阅构建的读写分离方案,总体来说系统构建的很不错。也是在SQL之前很常见的一套架构。

架构图如下:

客户的需求

SQLserverR2升级到SQLSERVER使用AlwaysOn替换现有发布订阅架构。实现本地高可用、读写分离,异地灾备等,并应用部分的新功能,如内存优化表等提升系统性能和并发能力等。

前期调研数据收集

前期对系统的了解很重要!那么怎么样对系统有一个初步直观并且详细的了解呢?用脚本收集?这是时候就体现出工具的专业和协作价值。工欲善其事,必先利其器!

确定方案

通过前期的需求分析,并对客户系统结构有了一个初步的了解后,我们用了将近一周的时间从架构的复杂度,易用性,客户程序改动程度,性能,稳定性等多个角度敲定了最终的方案。

架构图如下: 

从原来那么复杂的架构变成如此清爽的架构,使用AlwaysOn取代复杂的发布订阅,使用AlwaysOn的只读节点实现读写分离,另外使用异地灾备节点取代原有的异地发布数据库,很不错吧!这也是用户最倾向的架构,因为复杂度低,相对稳定易于维护。这里要注意!凡事有利必有弊!要说“但是”了。

但是,升级改动的成本大大提升!

为什么这么说?我们接着看!

详细调研

这样的一个复杂的系统前期的详细调研是需要很长时间的,几套系统不仅仅是架构上设计的比较复杂,功能应用、接口等更是复杂!下面是主要的一些梳理过程:

原有系统结构

我们首先要对原有系统的设计有透彻的了解,客户在两地分别有一个数据中心,三套系统有大量的业务要使用其他系统的数据,所以这里使用发布订阅准时时的把其他系统中的数据发布到系统中的一个数据库,并使用同义词指向订阅来的数据。这种结构降低了使用链接服务器跨实例甚至跨机房访问的性能消耗!并且多份数据订阅到多个只读的节点,从而实现了报表、接口等业务的读写分离。

系统对象整理

因为要做升级迁移,所以对象的整理是很重要的工作,业务对象的遗漏可能会带来不可挽回的灾难!甚至可能会导致整个升级,架构部署的回滚!几套系统中涉及的对象列表过于庞大,比如帐号几十个,几十个作业,上百个同义词,实例级触发器等等.....

服务器划分:

主库对象

读写分离各个只读库对象

发布到其他业务系统的数据服务器配置对象

其他应用程序对象

对象划分:

数据库帐号

链接服务器

实例级触发器

作业

系统参数

维护计划

cdc

BI相关

同义词

程序集

邮件

操作员

只读库多出来的索引、视图等对象

等等等

测试过程搭建测试环境

所有的升级、高可用项目测试环节都是必不可少的。首先是测方案配合业务的可行性,因为作为第三方公司不能对用户所有的应用关系,系统架构了如指掌,甚至客户方自己的工程师可能也做不到这一点。其次是测试功能在新环境下是否出现异常。还有就是对收集并迁移的系统对象进行一次查缺补漏。这样也可以尽量保证系统上线时发生故障的概率!

测试环境无疑是任何升级、架构变更的必要步骤,也只有经过充分的测试才能做到心中有数,进而实现零故障上线。

上线演练

上线演练?这是个什么东西?

首先数据库的操作一定要确定可实施的时间窗口!保证在固定的时间窗口完成工作很重要,那么这就是上线演练的最大好处,我们使用准备出的新机器完全模拟上线的全部步骤,并记录每个步骤使用的时间,可能出现的风险,最迟的完成时间等等。其次搭建完成后我们可以用这个环境(就是完成后正式环境的配置)进行压力测试。

上线演练是一个很必要的步骤,但这个步骤要视实际的情况而定,比如升级的方式,环境的配置等。在这样的一个项目中我们做了两轮的上线演练!

实施过程制定性能基线

这样一个大的变动,数据库在各个阶段的性能指标是什么样子的呢?这里我们依然使用ExpertforSQLServer工具对每一个阶段实施前后性能进行对比,这样不仅能对实施的影响进行监控,更能清晰地分析出每个实施阶段对性能的影响!

  

性能优化

这里的性能优化,我们主要针对语句系统的一些常规参数、慢语句进行第一轮的优化!另外一个重点就是为了应对升级到后可能变慢的语句进行调整!具体什么样的语句可能变慢?这个...

系统的重点语句(执行最频繁的)

语句复杂的

大面积测试吧.....哈哈哈

这里为什么要在升级前就作这样的优化工作而不是升级后系统运行时在针对慢的语句进行分析呢?这个道理很简单,如果上线了才发现如果变慢的功能很多,或变慢的是频繁的功能那么上线的效果就是俩个字"失败"。虽然有的看官知道可以使用提示或降低兼容级别解决这个问题,但是这只是特殊场景下的极端手段,而并不是解决的根本。所以建议如果你有升级到的需要,那么这样的优化手段一定要提前做!

升级到

升级数据库完全可以写成好几篇博客,甚至写本小书都可以了!这里只做简单介绍,和一些要重点注意的问题!

升级方式

升级方式有2种:inplace和sidebyside,这里采用的是sidebyside!通俗地说就是准备新的服务器,安装对应版本的数据库,然后把数据还原上去。sidebyside的好处就是升级不会影响原有的环境,即使失败也能修改程序指向回退到原环境!

升级最大的一个问题

的新特性“参数估计”!这个让人兴奋又苦恼的新功能会导致很多语句在升级到后变慢,因为前面的优化阶段已经对这部分重点







































北京那个医院治疗白癜风
北京专治白癜风的医院有那些



转载请注明:http://www.xcqg58.com/lsqy/3062.html