全局负载均衡GSLB

十年热恋 提交于 2020-01-05 09:47:52

http://www.zdnet.com.cn/wiki-GSLB

GSLB

GSLB 是英文Gobal Server Load Balance的缩写,意思是全局负载均衡。 作用:实现在广域网(包括互联网)上不同地域的服务器间的流量调配,保证使用最佳的服务器服务离自己最近的客户,从而确保访问质量。

分类:基于DNS实现、基于重定向实现、基于路由协议实现。特点:能通过判断服务器的负载,包括CPU占用、带宽占用等数据,决定服务器的可用性,同时能判断用户(访问者)与服务器间的链路状况,选择链路状况最好的服务器。因此GSLB是对服务器和链路进行综合判断来决定由哪个地点的服务器来提供服务,实现异地服务器群服务质量的保证。

使用范围:所有有多个站点的系统,最常见的是在CDN系统中作为核心的流量调度系统

常见的全局负载均衡策略

方式一:基于DNS重定向

当用户在浏览器访问时,首先要进行DNS解析,即查找出的IP地址,然后用户与该IP地址建立TCP连接访问网站内容,DNS流量分配方式工作在DNS解析过程中?通过在域的DNS服务器上增加一条NS记录,即的NS纪录指向位于某一全局负载均衡设备(不失一般性,假设为位于分布1的L4交换机)的控制IP地址,对的解析将由该Layer4 Switch负责,由DNS的工作过程可以知道如下过程:

1)用户将DNS请求发到其本地DNS服务器,该DNS服务器通过一系列的DNS查询得知,的授权解析服务器是分布1节点的L4交换机。

2)L4交换机收到DNS查询请求后,将解析为经过计算后所选定的最优站点的IP地址(负载不重,距离用户最进),这个地址可能是主站点的FARMIP,也可能是分站点的FARMIP地址。

3)各分布节点接受用户请求并最终将流媒体内容发送给用户。

方式二:基于网络就近性判断

与方式一相比,本全局负载均衡策略的不同点也是最大优点在于:省中心节点的Layer4 Switch不仅需要解析相应的域名,同时还根据用户真实IP地址来进行最优站点计算和判断,最终将用户流量重定向相应的服务节点上?当用户请求的服务使用的协议不具有类似于“HTTP302"的重定向命令时,该策略的顺利实现利用RadwareWSD产品所独具的“广域三角重定向"能力来完成服务的重定向?

当用户访问已经加入CDN服务的流媒体服务网站时,WSDNP首先会通过TCP/IP握手获得客户的IP,并在静态最近路径表中查找该IP所属的网段是否存在,如存在该客户即被透明的导向到静态最近路径表中所设定的优先级最高的分布点?如没有该记录则NP会以同样方式去查动态最近路径表,如仍没有记录NP会通知各分布点WSD一同去测各分布点离用户的距离及时延,并通过专有协议LRP?PRP报告,确定最优站点,然后通过HTTP重定向或全局三角重定向技术来实现将用户导向到最佳CDN节点,与此同时,该IP地址所在的C类网段会被添加至动态最近路径表,供今后使用;最佳节点的CDN的服务器(节点上的高速缓存)负责将用户请求的内容提供给用户

CDN负载均衡

CDN全局负载均衡

负责通过静态或动态的方式为用户的请求在CDN范围内的各个站点中选择最佳的访问站点?这是实现CDN性能优化的关键?通常采用专业负载均衡设备?全局负载均衡与内容请求路由实现机制

内容服务的请求路由机制(RRSRequestRoutingSystem)是CDN网络规划中最关键的因素之一,它的设计直接关系到CDN的核心思想:就近服务,能否实现?而全局负载均衡策略又是整个内容请求路由机制设计的基石,它的主要内容包括就近性判断和服务重定向机制,全局负载均衡的成功与否直接关系到最终用户的访问成功与质量?

Radware提出有关内容发布网CDN全局负载均衡与内容请求路由的实现机制?

CDN系统设计原则

内容路由的设计涉及到就近性判断?重定向机制和流量分配策略等问题?本方案的内容路由机制设计基于如下事实和考虑:

对于流媒体服务或者其他传输量较大的服务的特征要求内容请求必须(或最大程度地)由距用户最近的分布点提供服务,只有当该节点无法提供服务能力时,才由确定为次佳节点提供备份服务?这就要求内容路由机制以静态内容请求路由为主,并有确定的备份请求路由方案;以静态内容路由为主,辅助于确定的备份路由策略同时是网络管理和性能调优的需求;请求路由的设计必须考虑CDN作为应用支撑平台,必须支持不同的ICP的服务提供模式,即无论ICP是否采用域名来提供服务,CDN都应有相应的内容请求路由机制保证用户能得到就近的边缘服务?ICP在提供流媒体服务时,不仅有采用域名的,也有许多情况下直接给出IP地址的方式提供服务?这就要求CDN的内容请求路由机制要支持直接给出IP地址的服务模式;客户访问网络时,其客户机中的LocalDNS设置有可能不是本地城域的LocalDNS地址?这就要求在内容路由设计中对该状况作出相应的处理?

 

http://www.itkoala.com/?p=1796

网络速度优化及案例 

在中国互联网,基础网络永远是产品体验的绊脚石,特别是移动互联网时代更加明显,能看到的所有与基础网络相关的名词都可以制约网站速度,在规划篇也花了很大篇幅去介绍网络属性和策略,其中IDC、用户具有区域属性和运营商属性是主要矛盾,正因为有这样的国情才放大了对IDC、CDN就近接入、BGP多运营商接入、GSLB智能调度的依赖,结合个人优化体会,汇总网络层的优化实践如下表:

网络优化项 优化说明 备注
分区域的IDC覆盖 用户分布及IDC覆盖能力具有区域性,如果简单理解,北方用户和IDC多为联通,南方则为电信,各小运营商分布不均,简单IDC覆盖所在的地理位置周边具有明显优势,按地理位置分单IDC,多IDC,区域IDC,全国IDC,按城市可分为一线、二线IDC。全国分区域的一线城市的多IDC分布具有最大收益。 一线北京、上海、广州IDC网络覆盖能力最好,价格最贵,稳定性最高
分区域的ISP覆盖 IDC覆盖能力具有运营商属性,同运营商互联互通无问题,跨运营商访问速度要慢3~5倍,同时运营商也具备区域属性,所以针对注流运营商电信、联通及小运营商要进行细分,才可以将网络速度做到极致。个人的体会,目前腾讯网络分布是做得最优势的,全国五大区域14个大规模核心IDC互联互通,58个CDN节点。 除主流运营商分,移动、教育网等小运营商用户体验越加重要,特别是移动
减少TDO跨网解析 TDO(Traffic Distribution Optimizer), 可以理解是一种用户定向策略, DNS以TDO为依据,将用户解析到对应的运营商及服务器,保证使用最佳的服务器服务最近的用户,从而确保访问速度,正确的定向可以提升用户访问速度,反之将适得其反。TDO因历史遗留及新入网用户等原因,会存在不能识别情况,要尽最大可能进行识别,准确率要保持>99%,不能识别的需要通过解析策略进行规避。 TDO的更新和完善是一个持久的工作,需要自动化和持续投入人力
最大化使用CDN价值 中国拥有世界上最复杂的基础网络,也使得CDN成为中国互联网一大特色,CDN即解决用户到IDC最短距离,又减带宽成本、减机架成本、减电成本、减少IDC建设成本等,可以说CDN是速度优化不可缺少的一个环节,速度优化必使用CDN,正确的使用CDN,可以将网络接入速度做到极致。 CDN是速度和成本的双刃剑,互联网大公司都选择自建,将这两个价值最大化,可想其重要性
使用GSLB智能调度 GSLB(Global Server Load Balance),全局负载均衡,包含DNS解析,同时又具备健康检测、测速并智能调度,自动容灾等能力,将用户解析到最快的IDC和服务器,将问题服务器和集群屏蔽和故障自动处理等。 GSLB做到最后,对于互联网产品就像人的大脑一样重要
使用BGP改善小运营商用户体验 应用区分运营商限制,必需要分开IDC部署,主流运营商必需要区域运营商,但小运营商众多且用户占比小,单独部署不现实,最好的平衡是使用多运营商单IP接入,只要部署一套即可。在当下中国PC网络运营商增加、移动网络风起云涌的时代,BGP的价值将会放大,腾讯、百度都有自建BGP机房。 BGP有助于提升移动互联网产品的体验,前题是有专线或内网的保障通信

主要网络优化案例分享如下:

1、IDC优化案例,为了改善百度单北京电信IDC覆盖全国存在的瓶颈,百度在华东启用了杭州电信IDC,监测方法是通过百度客户端监测平台分析如下:

1)覆盖同一50KB广告物料,杭州电信IDC全国总下载时间要比北京电信IDC快26%,杭州电信下载速度、首包时间、建立连接时间、内容下载时间都要优于北京电信IDC。

任务名称 总下载时间(s) 下载速度(KB/s) 页面大小(KB) 首包时间(s) 连接建立时间(s) 内容下载时间(s) 样本数(个)
北京电信IDC_50KB广告 0.38 154.52 50.46 0.057 0.05 0.28 33544
杭州电信IDC_50KB广告 0.3 243.42 50.43 0.045 0.04 0.21 34679

2)两个IDC都体现出明显的IDC区域覆盖属性,北京电信IDC在北京周边覆盖要优先于杭州电信,但杭州电信IDC在华东、华南各省覆盖要比北京快40%+。

北京电信覆盖全国电信 杭州电信覆盖电国

2、CDN优化案例,百度检索广告是百度商业产品中核心模块,优化前一直部署在北京IDC,经过CDN优化后,全国提速35%左右,电信提速46%,联通提速34%,小运营商提速70%+,超越竞争对手cnzz20%+,从北京IDC分流到自建CDN,带宽成本减少2000万/年,按这个服务每年25%的带宽增量,两年可减少成本4500~5000万,可腾挪出80~100台服务器。
1)从运营商维度分析,电信、移动、教育网等小运营商提速非常明显,整体看这个服务速度受限于负载和架构、网络环境,拆分和分流到全国IDC后,速度有了质的飞跃。

运营商 20KB 速度提升 30KB 速度提升
优化前 优化后 优化前 优化后
总下载时间(s) 可用性(%) 总下载时间(s) 可用性(%) 总下载时间(s) 可用性(%) 总下载时间(s) 可用性(%)
全国 0.38 99.96 0.21 99.99 44.74% 0.43 99.94 0.23 100 46.51%
电信 0.39 99.96 0.21 99.99 46.15% 0.44 99.95 0.23 99.99 47.73%
联通 0.32 99.98 0.2 100 37.50% 0.35 99.97 0.23 100 34.29%
移动 0.86 100 0.41 100 52.33% 1.16 99.81 0.39 100 66.38%
教育网 1.26 100 0.3 99.84 76.19% 1.47 100 0.38 100 74.15%

2)从分段维度分析,很明显看出,电信快速比0.25s以内加载完的比例20KB由19%提升到72%,30KB由11%提升到67%,提速明显。

总下载时间 20KB 30KB
电信 联通 电信 联通
优化前 优化后 优化前 优化后 优化前 优化后 优化前 优化后
0~0.25s 19.13 72.71 41.08 73.99 11.08 67.43 35.84 68.31
0.25~0.5s 62.69 22.23 46.23 20.97 60.99 25.53 47.85 25.08
0.5~0.75s 13.82 4.56 9.36 4.16 21.17 5.81 11.47 5.14
0.75~1.0s 3.04 0.51 3 0.88 4.26 1.23 3.29 1.48
1.0~1.25s 1.31 0 0.33 0 1.91 0 1.54 0
1.25s以上 0 0 0 0 0.59 0 0 0

3)从趋势维度分析,红色代表优化后的趋势,可以看到,相比2个月前,优化后提速明显。

3、TDO优化案例,百度因历史原因,旧版TDO存在跨网解析现象,导致有一定比例的跨网访问,经过优化后,速度提升明显,详细分析如下。

1)通过第三方质量监测(基调)发现百度商业产品下域名存在8%左右的电信用户解析到了联通服务器,同时腾讯、阿里等互联网公司未有跨网解析现象。

优化前 优化后

2)通过Apnic、MaxMind识别未知local dns,并采用业界认可的不跨运营商解析的原则,生成TDO,跨网解析率由8%~10%,降低至<1%,正确解析率=99.9%,基本消除跨网解析。

全国总下载时间提升11.6%、建立连接时间提升8.7%。 广西、陕西跨网严重的省份总下载时间提升100%+。

腾讯用全国五大区(深圳、上海、天津、成都、西安)IDC和54个CDN节点覆盖保障全国网络接入,详细分布如下图所示,通过GSLB分运营商、分省份、分IDC进行精确调度和容灾,在相同应用响应和硬件的前题下,最大限度符合基础网络国情,将速度做到极致,也是目前国内网络速度优化最佳实践。

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!