11.分布式Dubbo+Zookeeper
11.1 分布式理论
- 分布式系统:在《分布式系统原理与范型》一书中有如下定义:“分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统”;
- 分布式系统是由一组通过网络进行通信、为了完成共同的任务而协调工作的计算机节点组成的系统。分布式系统的出现是为了用廉价的、普通的机器完成单个计算机无法完成的计算、存储任务。其目的是利用更多的机器,处理更多的数据。源于谷歌
此处的网络协议主要有两种:
http:超文本传输协议,无状态基于传输层TCP的通信协议,属于应用层协议。
RPC(Remote Procedure Call):远程过程调用,指的是对网络上另外一个计算机上的,某段特定的函数代码的调用,可以基于TCP协议,也可以基于HTTP协议,也是作为应用层通信协议。
传输效率
- RPC:使用自定义的TCP协议,让请求报文体积更小,或使用HTTP2协议,也很好的减少报文的体积,提高传输效率
- HTTP:若基于HTTP1.1的协议,请求中会包含很多无用的内容,若基于HTTP2.0,那么简单的封装下,可以作为一个RPC来使用的,标准RPC框架更多的是服务治理
性能消耗
- RPC,基于thrift实现高效的二进制传输
- HTTP,通过json来实现的,字节大小和序列化耗时都比thrift要更消耗性能
负载均衡
- RPC,基本都自带了负载均衡策略
- HTTP,需要配置Nginx,HAProxy来实现
服务治理
- RPC,能做到自动通知,不影响上游
- HTTP,需要事先通知,修改Nginx/HAProxy配置
- RPC主要用于公司内部的服务调用,性能消耗低,传输效率高,服务治理方便。HTTP主要用于对外的异构环境,浏览器接口调用,APP接口调用,第三方接口调用等。
- 分布式系统(distributed system)是建立在网络之上的软件系统,源于Google。而微服务是架构设计方案,分布式是系统部署方案
- 首先需要明确的是,只有当单个节点的处理能力无法满足日益增长的计算、存储任务的时候,且硬件的提升(加内存、加磁盘、使用更好的CPU)高昂到得不偿失的时候,应用程序也不能进一步优化的时候,我们才需要考虑分布式系统。因为,分布式系统要解决的问题本身就是和单机系统一样的,而由于分布式系统多节点、通过网络通信的拓扑结构,会引入很多单机系统没有的问题,为了解决这些问题又会引入更多的机制、协议,带来更多的问题。
单机系统——springcloud(软件层面的负载均衡)/lvs/nginx(反向代理服务器实现负载均衡)+多个机器(同一套系统复制到不同机器上,横向扩展)
- 随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构(Hadoop离线计算、spark实时计算)势在必行,急需一个治理系统确保架构有条不紊的演进。
11.1.1单一应用架构
- 当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于简化增删改查工作量的数据访问框架(ORM)是关键。
- 适用于小型网站,小型管理系统,将所有功能都部署到一个功能里,简单易用。
- 缺点:
1、性能扩展比较难
2、协同开发问题
3、不利于升级维护
11.1.2 垂直应用架构
- 当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用以提升效率。此时,用于加速前端页面开发的Web框架(MVC)是关键。
- 通过切分业务来实现各个模块独立部署,降低了维护和部署的难度,团队各司其职更易管理,性能扩展也更方便,更有针对
性。 - 缺点:公用模块无法重复利用,开发性的浪费
11.2.3 分布式服务结构
- 当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端
应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的分布式服务框架(RPC)是关键。springcloud体现明显
11.1.4 流动计算架构
- 当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容
量,提高集群利用率。此时,用于提高机器利用率的资源调度和治理中心(SOA)[Service Oriented Architecture]是关键。
下一篇:SpringBoot-37-RPC概述