管理程序集群架构是由多个管理程序组成的集群。正如我们之前所学,管理程序是运行在裸机硬件上的低级环境,管理多个虚拟机,使它们认为自己运行在独立的硬件服务器上。管理程序集群意味着有多个物理服务器,每个服务器运行一个管理程序。除了管理自己的虚拟机,每个管理程序还与集群中的其他管理程序交互,以便在物理机之间迁移虚拟机。这可能在故障转移处理、负载管理过程或扩展过程中发生。
管理程序集群通常由VIM(虚拟化基础设施管理器)管理。VIM监控管理程序以确保它们正常运行。如果由于硬件故障等原因,管理程序无法正常运行,VIM可以将虚拟服务器迁移到正常运行的管理程序。VIM通过监控心跳消息来监控管理程序,这些消息是从被监控设备定期发送的简单消息。在管理程序集群中,管理程序也使用心跳消息来检查其他管理程序的可用性。
集群中的管理程序通过云存储设备迁移虚拟机。虚拟服务器的虚拟映像保存在云存储设备中。当检测到管理程序故障时,该映像可以加载到另一管理程序中。哪个管理程序接管虚拟服务器的决定由VIM做出,VIM会了解集群中每个管理程序的负载情况。
有时我们会说虚拟服务器在管理程序之间进行实时迁移。然而,实时的定义取决于虚拟映像的存储方式。如果管理程序维护虚拟机状态的最新映像,则可以在新管理程序上非常快速地重启映像。然而,如果映像只是一个可启动的映像,则复制的虚拟服务器可能需要从该映像重新启动,这会因为启动过程引入一些延迟。
以下阅读还指出,管理程序集群架构可能还包括:
写下以下问题的答案:
当我们有多个虚拟服务器运行在多个物理机器上(不在集群中)时,不可避免地会有一个或多个物理服务器过载,而其他服务器有剩余容量。此时需要一个负载均衡机制。负载均衡虚拟服务器实例架构监控物理服务器的负载,并自动分配虚拟服务器实例以平衡负载。
负载监控和后续的平衡由容量监控系统执行。容量监控系统有三个组件:
需要注意的是,这与之前讨论的集群架构不同,因为这里描述的物理服务器并不在集群中,在VIM看来是独立的设备。
写下以下问题的答案:
无中断服务迁移架构设计用于在不中断服务的情况下重新定位云服务。这类似于之前讨论的弹性架构,但旨在在物理服务器之间迁移服务而不影响其操作。无中断服务迁移适用于可预测的迁移,例如在维护期间或迁移到新物理服务器环境时。当当前物理服务器达到其处理容量时,也可以使用它。
无中断服务迁移(在教科书中也称为实时迁移)包括以下阶段:
服务迁移需求可以由自动扩展监听器或负载均衡机制检测到。也可以通过云或用户控制台手动发起(例如用于维护)。这些都会指示VIM启动过程。
阅读(https://www.informit.com/articles/article.aspx?p=2357815&seqNum=12)。
根据教科书的定义,零停机时间架构是一种在物理服务器故障时为虚拟服务器提供零停机时间的弹性架构。这并不是一个容易实现的架构。考虑到当你的个人计算机蓝屏(对于Windows用户)或发生电源故障时会发生什么。CPU停止,内存中的任何进程都无法访问。问题在于如何恢复运行在故障物理服务器上的虚拟服务器的状态。
零停机时间架构将虚拟服务器的当前状态保存在辅助存储或其他不受物理服务器故障影响的存储中。这个保存的状态用于在另一台物理服务器上恢复虚拟服务器。他们还必须在新副本的虚拟服务开始运行后切换网络连接。网络活动由持久虚拟网络配置架构完成,我们将在下一个主题中讨论。
阅读https://www.informit.com/articles/article.aspx?p=2357815&seqNum=9)。
云负载均衡架构用于在不同云之间平衡负载。云负载均衡架构遵循基本的资源平衡架构原则,但这些原则应用于多个云,而不是位于一个云中的多个资源。
云负载均衡由自动扩展监听器管理,它将传入请求分配给运行在不同云中的相同云服务。自动扩展监听器本身可以位于消费者的内部网络中或单独的云中。通常还会有一个故障转移系统监控涉及的云,以便在一个云变得不可访问或出现性能问题时进行故障转移处理。故障转移机制可能仅通知自动扩展监听器,或者可能启动其他动作,例如在运行中的云中创建额外的服务副本。
阅读链接:chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://www.f5.com/pdf/white-papers/cloud-balancing-white-paper.pdf 用ReadSpeaker docReader打开此文档。
动态故障检测与恢复架构负责监控云提供商的IT资源,并在发生故障时采取行动。云提供商可能同时运行数千个云资源,手动24/7监控这么多资源是不切实际的。云提供商需要实现自动化监控架构,以采取措施从资源故障中恢复。需要注意的是,硬件通常需要手动干预来修复或更换故障组件,因此动态故障检测与恢复架构的恢复机制可能只是通知相关人员进行维修。
弹性监控系统执行此架构的监控部分。它必须具备弹性,以确保其故障概率极低。它还必须能够监控许多不同类型的IT资源,并根据检测到的故障资源类型做出相应响应。它还负责记录事件以供将来分析。
弹性监控系统由云提供商配置,以提供适当的响应。响应可能包括以下一种或多种:
对于任何设备的故障,弹性监控系统可能会执行这些响应的组合。例如,在工作时间发送控制台消息,在其他时间发送短信。它还可以配置为按顺序尝试其中一种响应,例如,运行批处理文件,如果状态仍然故障则发送短信。
需要注意的是,我们已经讨论过的弹性架构可能仍需要弹性监控系统在弹性架构自动恢复时采取行动。例如,在资源池架构中,如果一个组件故障,资源池将继续通过将请求转移到剩余的池成员来运行。然而,必须修复故障的池成员以恢复池的原始配置,即使池继续运行。这需要通知相关人员进行维修。
阅读教科书第12章第12.7节(https://www.informit.com/articles/article.aspx?p=2357815&seqNum=5)。
是否可以将“无中断服务迁移架构”与“动态故障检测与恢复架构”集成?简要解释如何实现。