分布式与集群的联系与区别

  • 时间:
  • 浏览:1

高性能计算分类  

高吞吐计算(High-throughput Computing)

有一类高性能计算,都上能把它分成若干都上能并行的子任务,怎么让 各个子任务彼此间都这麼有哪些关联。象在家搜寻外星人( SETI@HOME -- Search for Extraterrestrial Intelligence at Home )本来有一种类型应用。有一种项目是利用Internet上的闲置的计算资源来搜寻外星人。SETI项目的服务器将一组数据和数据模式发给Internet上 参加SETI的计算节点,计算节点在给定的数据上用给定的模式进行搜索,怎么让 将搜索的结果发给服务器。服务器负责将从各个计算节点返回的数据汇集成完正的 数据。可能有一种类型应用的原本同去社会形态是在海量数据上搜索许多模式,许多把累似 计算称为高吞吐计算。所谓的Internet计算都属于有一种类。按照 Flynn的分类,高吞吐计算属于SIMD(Single Instruction/Multiple Data)的范畴。

分布计算(Distributed Computing)

另一类计算刚好和高吞吐计算相反,它们随便说说都上能给分成若干并行的子任务,怎么让 子任务间联系很紧密,需要少量的数据交换。按照Flynn的分类,分布式的高性能计算属于MIMD(Multiple Instruction/Multiple Data)的范畴。

高可用集群解决的是保障用户的应用多多tcp连接 持续对外提供服务的能力。 (请注意高可用集群既后会用来保护业务数据的,保护的是用户的业务多多tcp连接 对外不间断提供服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)。

· 可扩展性--集群的性能不限于单一的服务实体,新的服务实体都上能动态地加入到集群,从而增强集群的性能。

· 高可用性--集群通过服务实体冗余使客户端免于轻易遇到out of service的警告。在集群中,同样的服务都上能由多个服务实体提供。可能原本服务实体失败了,原本服务实体会接管失败的服务实体。集群提供的从原本出 错的服务实体恢复到原本服务实体的功能增强了应用的可用性。

具体包括:

Linux High Availability 高可用集群 (普通两节点双机热备,多节点HA集群,RAC, shared, share-nothing集群等)

Linux Load Balance 负载均衡集群 (LVS等....)

Linux High Performance Computing 高性能科学计算集群 (Beowulf 类集群....)

分布式存储

许多类linux集群 (如Openmosix, rendering farm 等..)

完正介绍

· 负载均衡--负载均衡能把任务比较均衡地分布到集群环境下的计算和网络资源。

· 错误恢复--可能有一种因为,执行某个任务的资源突然经常出现故障,另一服务实体中执行同一任务的资源接着完成任务。有一种可能原本实体中的资源不到工作,原本实体中的资源透明的继续完成任务的过程叫错误恢复。

负载均衡和错误恢复后会求各服务实体暗含执行同一任务的资源所处,怎么让 对于同一任务的各个资源来说,执行任务所需的信息视图(信息上下文)需本来一样的。

集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的服务平台。在客户端看来,原本集群就象是原本服务实体,但事实上集群由一组服务实体组成。与单一服务实体相比较,集群提供了以下原本关键社会形态:

先说区别:

一段话:分布式是并联工作的,集群是串联工作的。

1:分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在同去,实现同一业务。

分布式中的每原本节点,都都上能做集群。 而集群并不一定一定本来分布式的。

举例:就比如新浪网,访问的人多了,他都上能做原本群集,前面放原本响应服务器,里面几台服务器完成同一业务,可能有业务访问的之后,响应服务器看哪台服务器的负载后会一阵一阵,就将给哪一台去完成。

而分布式,从窄意上理解,也跟集群差不要 , 怎么让 它的组织比较松散,不像集群,有原本组织性,一台服务器垮了,其它的服务器都上能顶上来。

分布式的每原本节点,都完成不同的业务,原本节点垮了,哪有一种业务就不可访问了。

2:简单说,分布式是以缩短单个任务的执行时间来提升强度的,而集群则是通过提高单位时间内执行的任务数来提升强度。

累似 :

可能原本任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行该任务需10小时。

采用分布式方案,提供10台服务器,每台服务器只负责解决原本子任务,不考虑子任务间的依赖关系,执行完有一种任务只需原本小时。(有一种工作模式的原本典型代表本来Hadoop的Map/Reduce分布式计算模型)

而采用集群方案,同样提供10台服务器,每台服务器都能独立解决有一种任务。假设有10个任务同去到达,10个服务器将同去工作,1小时后,10个任务同去完成,原本,整身来看,还是1小时内完成原本任务!

· 集群地址--集群由多个服务实体组成,集群客户端通过访问集群的集群地址获取集群实物各服务实体的功能。具有单一集群地址(也叫单一影像)是集群的原本基 本社会形态。维护集群地址的设置被称为负载均衡器。负载均衡器实物负责管理各个服务实体的加入和退出,实物负责集群地址向实物服务实体地址的转换。有的负载均 衡器实现真正的负载均衡算法,有的只支持任务的转换。只实现任务转换的负载均衡器适用于支持ACTIVE-STANDBY的集群环境,在那里,集群中不到 原本服务实体工作,当正在工作的服务实体所处故障时,负载均衡器把本来的任务转向另外原本服务实体。

· 实物通信--为了能协同工作、实现负载均衡和错误恢复,集群各实体间需要时常通信,比如负载均衡器对服务实体心跳测试信息、服务实体间任务执行上下文信息的通信。

具有同原本集群地址使得客户端能访问集群提供的计算服务,原本集群地址下隐藏了各个服务实体的实物地址,使得客户要求的计算服务能在各个服务实体之间分布。实物通信是集群能正常运转的基础,它使得集群具有均衡负载和错误恢复的能力。

集群分类

Linux集群主要分成三大类( 高可用集群, 负载均衡集群,科学计算集群)

高可用集群( High Availability Cluster)

负载均衡集群(Load Balance Cluster)

而集群指的是将几台服务器集中在同去,实现同一业务。

分布式中的每原本节点,都都上能做集群。

而集群并不一定一定本来分布式的。

举例:就比如新浪网,访问的人多了,他都上能做原本群集,前面放原本响应服务器,里面几台服务器完成同一业务,可能有业务访问的之后,响应服务器看哪台服务器的负载后会一阵一阵,就将给哪一台去完成。

而分布式,从窄意上理解,也跟集群差不要 , 怎么让 它的组织比较松散,不像集群,有原本组织性,一台服务器垮了,其它的服务器都上能顶上来。

分布式的每原本节点,都完成不同的业务,原本节点垮了,哪有一种业务就不可访问了。

集群概念

负载均衡集群一般用于相应网络请求的网页服务器,数据库服务器。有一种集群都上能在接到请求时,检查接受请求较少,不繁忙的服务器,并把请求转到有有哪些服务器上。从检查许多服务器情况有一种点上看,负载均衡和容错集群很接近,不同之处是数量上更多。