Chord算法实现具体

摘要:
背景Chord算法是DHT(分布式哈希表)的经典实现。在P2P领域,它指的是基于分布式哈希表(DHT)将节点和数据对象映射到覆盖网络,并使用弦环拓扑或在其上构建P2P网络。弦环基于安全一致的哈希函数分配节点ID和对象ID。每个Chord节点存储关于其他节点的O(logN)信息。查询数据对象所需的覆盖网络的路由跳数也是O(logN)。
背景

Chord算法DHT(Distributed Hash Table)的一种经典实现。下面从网上无节操盗了一段介绍性文字


Chord是最简单。最精确的环形P2P模型。“Chord”这个单词在英文中是指“弦”,在分布式系统中指“带弦环”,在P2P领域则指基于带弦环拓扑结构的分布式散列表(DHT)或者构建与其上的P2P网络。尽管MIT和UC Berkeley的研究早在2001年之前就开发了Chord及其应用系统。但有关Chord的正式论文[Stoica et al., 2001]发表在计算机通信领域著名会议ACM SIGCOMM’01 上,其它刊物和会议后来也有刊登Chord的论文的。如[Stoica et al., 2003]。Chord是结构化的P2P领域最著名的理论模型,到2006年已经被引用超过3000次。能够说,凡是研究过P2P的人,没有不知道Chord的。
假设只将Chord看成一个分布式散列表。那么它只支持结构化P2P最简单的功能:将节点和数据对象映射到覆盖网中。

Chord基于安全的一致性散列函数来分配节点ID和对象ID。在一个有N个节点的网路中。每一个Chord节点保存O(logN)个其它节点的信息,查询数据对象须要的覆盖网络的路由跳数也是O(logN)。当节点离开或者增加网络时。为了维持网络结构,保持自适应性所须要的的消息数在O(log2N)。作为分布式的散列表。Chord具有差点儿最优的路由效率,确定性的对象查询。负载均衡。高可扩展性以及良好的容错性与自适应性;但最重要的一点是:Chord简单,优美,这是它最为经典的直接原因。



Chord算法原理介绍能够先了解下,本文側重Chord的实现,详细是构造Chord环的实现,即怎样初始化和新增节点。

其它对环的操作都能够类比,并且实现会更简单。

Chord的开源实现主要有两个,一个是单机版的jchord。还有一个是集群形式的open chord项目。下面描写叙述都是參考开源项目代码展开的。


单线程版

在单个线程里。Chord环类似是一个内存数据结构。Chord环的节点上能够存储数据,也能够起服务,这取决于你利用Chord来做什么。下面的实现主要側重于新建Chord环,并能够添加节点,在添加节点的过程中。依照Chord的算法描写叙述,怎么样影响相关节点。怎么维护Finger表内容。

首先。Chord类维护ChordNode的一个List,createNode方法依据nodeId创建一个新的ChordNode。为其生成好NodeKey,为全部的ChordNode排好序(TreeMap)。

ChordNode表示环上的节点,包括这些元素:

nodeId, ChordKey,successor, predecessor和 FingerTable。

依据nodeId在生成ChordKey,即环上的位置。然后赋予后继和前继(顺时针方向为向后)。

FingerTable维护的是m个<index, ChordNode>。m为所选hash函数的hash值位数(比方选择SHA1,m等于hash位数160,即hash环最大值为2160-1)。index为key+2i。i取0, 1, … ,m-1。对于小型p2p网络来说,m的取值还是比較大的,导致节点的finger表冗余度可能会有90%以上(可能前50个值都指向N1,后100个都指向N2,最后的10个指向N5)。只是这部分冗余倒不会对查找/路由性能带来什么明显影响。


FingerTable能够形象理解为,以本节点出发。将整个环切为m份,切的方式是按2的等比增长切。即1。2,4,8,…。2159,每一个index值为finger表里的一条记录的key,选择该index值为起点顺时针近期的后继节点作为该finger项的value。如此的话,每一个环上的节点都维护了一张全局的二分节点路由表。


然后。在建立新的Chord哈希环的时候,

1. 生成Chord,并创建若干个节点。

每一个节点在创建的时候。都相当于以自身为第一个节点创建了环。

2. 把创建好的节点逐个增加到某个节点的环上。增加过程仅仅会影响某几个节点

     2.1 在指定的节点N0上join新节点Nk

join过程是借助已有节点N0的finger表为新的节点Nk找到后继Nsuc =N0.findSuccessor(Nk.key),此时Nk的前继为null

     2.2  确认新节点Nk与后继节点Nsuc的相互关系。

须要注意的是。这个确认过程指的是待确认节点的后继是不是如今的后继,以及。后继节点的前继

             会不会因待确认节点的增加而更新。

             由于可能后继节点Nsuc和新节点Nk之间还有节点Nbet,则须要更新Nk的后继节点为Nbet。且后继节点Nsuc和原前继之间增加了Nk之后,

             原前继的后继要改变。

     2.3  确认刚刚的后继节点Nsuc的原前继节点Npre =Nsuc.getPre()的后继节点。因后继节点Nsuc的原前继节点Npre可能会由于新节点Nk的增加

             而改变其后继节点。

            2.2和2.3都是确认过程,仅仅是基于的点不一样。能够体会一下,思路是一样的。

3. 刷新每一个节点的finger表。该过程能够理解为,在各个节点都更新了各自的前继和后继节点之后,每一个节点再把自己的finger表过一遍,更新某些后继节点。

Chord算法实现具体第1张

总结来说,如上图,Nk的增加仅仅会影响其后继节点Nx的前继节点选择。及Nx的前继节点Ny的后继节点选择,即这三个节点之间的互相指认可能会变化。

但前提是Nx和Ny必须是最接近Nk的直接前继和直接后继。

如右側图中在Ny前面,会不会有Nz更接近Nk。而应该是Nk的后继呢?答案是否定的。

从原理角度看,Chord算法保证了这件事(Finger表和直接前/后继的定义有一定的特殊性)。还有一方面,事实上上面的图中的N0节点可能并非处在那个位置。为了帮助理解,以下具体说明当N0在join这步为Nk第一次找后继的过程。


在第一次选择Nx的时候,是通过N0的findSuccessor(key)找的(即2.1步骤做的事)。

给定一个key位置,查找successor:

1.    推断key位置是否在本节点和本节点后继节点之间,假设是,那么就把本节点的后继节点返回。

否则进入2。

2.    为该key找本节点近期的前继节点(不一定是本节点的直接后继节点)。利用本节点前继节点的findSuccessor方法来找该key的后继节点,即进入递归,回到1。

要注意的是找近期的前继节点这一步,依赖的是本节点的finger表,按finger表倒序找。找到那个节点满足finger节点在目标key位置和本节点之间,就ok。

从直观上理解,finger表里的倒序第一个点距离本节点的距离最多是半个环,即2m-1,倒序第二个的距离是2m-1+2m-2。也就是说,这样的倒序找是非常大范围的找,以这样的方式找到节点再调用findSuccessor方法找key的后继。能够脑补一下这样的扫环的方式。(为帮助理解,画了一个饼)

Chord算法实现具体第2张


所以N0第一次帮Nk找的后继Nx,以及Nx本身的前驱Ny,它们这四个点之间的位置关系,事实上出现情况非常复杂,不一定像我上面画的那样分布。我画的图甚至可能是错的,比例也全然不是那样的。

怎样证明Nz的不存在性,相信在了解Chord数学原理后应该能够比較好地理解。

上述描写叙述了Chord环的生成过程和新增节点具体实现。


集群版

集群版指节点之间可能是存在于local的一个JVM内的Chord网络。也能够是存在于多个JVM之间的remote的Chord网络。

假设是Remote情况下的话,对照上述实现,节点的join步骤会添加节点之间通信环节,总体实现思路是一致的,仅仅是集群形式要处理的内容会更丰富些。

针对通信这点,Open chord提供chord node之间的几种通信协议:Local的话是在单个JVM内。Remote的话包含rmi和socket。

Open chord还提供了在每一个节点上同意存储序列化后的java对象,实际上是在Chord算法基础上对节点的一种利用。在此不展开。


ChordImpl

ChordImpl包括元素:

NodeImpl(localNode),Entries。线程池,HashFunction。References,URL,ID

NodeImpl代表着Chord环上的节点,具备一些能够被远程节点调用的操作。

Entries是数据K,V对;

References里包含了一个前继,一串后继和数据Entries;

URL和ID是localNode的url和id;


findSuccessor(key)过程:

首先检查本节点有没有后继,假设没有,说明是唯一的环上的点,返回本节点就能够了。

然后检查key是不是在本节点和后继之间,假设是的话,返回后继节点。在这一步里,本来在返回后继之前,会进行一次ping来检查后继是否正常存活,只是这段被凝视掉了。弥补的做法是返回后继过程中假设出异常。就觉得后继节点联系不上。那么把它从reference表里删除,隐式效果就是后继list里会有新的后继节点占领list首位,所以继续递归findSuccessor(key)操作。

假设以上情况都不是,那么就找一个最接近该key的前继节点,调用那个节点的findSuccessor(key)递归查找。和单线程版里的实现是一致的。

这个查找最接近该key的前继节点的过程详细是Refereces类的getClosestPrecedingNode(key)方法。不会检測存活性。是个同步方法。这种方法逻辑比較复杂。


节点操作


create

多个create方法,终于使用createHelp(),作用是创建一个新的ring,前提是localURL和localID都已经设置好了。

create的过程是,把entries(存数据),references(引用node),localNode(为了通信)都初始化出来,然后调用createTasks操作,createTasks操作利用线程池。定时运行三种任务,各自是周期性稳固与后继的关系(StabilizeTask)、周期性更新finger表(FixFingerTask)、周期性检測前继节点健康情况(CheckPredecessorTask)。最后。调用localNode的acceptEntries方法接收其它node传来的处理entries的通信操作。

周期性稳固与后继的关系(StabilizeTask):

检測后继节点的前继节点有没有由于本节点发送变化。

在单线程实现版本号里,这个非常好了解。可是open chord里的实现没怎么看明确。

周期性更新finger表(FixFingerTask):

採用生成随机数的方式。随机检測一个值相应的successor,假设这个节点不在references内部维护的内容(finger表或前继或后继列表)里,则添加该节点的引用

周期性检測前继节点健康情况(CheckPredecessorTask):

从References里得到前继,不为空的话则进行一次ping操作。Ping事实上什么也没做,但能返回不出异常的话。说明节点正常存活着。


join

多个join方法。终于调用joinHelp(bootstrapURL)方法。用于把本ChordNode增加到指定的URL的Chord ring里。前提是localURL和localID都已经设置好了。

join的过程是,把entries(存数据)。references(引用node),localNode(为了通信)都初始化出来,然后通过Proxy.createConnection(localUrl,bootstrapUrl)来连接本节点和目标URL,Proxy类用于代表本节点外的其它nodes。有LocalThread,RMI,Socket三种实现,相应的是不同的通信协议。

连接完后返回一个远程node。然后调用远程node的findSuccessor方法找到本节点的后继。

然后调用远程node的notifyAndCopyEntries把它的前继、后继列表和entries引用都取过来。利用这个ref集合,首先建立本节点的前驱,即假设ref大小是1。那么说明ring里就两个node。那么后继也是本节点的前继;假设ref大于1,那么取出第一个节点。即后继的原前继。比較本节点是否在他俩之间,假设是的话。本节点的前继就是后继的原前继,否则后继节点是错误的,把ref里的第一个节点作为后继,调用notifyAndCopyEntries,循环上述步骤找出本节点的正确前继。这个过程中,会不断往references里加入节点。也解释了为什么reference里存的是一个后继list。

确定完前继和后继后,把entries的引用加入为本节点的entries,最后运行本节点的acceptEntries和createTasks方法(同create的最后两步)。


leave

leave操作。关闭本节点线程池,并通知前继和后继,本节点要离开网络。然后让localNode断开连接,赋null。


数据存取操作


insert

Insert(key,data),依照key的hash值在环上找到相应node,让node把这个序列化后的data和key以Entry的形式存起来。调用的是node的insertEntry方法。找node过程调用的是本节点的findSuccessor(key)方法。


retrieve

Retrieve(key),依照key的hash值在环上找到相应node,调用node的retrieveEntries方法得到一个entry的Set返回。找node过程调用的是本节点的findSuccessor(key)方法。


remove

Remove(key,data),依照key的hash值在环上找到相应node。调用的是node的removeEntry方法。找node过程调用的是本节点的findSuccessor(key)方法。

以上三种操作还配有异步方法。详细不展开。


命令行操作

把Chord放到集群环境里之后。除了对节点进行join来增加已有网络外,更多操作都会涉及类似的若干次通信。包含移除节点,展示节点Finger表等操作。

这些操作的实现,通过上述描写叙述的新增节点,实现上应该非常好理解。以下列举了open chord的命令行提供的对local或remote chord网络进行的操作列表:

  • CreateNode,创建多个节点
  • Insert,插入数据到local网络里
  • InsertNetwork,插入数据到remote网络里
  • CrashNodes,消灭local网络里的若干个节点
  • JoinNetwork,增加节点到remote网络里
  • LeaveNetwork,离开remote网络
  • Remove。从local网络里删除数据
  • RemoveNetwork。从remote网络里删除数据
  • Retrieve。从local网络里获取数据
  • RetrieveNetwork。从remote网络里获取数据
  • ShowEntries,展示local网络里每一个node的entry
  • ShowEntriesNetwork。展示remote网络里每一个node的entry
  • ShowFingerTable,展示local网络里指定node的finger table
  • ShowFingerTableNetwork,展示remote网络里指定node的finger table
  • ShowNodes,展示local网络里全部nodes
  • ShowSuccessorList。展示local网络里指定node的后继列表
  • ShutdownNodes,关闭一系列nodes
  • Wait。堵塞console一段时间

local/单JVM下创建环样例:

oc > create -names n1
Creating new chord network.
oc > show
Node list in the order as nodes are located on chord ring: 
Node n1 with id 65 52 9C 8C 
oc > help
For help with any command, type name of command plus '-h' or '-help'.
Parameters of commands are always passed to them in the format '-parametername parametervalue'.
Some parameters require no value, so only the parameter name has to be provided to the command.
Commands available from this console:
-----
insert, retrieveN, insertN, refs, cprotocol, 
executeMacro, removeN, refsN, entriesN, create, 
entries, retrieve, successors, wait, shutdown, 
crash, exit, help, joinN, displaySystemOut, 
show, remove, leaveN
-----
Note: Commands and parameters are case sensitive.
oc > create -names n2_n3 -bootstraps n1
Starting node with name 'n2' with bootstrap node 'n1'
Starting node with name 'n3' with bootstrap node 'n1'
oc > show
Node list in the order as nodes are located on chord ring: 
Node n1 with id 65 52 9C 8C 
Node n2 with id 9B 1A 3A B3 
Node n3 with id 9C 47 20 AB 
oc > refs -node n1
Retrieving node n1
Node: 65 52 9C 8C , oclocal://n1/
Finger table:
  9B 1A 3A B3 , oclocal://n2/ (0-157)
Successor List:
  9B 1A 3A B3 , oclocal://n2/
  9C 47 20 AB , oclocal://n3/
Predecessor: 9C 47 20 AB , oclocal://n3/
oc > create  -names  n22_b1_o1p3_o2_ooi1_onf8_jiow_09ni_90j0_jfn_n23_j902n_j9_noi32_n9_j92 -bootstraps n2_n3
Starting node with name 'n22' with bootstrap node 'n2'
Starting node with name 'b1' with bootstrap node 'n3'
Starting node with name 'o1p3' with bootstrap node 'n3'
Starting node with name 'o2' with bootstrap node 'n3'
Starting node with name 'ooi1' with bootstrap node 'n3'
Starting node with name 'onf8' with bootstrap node 'n3'
Starting node with name 'jiow' with bootstrap node 'n3'
Starting node with name '09ni' with bootstrap node 'n3'
Starting node with name '90j0' with bootstrap node 'n3'
Starting node with name 'jfn' with bootstrap node 'n3'
Starting node with name 'n23' with bootstrap node 'n3'
Starting node with name 'j902n' with bootstrap node 'n3'
Starting node with name 'j9' with bootstrap node 'n3'
Starting node with name 'noi32' with bootstrap node 'n3'
Starting node with name 'n9' with bootstrap node 'n3'
Starting node with name 'j92' with bootstrap node 'n3'
oc > refs -node n1
Retrieving node n1
Node: 65 52 9C 8C , oclocal://n1/
Finger table:
  9B 1A 3A B3 , oclocal://n2/ (0-157)
  BB 5B 1A 3D , oclocal://j902n/ (158)
  E7 9D 67 6A , oclocal://n23/ (159)
Successor List:
  9B 1A 3A B3 , oclocal://n2/
  9C 47 20 AB , oclocal://n3/
Predecessor: 5D FC 4C 35 , oclocal://o1p3/
oc > refs -node n23
Retrieving node n23
Node: E7 9D 67 6A , oclocal://n23/
Finger table:
  F8 FE D0 C3 , oclocal://n22/ (0-156)
  0E AF 2E B7 , oclocal://09ni/ (157)
  2C F2 8A 7F , oclocal://ooi1/ (158)
  9B 1A 3A B3 , oclocal://n2/ (159)
Successor List:
  F8 FE D0 C3 , oclocal://n22/
  F9 19 F3 7F , oclocal://b1/
Predecessor: CE 4B 77 E3 , oclocal://jfn/
oc > joinN
Creating new chord overlay network!
URL of created chord node ocsocket://10.65.17.185/.

总结

以下简单总结我对Chord的理解。

Chord这样的DHT的实现,本质上是在一致性哈希的基础上,添加了Finger表这样的高速路由信息,通过在节点上保存整个网络的部分信息,让节点的查找/路由以O(logN)的代价实现。适合大型p2p网络。所以,我理解的Chord基本就等于一致性哈希+Finger表。

免责声明:文章转载自《Chord算法实现具体》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Java Concurrency API 中的 Lock 接口(Lock interface) 是什么?对比同步它有什么优势?CentOS 7 配置 samba服务器下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

实现在GET请求下调用WCF服务时传递对象(复合类型)参数

WCF实现RESETFUL架构很容易,说白了,就是使WCF能够响应HTTP请求并返回所需的资源,如果有人不知道如何实现WCF支持HTTP请求的,可参见我之前的文章《实现jquery.ajax及原生的XMLHttpRequest调用WCF服务的方法》、《实现jquery.ajax及原生的XMLHttpRequest跨域调用WCF服务的方法》,在此就不作重述。...

面向对象基础——索引器

  C#中的string是可以通过索引器来访问对象中的字符,但却不能修改字符的值。   我们来看string中关于索引器的定义,如下图。   上图中索引器如同属性一样,具有get方法,却没有set方法,所以这就是为什么C#中的string类型的变量都是只读的。      现在让我们来编写属于自己的索引器: 1 class Program 2...

分布式系统互斥性与幂等性问题的分析与解决

随着互联网信息技术的飞速发展,数据量不断增大,业务逻辑也日趋复杂,对系统的高并发访问、海量数据处理的场景也越来越多。如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。 为了解决这一系列问题,系统架构也在不断演进。传统的集中式系统已经逐渐无法满足要求,分布式系统被使用在更多的场景中。 分布式系统由独立的服务器通过网络松散耦合组成。在这个系统...

HTML本地存储和离线存储

本地存储和离线存储 课程介绍 1.本地存储——Web Storage 2.本地存储——IndexedDB 3.本地存储的扩展介绍 4.离线存储——app cache 5.总结 Cookie的局限性 1.存储大小限制,仅4kb左右 2.单个域名下的数量限制,50个左右 3.污染请求头,浪费流量 localStorage和sessionStorage 1.相同...

C#通过模板导出Word(文字,表格,图片)

  C#导出Word,Excel的方法有很多,这次因为公司的业务需求,需要导出内容丰富(文字,表格,图片)的报告,以前的方法不好使,所以寻找新的导出方法,在网上找到了通过模板文件导出Word的方法,记录一下过程. 一:模板的创建                                  通过模板导出,肯定需要先创建模板,然后顾名思义就是将模板中提前...

Python 全栈开发:dict(字典)常用方法操作、dict嵌套

  数据类型的划分:可变数据类型和不可变数据类型。   不可变数据类型(可哈希):元祖、bool、int、str   可变数据类型(不可哈希):list、dict,set(集合)   dict(字典):    dict(字典):映射数据类型    dict =  {"key":value}    dict key 必须不可变数据类型,可哈希。   valu...