Adhesive框架中是分布式组件客户端首先实现的是基于Json序列化+二进制协议的Memcached客户端。在本文中会介绍其中的实现细节。
我们先来看一下项目结构:
从这个结构大致可以看出:
1)Memcached只是其中的一个具体实现,这个组件期望提供一个ClientSocket-ClientNode-ClientCluster的基础实现,以后可以有各种客户端基于这种结构来实现
2)对于Memcached的实现,其中把协议部分放在的Protocol文件夹中,并且根据协议为每一个请求和响应封装类型,也就是使用面向对象的方式而不是拼数据包的方式来封装协议
那么现在首先来介绍基础结构。从最底部的层次开始,最底部应该是对Socket进行一个封装,在这里我们实现了一个ClientSocket,主要完成下面功能:
1)封装Read、Write、Connect、Reset(因为我们实现的是Socket池,所以在Socket使用之后,归还池之前需要重置)操作
2)封装Socket基本状态,包括创建时间、忙碌时间、闲置时间、发生错误时的回调方法
在ClientSocket之上的一层是ClientNode,也就是一个节点的客户端,很明显,这里需要做的是Socket连接池,具体完成的工作有:
1)进行连接池的维护,包括移除空闲超时的Socket、强制结束忙碌时间过长的Socket、补充新的Socket到连接池的下限
2)初始化池、结束池、从池获取Socket、把使用后的Socket返回池、创建非池Socket
在正常使用的时候,所有Socket都从池中获取,如果整个Node不可用,那么我们定时创建非池Socket来测试Node是否恢复
在ClientNode之上的是ClientCluster,也就是集群,对于需要客户端进行一致性哈希分发节点的分布式组件来说,这层就很必要了,完成的功能主要有:
1)初始化集群、使用一致性哈希从集群获得节点、直接获得ClientSocket
2)在节点出错的时候进行重新节点分配、尝试恢复出错的节点
ClientCluster是使用ClientNodeLocator来分配节点的,其中的算法也就是一致性哈希算法。
之前说过节点有权重的概念,在这里也就是通过虚拟节点的数量来设置节点权重,权重越高分配到Key的数量也就会越多。
在ClientCluster之上还封装了一层AbstractClient,也就是直接面向用户的API入口。
public abstract class AbstractClient<T> where T : AbstractClient<T>, new()
完成的功能有:
1)保存所有的Cluster,初始化Cluster
2)获取具体的XXXClient的实现,比如MemcachedClient
很明显,我们的第一个实现MemcachedClient是继承了AbstractClient:
public partial class MemcachedClient : AbstractClient<MemcachedClient>
在这里使用了部分类,内部的实现都放在了MemcachedClient_Internal.cs中,而对外的API都放在了MemcachedClient.cs中。
对于Memcached的二进制协议,我们首先是实现一个头的格式包:
[StructLayout(LayoutKind.Sequential, Pack = 1)] internal struct Header { internal byte Magic; internal byte Opcode; internal ushort KeyLength; internal byte ExtraLength; internal byte DataType; internal ushort Reserved; internal uint TotalBodyLength; internal uint Opaque; internal ulong Version; }
由于我们会直接把结构打包为字节数组,所以这里声明了结构的内存布局。在Protocol.cs中,我们有一些实用的方法,比如结构和字节数组双向转换的实现:
internal static T BytesToStruct<T>(this byte[] rawData) { T result = default(T); RespectEndianness(typeof(T), rawData); GCHandle handle = GCHandle.Alloc(rawData, GCHandleType.Pinned); try { IntPtr rawDataPtr = handle.AddrOfPinnedObject(); result = (T)Marshal.PtrToStructure(rawDataPtr, typeof(T)); } finally { handle.Free(); } return result; } internal static byte[] StructToBytes<T>(this T data) { byte[] rawData = new byte[Marshal.SizeOf(data)]; GCHandle handle = GCHandle.Alloc(rawData, GCHandleType.Pinned); try { IntPtr rawDataPtr = handle.AddrOfPinnedObject(); Marshal.StructureToPtr(data, rawDataPtr, false); } finally { handle.Free(); } RespectEndianness(typeof(T), rawData); return rawData; } private static void RespectEndianness(Type type, byte[] data) { var fields = type.GetFields(BindingFlags.NonPublic | BindingFlags.Instance).Select(field => new { Field = field, Offset = Marshal.OffsetOf(type, field.Name).ToInt32() }).ToList(); fields.ForEach(item => Array.Reverse(data, item.Offset, Marshal.SizeOf(item.Field.FieldType))); }
在定义了头之后,我们就可以封装一个抽象的请求包了:
只要实现这个包,然后调用其GetBytes方法就可以直接获得需要发送的请求数据包,它会在内部处理Header和Body数据的打包。
比如,我们来看一个Set操作的包实现:
internal class SetRequestPackage : AbstractRequestPackage { private TimeSpan expireSpan; private byte[] valueBytes; private ulong version; public override Opcode Opcode { get { return Opcode.Set; } } internal SetRequestPackage(string key, byte[] valueBytes, TimeSpan expireSpan, ulong version) : base(key) { if (expireSpan > TimeSpan.FromDays(30)) throw new ArgumentOutOfRangeException("过期时间不能超过30天!"); this.expireSpan = expireSpan; this.valueBytes = valueBytes; this.version = version; } internal SetRequestPackage(string key, string value, TimeSpan expireSpan, ulong version) : this(key, Encoding.UTF8.GetBytes(value), expireSpan, version) { } internal SetRequestPackage(string key, string value, ulong version) : this(key, Encoding.UTF8.GetBytes(value), TimeSpan.FromDays(30), version) { } internal SetRequestPackage(string key, byte[] valueBytes, ulong version) : this(key, valueBytes, TimeSpan.FromDays(30), version) { } protected override ulong GetVersion() { return version; } protected override byte[] GetExtraBytes() { var extraBytes = new List<byte>(); uint flag = 0xdeadbeef; extraBytes.AddRange(flag.GetBigEndianBytes()); uint expire = Convert.ToUInt32(expireSpan.TotalSeconds); extraBytes.AddRange(expire.GetBigEndianBytes()); return extraBytes.ToArray(); } protected override byte[] GetValueBytes() { return valueBytes; } }
在这里,我们只是实现了抽象方法来为基类提供没有的数据,并不需要关心数据是如何打包的。那么,之后发送Set请求的操作就很简单了:
private bool InternalSet(string key, string value, TimeSpan expire, ulong version) { using (var socket = GetCluster().AcquireSocket(key)) { if (socket != null) { AbstractRequestPackage requestPackage = expire == TimeSpan.MaxValue ? new SetRequestPackage(key, value, version) : new SetRequestPackage(key, value, expire, version); var requestData = requestPackage.GetBytes(); if (requestData != null) { socket.Write(requestData); var responsePackage = ResponsePackageCreator.GetPackage(socket); if (responsePackage != null) { if (responsePackage.ResponseStatus == ResponseStatus.NoError) { return true; } else if (responsePackage.ResponseStatus != ResponseStatus.KeyExists && responsePackage.ResponseStatus != ResponseStatus.KeyNotFound) { LocalLoggingService.Warning("在 {0} 上执行操作 {1} 得到了不正确的回复 Key : {2} -> {3}", socket.Endpoint.ToString(), requestPackage.Opcode, key, responsePackage.ResponseStatus); } } else { LocalLoggingService.Error("在 {0} 上执行操作 {1} 没有得到回复 Key : {2}", socket.Endpoint.ToString(), requestPackage.Opcode, key); } } } } return false; }
1)首先是获取到Cluster,再获取到池中的Socket
2)然后初始化一个SetRequestPackage,再通过GetBytes获得数据
3)直接把数据写入Socket
4)通过ResponsePackageCreator来获得返回的数据包
很明显,ResponsePackageCreator和AbstractRequestPackage的意图差不多,用来把响应的数据包封装成我们需要的数据,其中有一个:
internal static GeneralResponsePackage GetPackage(ClientSocket socket)
获得的是一个通用的响应数据包:
internal class GeneralResponsePackage { internal Opcode Opcode { get; set; } internal ResponseStatus ResponseStatus { get; set; } internal string Key { get; set; } internal byte[] ValueBytes { get; set; } internal ulong Version { get; set; } internal string Value { get { if (ValueBytes != null) { return Encoding.UTF8.GetString(ValueBytes); } else { return null; } } } }
在这里基本的信息都有了,比如操作代码、响应状态、Key、Value、版本号。正因为Memcached的协议比较简单,所有的响应包都是这么一个格式,所以我们并没有实现特殊的响应包。如果要实现的话,只需要在类头部标记OpCode并且继承GeneralResponsePackage,ResponsePackageCreator会自动返回相应的子类:
[AttributeUsage(AttributeTargets.Class)] internal class ResponsePackageAttribute : Attribute { internal Opcode Opcode { get; private set; } internal ResponsePackageAttribute(Opcode opcode) { this.Opcode = opcode; } }
在获得了响应之后,通过判断ResponseStatus来知道响应是否正确,并且记录相关日志即可。这么一来,数据一去一回以及协议如何实现的整个过程就介绍完了。下面,我们再介绍一下客户端中几个特色功能的实现。
1)获取一组Key功能。由于一个集群会有多个节点,所以要获取一组Key,我们首先需要把Key按照节点分类,然后对于不同的节点,采用并行的方式同时获取,这样速度会很快,代码片段如下:
var nodeCache = new Dictionary<ClientNode, List<string>>(); foreach (var key in keys) { var node = GetCluster().AcquireNode(key); if (!nodeCache.ContainsKey(node)) nodeCache.Add(node, new List<string> { key }); else if (!nodeCache[node].Contains(key)) nodeCache[node].Add(key); } var data = new Dictionary<string, string>(); Parallel.ForEach(nodeCache, node =>
2)List功能。Memcached只提供了Key、Value的存储,有的时候我们的Value是一个列表,那么我们可以有两种方式完成这个功能。第一种就是直接把列表序列化作为一个Value保存,优点是简单,缺点是如果以后需要修改的话需要整个列表取出,修改后再把整个列表保存进去,并且由于Memcached Value大小的限制,这么做也不能保存大列表;第二种方式是一个Value保存列表中的一个项,再使用一个KeyValue来保存其中每一项的ID,这么优点是修改方便,获取的数据可以是列表中的一部分,缺点是实现麻烦,要考虑并发问题、要维护另外一个KeyValue来保存所有的ID。在这里,我们封装了后一种方式的实现。
3)Locker功能。使用Memcached完成锁的功能其实很简单,我们只需要在获取锁的时候判断Add一个空值是否成功,如果不成功则表示占有,等待一段时间尝试获取,一直到超时,在返回锁的时候删除这个项即可。在这里,我们封装了MemcachedLocker来完成这个功能。