高可用架构etcd选主故障主备秒级切换实现
作者:kl 发布时间:2022-08-08 23:40:48
什么是Etcd?
etcd是一个强大的一致性的分布式键值存储,它提供了一种可靠的方式来存储需要由分布式系统或机器群访问的数据。它优雅地处理网络分区期间的领导者选举,并且可以容忍机器故障,即使在领导者节点中也是如此。从简单的Web应用程序到Kubernetes,任何复杂的应用程序都可以读取数据并将数据写入etcd。这是官方对Etcd的描述,基于这些特性,Etcd常用于分布式配置、分布式锁、分布式服务协调者以及分布式注册。从功能上来说和zookeeper是一类项目,但是相比而言etcd更现代,etcd使用go语言开发,编译后生成了系统可执行的二进制产物,跨平台性更好,更易维护。etcd直接提供http的接口,非常方便各大语言封装自己的client sdk,在易用性方面也更好一点。下面也主要使用java的客户端jetcd,解决主备服务的协调问题。
etcd官网:https://etcd.io
主备服务场景描述
很多时候为了服务的高可用,除了有个在工作的主服务外,还需要多启用几个备用服务,这样,在主服务出现故障时,备用服务能够马上顶上。这个场景有个很明显的特征就是同一时间只能有一个主服务。常见的如mysql主从切换等,同一时间只能有一个msyql负责写数据。在我们这边的场景是,有一个binlog解析服务,实时解析mysql 的binlog,将解析到的数据传递到kafka中,kafka消费端有一个Flink job去消费解析的数据。最终这些数据会下层到数据中台中,提供给中台系统做基础的业务数据。很多在线的服务查询的数据就是来源binlog解析的数据,所以binlog解析的服务不能存在单点故障,在架构上只能是一主多备的模式,主服务故障时,备用服务实时顶上。同时binlog服务也不能同时多个解析。所以,这个场景使用etcd来做主备架构再好不过了。
jetcd具体实现
首先引入jetcd依赖
<dependency>
<groupId>io.etcd</groupId>
<artifactId>jetcd-core</artifactId>
<version>0.3.0</version>
</dependency>
初始化客户端
Client client = Client.builder().endpoints(
"http://127.0.0.1:2379",
"http://127.0.0.1:3379",
"http://127.0.0.1:4379"
).build();
关键api介绍
Lock lock = client.getLockClient();
Lease lease = client.getLeaseClient();
Lease提供授予,撤销和保持租约的方法,其中有两个关键方法grant(long ttl)和keepAlive()。grant用于授予租约,入参为租约的时间,即如果创建带租约的key值,ttl秒后即自动删除,返回租约的id。keepAlive()方法用于保持租约有效,即如果租约即将到期时,keepAlive能够自动续租ttl时间。
Lock有两个方法,lock(ByteSequence name, long leaseId)和unlock(ByteSequence lockKey)。来实现分布式锁的功能,其中加锁时,入参leaseid为续约对象的id,即定义了持有锁的时间
通过这Lease和Lock的功能,很容易实现主备服务的切换。关键代码如下:
ByteSequence lockKey = ByteSequence.from("/root/lock", StandardCharsets.UTF_8);
Lock lock = client.getLockClient();
Lease lease = client.getLeaseClient();
long leaseId = lease.grant(lockTTl).get().getID();
lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() {
@Override
public void onNext(LeaseKeepAliveResponse value) {
System.err.println("LeaseKeepAliveResponse value:" + value.getTTL());
}
@Override
public void onError(Throwable t) { t.printStackTrace(); }
@Override
public void onCompleted() { }
});
lock.lock(lockKey, leaseId).get().getKey();
首先申请授予续约获取到leaseId,其中lockttl为1,单位秒,etcd的租约是秒级的。在这里ttl的设置是有讲究的,取决于当主服务故障时,你想多快让从服务感知并顶上。当然,受限于etcd本身租约秒级限制,最快也只能是1秒。
然后调用keepAlive方法,使授予到的leaseid保活,这样,只要应用还存活就会自动续约
接着调用lock方法,传入leaseid。只有首次启动的服务会获取到锁,而且在运行期间,会不断的续约。当从服务运行到此处时,会阻塞住。这样就能保证多个服务同时运行,只有一个服务真正工作的目的。当获取到锁的主服务出现问题时,原先的只有锁的续约在1秒内就会到期,从服务会马上获取到锁执行工作代码
完整的测试用例
/**
* @author: kl @kailing.pub
* @date: 2019/7/22
*/
public class JEtcdTest {
private Client client;
private Lock lock;
private Lease lease;
//单位:秒
private long lockTTl = 1;
private ByteSequence lockKey = ByteSequence.from("/root/lock", StandardCharsets.UTF_8);
private ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(2);
@Before
public void setUp() {
client = Client.builder().endpoints(
"http://127.0.0.1:2379",
"http://127.0.0.1:3379",
"http://127.0.0.1:4379"
).build();
lock = client.getLockClient();
lease = client.getLeaseClient();
}
@Test
public void lockTest1toMaster() throws InterruptedException, ExecutionException {
long leaseId = lease.grant(lockTTl).get().getID();
lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() {
@Override
public void onNext(LeaseKeepAliveResponse value) {
System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL());
}
@Override
public void onError(Throwable t) {
scheduledThreadPool.shutdownNow();
t.printStackTrace();
}
@Override
public void onCompleted() {
scheduledThreadPool.shutdownNow();
}
});
lock.lock(lockKey, leaseId).get().getKey();
scheduledThreadPool.submit(() -> {
while (true) {
System.err.println("我是主服务开始工作了");
TimeUnit.SECONDS.sleep(1);
}
});
TimeUnit.DAYS.sleep(1);
}
@Test
public void lockTest2toStandby() throws InterruptedException, ExecutionException {
long leaseId = lease.grant(lockTTl).get().getID();
lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() {
@Override
public void onNext(LeaseKeepAliveResponse value) {
System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL());
}
@Override
public void onError(Throwable t) {
scheduledThreadPool.shutdownNow();
t.printStackTrace();
}
@Override
public void onCompleted() {
scheduledThreadPool.shutdownNow();
}
});
lock.lock(lockKey, leaseId).get().getKey();
scheduledThreadPool.submit(() -> {
while (true) {
System.err.println("我是备用服务,我开始工作了,估计主服务已经挂了");
TimeUnit.SECONDS.sleep(1);
}
});
TimeUnit.DAYS.sleep(1);
}
@Test
public void lockTest3toStandby() throws InterruptedException, ExecutionException {
long leaseId = lease.grant(lockTTl).get().getID();
lease.keepAlive(leaseId, new StreamObserver<LeaseKeepAliveResponse>() {
@Override
public void onNext(LeaseKeepAliveResponse value) {
System.err.println("LeaseKeepAliveResponse value:"+ value.getTTL());
}
@Override
public void onError(Throwable t) {
scheduledThreadPool.shutdownNow();
t.printStackTrace();
}
@Override
public void onCompleted() {
scheduledThreadPool.shutdownNow();
}
});
lock.lock(lockKey, leaseId).get().getKey();
scheduledThreadPool.submit(() -> {
while (true) {
System.err.println("我是备用服务,我开始工作了,估计主服务已经挂了");
TimeUnit.SECONDS.sleep(1);
}
});
TimeUnit.DAYS.sleep(1);
}
}
上面测试用例模拟了一主两备的高可用架构。分别执行lockTest1toMaster()、lockTest2toStandby()、lockTest3toStandby()服务,会发现只有一个服务会打印。然后手动关闭这个服务,从服务马上会接着打印。在关闭这个从服务,另外一个从服务就会接着打印。很好的模拟了主备故障切换的效果。
来源:http://www.kailing.pub/article/index/arcid/254.html


猜你喜欢
- Redisson是架设在redis基础上的一个Java驻内存数据网格(In-Memory Data Grid)。充分的利用了Redis键值数
- SingleClick:@Retention(AnnotationRetention.RUNTIME)@Target(AnnotationT
- 1、首先看一下下面两个sql语句的区别:<select id="selectByNameAndPassword"
- 本文实例为大家分享了RecylerView实现流布局的具体代码,供大家参考,具体内容如下第一步:添加依赖compile 'com.a
- 在国际化环境下,越来越多的程序需要做多语言版本,以适应各种业务需求的变化。在Winform应用程序中实现多语言也有常规的处理方式处理,不过需
- 一直以来,我们都是在服务端查询出结果生成JSON字符串,供前端调用,那么我们能否把从前端接受的JSON字符串转换成字典集合,让后台处理呢?比
- 使用的是idea+restful风格第一:引入依赖为:<!--poi--> <dependenc
- 本文实例讲述了Android持久化技术之SharedPreferences存储。分享给大家供大家参考,具体如下:1、SharedPrefer
- 一、准备环境1.activiti软件环境1)JDK1.6或者更高版本;2)支持的数据库有:h2, mysql, oracle, postgr
- 在开发中,我们通常需要将从数据库中查询的集合数据转换成类似文件系统一样的树形集合,比如:省市单位,部门机构,书籍分类等TreeNode对象@
- 将IDEA的默认快捷键设置 设置成为 Eclipse的默认快捷键设置题意有些拗口,但没关系,就是将idea中的快捷键转为自己刚学Java时使
- 前言static表示“全局”或者“静态”的意思,用来修饰成员变量和成员方法,也可以形成静态static代码块,但是Java语言中没有全局变量
- 演示代码: MenuExamples.java package swt_jface.demo5; import org.eclipse.sw
- 类和结构是.NET Framework中的同样类型系统的两种基本构造。两者在本质上都属于数据结构,封装这一组整体作为一个逻辑单位的数据和行为
- public static IPAddress GetHostIP(){ &nbs
- SnackBar是DesignSupportLibrary中的一个重要的控件,用于在界面下面提示一些关键信息,跟Toast不同的地方是Sna
- 1,创建存储过程create proc Pro_Login(@UserName nvarchar(10),@PassWord nvarcha
- 本文实例讲述了Android使用WebView.loadUri()打开网页的方法。分享给大家供大家参考,具体如下:程序如下所示:import
- 如下所示:TextView tv = (TextView) findViewById(R.id.text); tv.getPaint().s
- 本文实例讲述了Java基于servlet * 实现在线人数监控功能的方法。分享给大家供大家参考,具体如下:1、分析:做一个网站在线人数统计,