基于serf的数据库同步模块库
zhangzengfei
2022-05-24 de807541f31f47d15f84c1b505914a34ac7ee55d
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
/*
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package syncdb
 
import (
    "context"
    "encoding/json"
    "errors"
    "fmt"
    "github.com/hashicorp/memberlist"
    "net"
    "strconv"
 
    "time"
 
    "basic.com/valib/serf.git/cmd/serf/command/agent"
    "basic.com/valib/serf.git/serf"
    //"github.com/apache/servicecomb-service-center/pkg/log"
    "basic.com/valib/logger.git"
)
 
// Agent warps the serf agent
type Agent struct {
    *agent.Agent
    ipc *agent.AgentIPC
    conf         *Config
    readyCh      chan struct{}
    errorCh      chan error
    handleEv     HandleEventFunc
}
 
//用户自定义事件处理
type HandleEventFunc func(event serf.Event)
 
type NodeInfo struct {
    ClusterID           string         `json:"clusterID"`
    NodeID              string         `json:"nodeID"`
    NodeAddress         string         `json:"nodeAddress"`
    IsAlive             int            `json:"isAlive"`
}
 
// Create create serf agent with config
func Create(conf *Config, snapshotPath string) (*Agent, error) {
    // config cover to serf config
    serfConf, err := conf.convertToSerf(snapshotPath)
    if err != nil {
        return nil, err
    }
 
    // create serf agent with serf config
    logger.Info("conf.Config.EncryptKey:", conf.EncryptKey)
    serfAgent, err := agent.Create(conf.Config, serfConf, logger.GetLogFile())
    if err != nil {
        return nil, err
    }
    // Create the keyring
    keyring, err := memberlist.NewKeyring(nil, []byte(conf.EncryptKey))
    if err != nil {
        logger.Error("Failed to restore keyring: %s", err)
        return nil, err
    }
    serfConf.MemberlistConfig.Keyring = keyring
 
    logger.Info("[INFO] agent: Restored keyring with %d keys from %s",
        len(conf.EncryptKey), conf.EncryptKey)
 
    return &Agent{
        Agent:   serfAgent,
        conf:    conf,
        readyCh: make(chan struct{}),
        errorCh: make(chan error),
    }, nil
}
 
func (a *Agent) RegisterHandleEventFunc(f HandleEventFunc) {
    if f != nil {
        a.handleEv = f
    }
}
 
// Start agent and IPC
func (a *Agent) Start(ctx context.Context) {
    a.RegisterEventHandler(a)
    err := a.Agent.Start()
    if err != nil {
        logger.Error(err, "start serf agent failed")
        a.errorCh <- err
        return
    }
 
    ipc := a.startIPC()
    a.ipc = ipc
    go func() {
        for {
            select {
            case <-ctx.Done():
                a.Agent.Shutdown()
                a.ipc.Shutdown()
                return
            default:
                time.Sleep(1*time.Second)
            }
        }
    }()
 
    err = a.retryJoin(ctx)
    if err != nil {
        logger.Error(err, "start serf agent failed")
        if err != ctx.Err() && a.errorCh != nil {
            a.errorCh <- err
        }
    }
 
    go a.BroadcastMemberlist(BroadcastInterval * time.Second)
}
 
func (a *Agent) startIPC() *agent.AgentIPC {
    // Parse the bind address information
    bindIP, bindPort, err := a.conf.AddrParts(a.conf.BindAddr)
    bindAddr := &net.TCPAddr{IP: net.ParseIP(bindIP), Port: bindPort}
 
    // Setup the RPC listener
    rpcListener, err := net.Listen("tcp", a.conf.RPCAddr)
    if err != nil {
        logger.Error("Error starting RPC listener:", err)
        return nil
    }
    ipc := agent.NewAgentIPC(a.Agent, a.conf.RPCAuthKey, rpcListener, logger.GetLogFile(), nil)
    logger.Debug("RPC addr:", a.conf.RPCAddr)
    logger.Debug("Snapshot:", a.conf.SnapshotPath)
    logger.Debug("Profile:", a.conf.Profile)
    logger.Debug("Message Compression Enabled:", a.conf.EnableCompression)
    logger.Debug("bindAddr:", bindAddr)
    return ipc
}
// HandleEvent Handles serf.EventMemberJoin events,
// which will wait for members to join until the number of group members is equal to "groupExpect"
// when the startup mode is "ModeCluster",
// used for logical grouping of serf nodes
func (a *Agent) HandleEvent(event serf.Event) {
    if a.handleEv != nil {
        a.handleEv(event)
    }
}
 
 
func (a *Agent) BroadcastMemberlist(delay time.Duration) {
    //serf := a.serf
    serf := a.Agent.Serf()
    mb := serf.LocalMember()
    mblist := serf.Memberlist()
    logger.Info("mb:", mb)
 
    // copy local node
    localNode := *mblist.LocalNode()
    nodeID := a.conf.NodeName
    nodeAddress := localNode.Address()
    clusterID := mb.Tags[tagKeyClusterID]
    isAlive := int(mb.Status)
 
    message, _ := json.Marshal(NodeInfo{
        clusterID,
        nodeID,
        nodeAddress,
        isAlive,
    })
 
    // replace node address
    localNode.Addr = net.ParseIP(BroadcastIP)
    //localNode.Addr = net.IPv4(255,255,255,255)
    localNode.Port = BroadcastPort
    for {
        // logger.Info("localNode: %v %v\n", nodeName, nodeAddress)
        mblist.SendBestEffort(&localNode, []byte(message))
        time.Sleep(delay)
    }
}
 
// Ready Returns a channel that will be closed when serf is ready
func (a *Agent) Ready() <-chan struct{} {
    return a.readyCh
}
 
// Error Returns a channel that will be transmit a serf error
func (a *Agent) Error() <-chan error {
    return a.errorCh
}
 
// Stop serf agent
func (a *Agent) Stop() {
    if a.errorCh != nil {
        logger.Info("a.Shutdown()", a.Leave())
        logger.Info("a.Shutdown()", a.Shutdown())
        close(a.errorCh)
        a.errorCh = nil
    }
}
 
// LocalMember returns the Member information for the local node
func (a *Agent) LocalMember() *serf.Member {
    serfAgent := a.Agent.Serf()
    if serfAgent != nil {
        member := serfAgent.LocalMember()
        return &member
    }
    return nil
}
 
// GroupMembers returns a point-in-time snapshot of the members of by clusterID
func (a *Agent) GroupMembers(clusterID string) (members []serf.Member) {
    serfAgent := a.Agent.Serf()
    if serfAgent != nil {
        for _, member := range serfAgent.Members() {
            logger.Info("member = %s, clusterID = %s", member.Name, member.Tags[tagKeyClusterID])
            if member.Tags[tagKeyClusterID] == clusterID {
                members = append(members, member)
            }
        }
    }
    return
}
 
// Member get member information with node
func (a *Agent) Member(node string) *serf.Member {
    serfAgent := a.Agent.Serf()
    if serfAgent != nil {
        ms := serfAgent.Members()
        for _, m := range ms {
            if m.Name == node {
                return &m
            }
        }
    }
    return nil
}
 
// SerfConfig get serf config
func (a *Agent) SerfConfig() *serf.Config {
    return a.Agent.SerfConfig()
}
 
// Join serf clusters through one or more members
func (a *Agent) Join(addrs []string, replay bool) (n int, err error) {
    return a.Agent.Join(addrs, replay)
}
 
// UserEvent sends a UserEvent on Serf
func (a *Agent) UserEvent(name string, payload []byte, coalesce bool) error {
    return a.Agent.UserEvent(name, payload, coalesce)
}
 
// Query sends a Query on Serf
func (a *Agent) Query(name string, payload []byte, params *serf.QueryParam) (*serf.QueryResponse, error) {
    return a.Agent.Query(name, payload, params)
}
 
func (a *Agent) retryJoin(ctx context.Context) (err error) {
    if len(a.conf.RetryJoin) == 0 {
        logger.Error("retry join mumber %d", len(a.conf.RetryJoin))
        return nil
    }
 
    // Count of attempts
    attempt := 0
    ticker := time.NewTicker(a.conf.RetryInterval)
    for {
        logger.Info("serf: Joining cluster...(replay: %v)", a.conf.ReplayOnJoin)
        var n int
 
        // Try to join the specified serf nodes
        n, err = a.Join(a.conf.RetryJoin, a.conf.ReplayOnJoin)
        if err == nil {
            logger.Error("serf: Join completed. Synced with %d initial agents", n)
            break
        }
        attempt++
 
        // If RetryMaxAttempts is greater than 0, agent will exit
        // and throw an error when the number of attempts exceeds RetryMaxAttempts,
        // else agent will try to join other nodes until successful always
        if a.conf.RetryMaxAttempts > 0 && attempt > a.conf.RetryMaxAttempts {
            err = errors.New("serf: maximum retry join attempts made, exiting")
            logger.Error(err, err.Error())
            break
        }
        select {
        case <-ctx.Done():
            err = ctx.Err()
            goto done
        // Waiting for ticker to trigger
        case <-ticker.C:
        }
    }
done:
    ticker.Stop()
    return
}
 
//Init serf Init
func Init(clusterID string, password string, nodeID string, addrs []string, snapshotPath string, c *Config) (*Agent, error) {
    agent, err := InitNode(clusterID, password, nodeID, snapshotPath, c)
    if err != nil {
        logger.Error("InitNode failed, error: %s", err)
        return agent, err
    }
 
    err = agent.JoinByNodeAddrs(addrs)
    if err != nil {
        logger.Error("JoinByNodeIP failed, error: %s", err)
        return agent, err
    }
 
    return agent, err
}
 
//InitNode web后台收到创建集群的请求,
func InitNode(clusterID string, password string, nodeID string, snapshotPath string, c *Config) (*Agent, error) {
    conf := DefaultConfig()
    conf.MergeConf(c)
 
    logger.Info("clusterID:", clusterID, "password:", password, "nodeID:", nodeID)
    conf.ClusterID = clusterID
    conf.NodeName = nodeID
    if password == "" {
        conf.EncryptKey = DefaultEncryptKey
    } else {
        if len(password) >= 16 {
            password = password[:16]
        } else {
            password = fmt.Sprintf("%016s", password)[:16]
            //return nil, fmt.Errorf("error password")
        }
        conf.EncryptKey = password
    }
    agent, err := Create(conf, snapshotPath)
    if err != nil {
        logger.Error("create agent failed, error: %s", err)
        return agent, err
    }
 
    agent.Start(conf.Ctx)
    //<- agent.readyCh
 
    time.Sleep(time.Second)
    logger.Info("Stats:", agent.Agent.Serf().Stats())
    logger.Info("EncryptionEnabled:", agent.Agent.Serf().EncryptionEnabled())
    logger.Info("create agent sucess!!")
 
    return agent, nil
}
 
func (a *Agent) JoinByNodeAddrs(addrs []string) error {
    var nodes []string
 
    if len(addrs) == 0 {
        return fmt.Errorf("No Nodes To Join!")
    }
    for _, addr := range addrs {
        nodes = append(nodes, addr)
    }
 
    a.Agent.Join(nodes, true)
 
    return nil
}
 
//func (a *Agent) JoinByNodeIP(ips []string) error {
//    var nodes []string
//
//    if len(ips) == 0 {
//        return fmt.Errorf("No Nodes To Join!")
//    }
//    for _, ip := range ips {
//        node := fmt.Sprintf("%s:%d", ip, DefaultBindPort)
//        nodes = append(nodes, node)
//    }
//
//    n, err := a.Agent.Join(nodes, true)
//    if err != nil || n == 0 {
//        return fmt.Errorf("Error Encrypt Key!")
//    }
//
//    return err
//}
 
func (a *Agent) GetNodes() (nodes []NodeInfo) {
    var node NodeInfo
    logger.Info("a.conf.ClusterID:", a.conf.ClusterID)
    mbs := a.GroupMembers(a.conf.ClusterID)
    for _, mb := range mbs {
        node.NodeID = mb.Name
        node.NodeAddress = mb.Addr.String() + ":" + strconv.Itoa(int(mb.Port))
        node.IsAlive = int(mb.Status)
        node.ClusterID = mb.Tags[tagKeyClusterID]
 
        nodes = append(nodes, node)
    }
 
    return nodes
}