galera の動きが良く分からない

MariaDB 10.2 で galera のクラスタを組んでいるマシンのうち、1台の mariadb が止まっていた。なぜかわからない。

起動しようとすると起動不良だった。原因不明。

10.2.15 の親ノードのうち片方は止められない。これは死守。

1ノードが停止していて、数日経ってしまっていた。データ量の問題で IST 不可、SST で復帰が何故か走らない。
バージョンの問題かと思い、10.2.15 の子ノードの1つを 10.2.16 にすると、そちらも sync できなくなった。謎。1ノードでは困るので、10.2.15 に戻す。
上手く動かない。
sst_method を rsync にして、どうにか IST で戻せた。

さて、落ちていた1ノードの復帰をどうするか。
10.2.15 に戻す、不良。
rsync はブロックするからあまり使いたくない。
sst_method を xtrabackup-v2 にしてみたが、動作不良。
mariadb-backup を入れて、sst_method を mariabackup にしてみたところ、遅いが動き続けた。
ただし、子ノードを指定したつもりが、メインのノードに接続しに行く。仕方がないからほっておく。

restart しても安全なことを確認。

10.2.16 に update したところ、動作がおかしい。
設定は変更していないが、restart すると何故か動く。謎。

10.2.15 を 2 ノード、10.2.16 を 1 ノードでしばらく放置する。困ったもんだ。

misc

Posted by tako