galera の動きが良く分からない

MariaDB 10.2 で galera のクラスタを組んでいるマシンのうち、1台の mariadb が止まっていた。なぜかわからない。

起動しようとすると起動不良だった。原因不明。

10.2.15 の親ノードのうち片方は止められない。これは死守。

1ノードが停止していて、数日経ってしまっていた。データ量の問題で IST 不可、SST で復帰が何故か走らない。
バージョンの問題かと思い、10.2.15 の子ノードの1つを 10.2.16 にすると、そちらも sync できなくなった。謎。1ノードでは困るので、10.2.15 に戻す。
上手く動かない。
sst_method を rsync にして、どうにか IST で戻せた。

さて、落ちていた1ノードの復帰をどうするか。
10.2.15 に戻す、不良。
rsync はブロックするからあまり使いたくない。
sst_method を xtrabackup-v2 にしてみたが、動作不良。
mariadb-backup を入れて、sst_method を mariabackup にしてみたところ、遅いが動き続けた。
ただし、子ノードを指定したつもりが、メインのノードに接続しに行く。仕方がないからほっておく。

restart しても安全なことを確認。

10.2.16 に update したところ、動作がおかしい。
設定は変更していないが、restart すると何故か動く。謎。

10.2.15 を 2 ノード、10.2.16 を 1 ノードでしばらく放置する。困ったもんだ。

Acronis True Image 2014 と Windows 10 は相性が悪い

Acronis True Image 2014 と Windows 10 の FCU は相性が悪い という結論に達した。だめだこりゃ。バックアップしようと思うと途中でおかしくなる。

https://signal-flag-z.blogspot.jp/2015/08/crucial-mx100acronis-true-image-hd.html によれば、「Crucial MX100でAcronis True Image HDを使うとフリーズする」そうだし…。http://forum.crucial.com/t5/Crucial-SSDs/MX100-SSD-Freezes-After-8-1-KB2919355/td-p/154026 によっても、おかしいみたいだし。

FCU へのアップデートになんとか成功

愛機 Lenovo T420s (公式には Windows 10 には対応していない) を Windows 10 Pro にして使っているが、昔の状態で止まっていた。以前アップデートしたところ、何らかの事情で高負荷か何かで、不具合が発生し、大型アップデートを見送っていたのだ。詳細は忘れた。

追記: 思い出した。タスクマネージャー上で、「ディスク」の項目が100%になるという不具合だった。しかも、各々の項目は 0 や 0.1 MB/秒 ということで、特定のプロセス等が多量の読み書きをしているようには見えないというものだった。恐らく、何かのサービスが悪いのだと思われる。Acronis が怪しい。一度いろいろなサービスを有効化したら再発した。再起動後しばらくしてから生じる不具合なので、質が悪い。いろいろなサービスを ON/OFF してみて(例えば2分探索で)探せばわかるんだが…面倒である。ともかく、セーフブート状態なら発生しないことが分かったので、これから少しずつサービスを有効化していって確かめればよさそうである。

2017年12月末に、数日利用して再度アップデートを試みようとした。アップデートには、まず、Windows10Upgrade を使うようにした。初回84%で停止、2回目以降78%で停止し、5回以上繰り返すも無駄足だった。USB メモリを使っても同様に 78% の状態で、回転する画像が回転し続けて数時間経っても一向に進まない状態になっていた。強制終了し、起動すると、以前の状態に戻るような始末だった。

エラーのメッセージは(毎回確認したわけではないが)

0xC1900101 - 0x4000D
MIGRATE_DATA 操作中にエラーが発生したため、インストールは SECOND_BOOT フェーズで失敗しました

であった。この情報を手掛かりに調べたところ、「クリーンブート」という手段があるらしい。クリーンブートについては Microsoft にて Windows でクリーン ブートを実行する方法 として、紹介されている。これによってアップデートが上手くいくことがあるという情報は Windows 10 Creators Updateへ更新する際にSECOND_BOOTフェーズで失敗したときのワークアラウンド にて得た。こちらによると

  1. アンチウィルス系アプリケーションのアンインストール
  2. クリーンブートに変更(スタートアップ無効化、MS以外のサービスの無効化)
  3. C:で十分な空き容量の確保(おそらく16GB以上)
  4. NICを無効化(有線、無線両方)
  5. Windows 10 Creators Update の “MediaCreationTool” で、適当な容量のUSBフラッシュメモリ(両アーキテクチャで8GB以上)でインストールメディアを作成
  6. USBフラッシュメモリの”setup.exe”を実行
  7. インストールプロセスが走って、適宜再起動するのでしばらく放置(うちの子はこの順番でやっても2回目のブートは失敗するけど、一旦電源を落としてもう一度トライするとなぜか行ける(;´∀`))
  8. プライバシー設定を実施
  9. しばらく待機して、準備が完了してデスクトップが現れたら、アンチウィルス系を再インストール

でできたということである。こちらでは

  1. 有効な空き容量確保は済
  2. フラッシュメモリのアップデートメディアは作成済
  3. NIC を無効化(Virtualbox とか VMware とかも含め、すべてやった)
  4. クリーンブートに変更
  5. 一度セーフモードで起動し、再起動(効果の有無は不明)
  6. USBフラッシュメモリの”setup.exe”を実行
  7. 再起動後、USB メモリを抜く指示があるので抜き、アップデートプロセスを続行

によって、成功したようである。

関係の有無は不明だが、アップデート直後は Intel WirelessDisplay (だったか) が削除された旨と、NVIDIA NVS 4200M のディスプレイ アダプターのドライバが正常ではない表示(ドライバ無効状態)であった。数分後なぜか勝手に、Windows Update とも関係なく、22.21.13.8205 がインストールされた。何か、Post Process があったのだろうか?

ともかく、情報によってアップデートができたので感謝したい。