今回は、情報共有というよりもメモとしての記録です。
(この記事はメモ文を追記して行く形で更新してます。
データセンタ(...避暑地??笑?)内でメモした文章そのままなので、
前後の文章の関係でおかしいところあれば、ご指摘頂ければ幸いです。)
今(リアルタイムで)、まさにNSX4.1を導入してますが、
マネージャ2台だけの構成時に1台落とすと両方こけることがあります。
3台目をデプロイするのが暫く先になるとかいう場合、
1台だけで置いておいた方が良いかな...と、ちょっと思いました。
サクッと3台デプロイしてしまえばいいんですけどね。
(待つだけだし。。)
NSXマネージャ1台目は、
手動でOVFからデプロイすることになると思いますが、
3台構成にした後に1度1台目を消して自動デプロイした方が
綺麗な形になるかなと、思ったり思わなかったり。
↑手動でデプロイしたものはマネージャから消せずに
手で消さないと(vcからディスクから削除で消さないと)いけないんですよね。。。
因みに。
↑やる際に、Managerクラスタのステータスだけ見てたら、
その後、Edgeをデプロイできなくなるという問題を引き当てることになりました。
ステータスが「健全」・グリーンなだけではだめで、
各Managerノードの中(詳細)の
「repo_sync」これがグリーンになってることを確認するべきです。。。
(※各ManagerのREPO_SYNCが赤でもクラスタのステータスはGreenです。。。
バグなんじゃないの??????とは思いますが、
仕様っぽいので、何か作業する際には必ず確認しましょう。)
そんなこんなで、
当ブログを継続して閲覧して頂いている方はお分かりの
「『お』約束」的な障害報告です。
NSX Managerの再デプロイをする際に、
REPO_SYNCが正常になっていない(各ノード(Manager)で同期されていない)
状態になりました。
〇影響(認識していた範囲):
・Edgeノードがデプロイできない
・REPO_SYNCが「失敗」状態になる
〇原因:
マスターノード?のレポジトリが壊れていた
(確認していた事象は2つありましたが、原因は共通です)
ということで!お待ちかねの対応...。
〇対応1:
レポジトリ内で破損しているモジュールの手動復旧...
...
......
コレが、破損しているファイルが少ないなら手っ取り早いので、1番です。
(が、これで終わるわけ無いのが、自分なので。次の対応2に行きました(笑 )
〇対応2:
メーカサポートより提供してもらった、復旧用レポジトリファイルを
レポジトリ領域に展開する。
※サポートに確認してませんが、復旧用ファイルはどこからか
(Customer Connectから)ダウンロードというわけにはいかない様です。
何かあったら、且つ、サポートを頼れる契約でないならば、
次の方法です。
〇対応3(未確認・要注意):
バックアップからリストアしてどうにかする。
.........
......
...
。
冗談でもなんでもなく、こうするしかないですよね?という話ですが、
復元方法としてMANAGERをインストールした上で、
バックアップから復元なので、固有データに関係のないリポジトリは
生き返るはず...です(よね、きっと?)。
※サポートの方からも対応2でうまくいかなければ、
これでやれという指示は頂いたのですが、自分なりに作業の妥当性を
考えるうえでこういう根拠かな?という推察です。
今回はここまで。
メモ書きですが、ご参考まで。