cat-failover-cluster

On-the-Job Failover Cluster Validation

FAILOVER CLUSTER

Bei einem Failover Cluster ist die Validierung die erste Anlaufstelle bei Probleme – sollte man meinen. Doch leider wird noch immer nur Initial ein Report angefertigt und später nicht mehr ausgeführt. Dabei sollte die Validierung eines Clusters regelmässig durchgeführt werden, mindestens nach jeder Änderung.

Für eine erfolgreiche Storage Validierung im laufenden Betrieb müssen allerdings auch die Gegebenheiten geschaffen sein. Dabei verdient vor allem das Storage ein grosses Augenmerk, darauf werden schliesslich ja auch sämtliche Daten gespeichert. Doch im laufenden Betrieb ist eine Validierung nicht so Aussage kräftig, denn im Report in der Regel bei “List Potential Cluster Disks” folgende Warnung angezeigt:

No disks were found on which to perform cluster validation tests.

Diese Meldung ist zu erwarten, da eine Validierung nur dann erfolgt wenn die Cluster Disk…

  • … in der “Available Storage” Group und “online” ist;
  • … in einem Service / Application zugeordnet und “offline” ist;
  • … eine Shared Disk welche weder “clustered” noch “online” ist.

Da eine Cluster Group respektive deren Cluster Disk nicht einfach offline genommen werden kann, empfiehlt es sich eine Dummy Validation Disk einzuplanen. Diese Validation Disk von zum Beispiel 10 GB, bleibt dann in der “Available Storage” für diesen Zweck liegen. Bei einer späteren Prüfung können somit zumindest Basis Storage Tests durchgeführt werden. Hinweis: Bei Problemen mit einem spezifischen LUN oder dem ganzen Storage, sollten allerdings die Cluster Groups offline genommen werden um eine vollständige Storage Validierung durchführen zu können.

Zum Thema Storage gibt es noch Fehler “Failed to get SCSI page 83h VPD descriptors for cluster disk <number> from <node name> status 2” zu beachten. Dazu hat Microsoft zwar Hotfix 2531907 veröffentlicht. Doch oftmals wird übersehen, dass dieser Hotfix nicht nur auf dem Cluster Node, sondern auch auf dem System wo die Validierung gestartet wird installiert sein muss. Nach der Installation ist im Übrigen ein Neustart erforderlich.

Ansonsten, immer prüfen ob sämtliche Updates und erforderlichen Hotfixes installiert sind. Eine sehr umfassende Hotfix Liste, welche durch Microsoft Kollegen gepflegt wird,  gibt es bei TechNet Wiki. Dies sollte helfen die Cluster Validation durchführen zu können und einen stabilen Cluster am Laufen zu erhalten.

Weitere Informationen

Failover Cluster , Windows Server 2008 R2

, ,

About the Author

Michel Luescher is a solution architect in the worldwide Datacenter & Cloud Infrastructure Center of Excellence (CoE) at Microsoft Corporation based out of Zurich, Switzerland. Primarily, Michel is focused on hybrid cloud solutions (Hyper-V, System Center and Microsoft Azure). In addition Michel is speaker, blogger and author of several books.

Leave a Reply.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Wenn SCVMM die “Service Principal Names“ (SPN) fehlen… System Center 2012 Service Pack 1 CTP2 verfügbar