Archive

Posts Tagged ‘Health’

Exchange 2010 – Vérifier l’état du DAG

Un peu de théorie avant d’aborder la pratique :

Le DAG (Data Availability Group ou encore Groupe de Disponibilité de Base de Données)  est le composant de base de l’architecture de haute disponibilité et de résilience de site intégrée à Exchange 2010. Un DAG est un groupe pouvant être formé d’un maximum de 16 serveurs de boîtes aux lettres qui hébergent un ensemble de bases de données et assurent une récupération automatique au niveau de la base de données à la suite de défaillances affectant des bases de données individuelles. N’importe quel serveur d’un groupe de disponibilité de base de données peut héberger une copie de base de données de boîtes aux lettres provenant d’un serveur quelconque du groupe de disponibilité de base de données. Lorsqu’un serveur est ajouté à un groupe de disponibilité de base de données, il fonctionne avec les autres serveurs du groupe pour assurer la récupération automatique à la suite de défaillances affectant des bases de données de boîtes aux lettres, par exemple la défaillance d’un disque ou d’un serveur.

De manière générale, un DAG est un élément particulièrement stable de l’architecture Exchange et à moins d’une saturation du disque contenant les logs (un grand classique) une grosse panne réseau ou d’un méchant crash serveur, il est assez rare de voir un DAG  se prendre les pieds dans le tapis.

Une des taches importantes de tout administrateur Exchange est donc de veiller à ce que le DAG se maintienne en bonne santé. Quelques contrôles réguliers suffisent généralement à éviter les gros problèmes :

  1. Surveiller l’espace disque disponible (notamment sur les disques contenant les log et les bases)
  2. S’assurer que tous les services sous jacents sont opérationnels sur l’ensemble des serveurs du DAG
  3. S’assurer que toutes les copies de bases de données sont saines

Pour le premier point, vous avez l’embarras du choix :

  • un coup d’oeil régulier sur les serveurs
  • un script planifié
  • application type SCOM (Microsoft System Center Operation Manager) ou tout autre application de monitoring (y en a des tas de gratuites)

Pour le deuxième et le troisième point:

  • La méthode manuelle en Powershell :

Vérifier que tous les services du DAG sont opérationnels (attention, les parenthèses sont importantes)

(Get-DatabaseAvailabilityGroup -Identity DAG).servers | Test-ReplicationHealth

dag-test-replication

 

Si une erreur est signalée (c’est assez rare, je vous rassure), c’est qu’un service est probablement arrêté ou qu’il est temps d’appeler le plombier 🙂

Vérifier que toutes les copies de bases de données sont saines :

(Get-DatabaseAvailabilityGroup -Identity DAG).servers | foreach {Get-MailboxDatabaseCopyStatus -Server $_.Name} |  Select Name, Status, ContentIndexState

dag-get-mailboxdatabasecopystatus

Quand tout va bien, la colonne Status affiche Healthy (pour les copies passives) ou Mounted (pour la copie active). Il arrive assez souvent de voir un ContentIndexState afficher Failed. Rien de bien méchant : en général, la suspension puis la remise en route de la réplication suffit à faire disparaître l’erreur.

  • L’utilisation d’un script plus élaboré  :

Le plus répandu est probablement l’excellent Get-DAGHealth de Paul Cunningham que vous pourrez télécharger sur son site.

L’exécution du script produit un fichier HTML donnant un bilan très complet de l’état de santé de votre DAG.

get-daghealth-output

Quelque soit la méthode utilisée, l’important est de ne pas négliger la surveillance de votre environnement. L’adage « prévenir  vaut mieux que guérir » prend ici toute sa dimension :-).

Bonne chance à tous.

Publicités
Catégories :Exchange, Powershell, Scripts Étiquettes : ,