Always On : Supervision des Groupes de Disponibilité

Compteurs et indicateurs clés à surveiller pour les Groupes de Disponibilité Always On de SQL Server.

Les Groupes de Disponibilité Always On (AG) de SQL Server permettent d’assurer une haute disponibilité et une récupération d’urgence pour les bases de données critiques. Une supervision proactive est essentielle pour garantir la stabilité et la performance de ces environnements.

Compteurs de Performance Clés

Disponibilité des Réplicas

CompteurObjetDescription
Database Replica StateAvailability Replica (SQLServer:Availability Replica)État du réplica (1=En bonne santé, 2=En cours de synchronisation, etc.).
Synchronization HealthDatabase Replica (SQLServer:Database Replica)État de synchronisation des bases de données (0=Non synchronisé, 1=Synchronisé, 2=En cours de synchronisation).

Latence de Synchronisation

CompteurObjetDescription
Log Send Queue (KB)Database Replica (SQLServer:Database Replica)Taille de la file d’attente d’envoi des logs (en Ko). Une valeur élevée indique un retard de synchronisation.
Redo Queue (KB)Database Replica (SQLServer:Database Replica)Taille de la file d’attente de relecture des logs (en Ko). Une valeur élevée peut indiquer un goulot d’étranglement sur le réplica secondaire.
Estimated Recovery Time (ms)Database Replica (SQLServer:Database Replica)Temps estimé pour la récupération en cas de basculement.

Performance des Réplicas

CompteurObjetDescription
Bytes Received/secAvailability Replica (SQLServer:Availability Replica)Débit de données reçu par le réplica secondaire.
Bytes Sent/secAvailability Replica (SQLServer:Availability Replica)Débit de données envoyé par le réplica principal.
Flow Control Time (ms)Database Replica (SQLServer:Database Replica)Temps passé en contrôle de flux (en ms). Une valeur élevée peut indiquer des problèmes de réseau ou de performance.

Utilisation des Ressources

CompteurObjetDescription
CPU Usage (%)Processor (SQLServer:Processor)Utilisation CPU par SQL Server.
Memory Grants PendingSQLServer:Memory ManagerNombre de demandes de mémoire en attente.
Disk Read/Write Latency (ms)PhysicalDisk (SQLServer:PhysicalDisk)Latence des lectures/écritures sur le disque.

Connexions et Transactions

CompteurObjetDescription
Transactions/secDatabases (SQLServer:Databases)Nombre de transactions par seconde.
Active TransactionsDatabases (SQLServer:Databases)Nombre de transactions actives.
Log File(s) Used Size (KB)Databases (SQLServer:Databases)Taille utilisée des fichiers de log.

Alertes Recommandées

  • Seuil critique pour Log Send Queue : > 100 Mo pendant plus de 5 minutes.
  • Seuil critique pour Redo Queue : > 50 Mo pendant plus de 5 minutes.
  • Latence de synchronisation : > 30 secondes.
  • Temps de récupération estimé : > 1 minute.

Références