Kontinuierliche Überwachung für geschäftskritische Systeme

Durch unser zentrales Monitoring-Konzept sind eure Systeme sicher aufgestellt. Kritische Komponenten und wichtige Metriken werden rund um die Uhr überwacht. Abhängig vom gewählten SLA werden unsere Admins unmittelbar über kritische Vorfälle informiert und beginnen selbstständig mit der Behebung.

server status rafiki

Überwachte Systemkomponenten

Anwendung
  • Erreichbarkeit der Login-Seite
  • Anzahl der Verbindungen
  • Erreichbarkeit von LDAP
  • Server zur Authentifizierung (optional)
  • Anzahl offener Dateien und Prozesse (Threads)
  • Verschiedene Trends, die auf die Auslastung der Anwendung schließen lassen
  • Auslastung des Anwendungsspeichers (JVM Heap)
  • Anwendungsspezifische Checks: z.B. offensichtlich unsichere Zugriffsberechtigungen
  • Reverse Proxy Funktionalität
Datenbank, Storage, Backup
  • Funktionsfähigkeit der Datenbank
  • Kapazität aller Datenspeicher Snapshots des Dateisystems (ZFS)
  • Durchführung der täglichen Sicherung der Daten auf einen externen Backup-Server
System
  • Auslastung der CPU und des Arbeitsspeichers
  • Konsistenz zwischen Anwendungs-URL und DNS-Einträgen
  • Internet-Zugriff
  • Korrekte Synchronisation der Zeitdienste
  • Funktionsfähigkeit des Mail-Versandes
  • Einspielen von Betriebssystem-Sicherheitsupdates

Langfristiges Monitoring durch Observability

Zusätzlich zu unserem Monitoring haben wir langfristige Zeitreihen von vielen der betriebsrelevanten Metriken in hoher Zeitauflösung. So können vergangene Störungen analysiert werden oder allgemeine Trends abgelesen werden. Bei Performance-relevanten Themen können so erheblich mehr Informationen zur Analyse gewonnen werden.

Folgende Metriken werden unter anderem erfasst:

  • CPU Auslastung + Load
  • Datenträgerbelegung
  • Netzwerkauslastung
  • Speicherverlauf (System + Anwendung)
  • Java Threads (http + non http)
  • Anzahl der Zugriffe
  • Antwortzeiten der Anwendung
  • Speicherverbrauch pro Prozess
  • Auslastung des Anwendungsspeichers (JVM Heap)
  • Garbage CollectionJ
  • Java Code Cache
monitoring grafana