APM einrichten: Die wichtigsten Metriken für schnelle Diagnosen.
APM einrichten: Die wichtigsten Metriken für schnelle Apps
APM (Application Performance Monitoring) ist nicht für Enterprise. Es ist für jede App, die jemand nutzt.
Was APM bringt, das Logging nicht kann
Logging sagt, was passiert ist. APM sagt, wie schnell es passiert ist, wie oft, und wo Bottlenecks entstehen. Die Kombination aus beiden ist Observability.
Konkret: APM zeigt, welcher Endpoint am langsamsten ist. Welche Datenbankabfrage bei bestimmten Requests besonders lang dauert. Welcher Third-Party-Service am häufigsten Timeouts produziert.
Die wichtigsten Metriken
Response Time (P50, P95, P99): Nicht Durchschnitt! Der Durchschnitt versteckt Ausreißer. P95 sagt: 95% der Requests sind schneller als dieser Wert. P99 deckt die schlechteste Erfahrung ab, ohne Ausreißer zu überbetonen.
Error Rate: Wie viele Requests enden in einem Fehler? Getrennt nach Status Code und Fehlertyp.
Throughput: Wie viele Requests pro Sekunde/Minute? Gibt Kontext für Response-Time-Zahlen.
Apdex Score: Kombiniert Satisfaction, Tolerance und Frustration in einer Zahl. Gut für Dashboards und Berichte.
Tool-Auswahl
Datadog APM: mächtig, teuer, gut integriert. New Relic: ähnliches Preissegment, gute Language-Agents. Elastic APM: Open Source, Self-Hosted möglich, Teil des ELK-Stacks. Blackfire.io: PHP-spezifisch, sehr detaillierte Profiling-Daten. Scout APM: günstig, gut für kleinere PHP/Rails-Apps.
Alerting
Ein APM ohne Alerting ist ein Dashboard, das niemand anschaut. Alerts auf: P95 Response Time über Schwellwert, Error Rate über Schwellwert, Apdex Score unter 0,85.
Checkliste APM
APM-Agent für verwendete Sprache/Framework installiert
Wichtigste Endpoints und Datenbankabfragen instrumentiert
P95/P99 Baseline für wichtige Endpoints gemessen
Error Rate Dashboard eingerichtet
Alerting auf Performance-Degradation konfiguriert
APM für eure Anwendung einrichten?
markom.digital setzt APM-Monitoring auf – mit sinnvollem Alerting und Dashboards, die beim Incident wirklich helfen.