So überwachen Sie die Serverleistung
Die Serverüberwachung ist wichtig für eine optimale Serverleistung, um sicherzustellen, dass Ihr Unternehmen nicht gestört wird. Die Überwachung der Serverleistung kann jedoch verstreut und komplex sein. Alles im Auge zu behalten, ist zu einem harten Kampf geworden. Informationen auf dem Server ermöglichen es Ihnen, besser zu verstehen, was schief gelaufen ist. Tools wie Retrace, die diesen harten Kampf schlanker und überschaubarer machen. Lassen Sie uns lernen, wie Sie die Serverleistung überwachen.
Was ist Serverüberwachung?
Bei der Serverüberwachung werden verschiedene Metriken im Auge behalten, um einen reibungslosen Betrieb zu gewährleisten. Die Überwachung verschiedener Metriken hilft, Engpässe leicht zu lokalisieren.
Hinter jedem geschäftskritischen Onlinedienst stehen in der Regel mehrere Server – physisch oder virtuell. Ein physischer Server kann mehrere Engines ausführen, was zu mehreren Serverfunktionen führt. Einige Beispiele für physische Server sind Datenbankserver, Anwendungsserver und Webserver
Warum Serverüberwachung wichtig ist
Die Serverüberwachung ist wichtig, um Leistungsprobleme proaktiv zu identifizieren, bevor sie sich auf den Endbenutzer auswirken. Außerdem hilft die Serverüberwachung beim Verständnis der Systemressourcennutzung des Servers. Auf diese Weise können Sie die Kapazität des Servers besser planen.
Die Überwachung des Servers liefert einen guten Hinweis auf die Reaktionsfähigkeit und Verfügbarkeit des Servers – alles im Namen der Gewährleistung, dass die Bereitstellung Ihres Dienstes für Ihre Kunden nicht unterbrochen wird.
Überwachungsmetriken können auch auf eine Cybersicherheitsbedrohung hinweisen. Dies ist wichtig, mit Web-Hosting, wo die Exposition gegenüber dem Web in einer erhöhten Bedrohung Web-Server-Profil führen kann.
Überwachung der Serverleistung
Bildunterschrift: Im Webhosting enthalten Control Panels häufig Überwachungstools, mit denen die Nutzung verschiedener Ressourcen angezeigt werden kann.
Der Schlüssel zu einer erfolgreichen Serverüberwachungsstrategie besteht darin, die Bereiche zu identifizieren, auf die Sie sich konzentrieren müssen, und eine Leistungsbasis zu erstellen. Thisproperly interpretiert Ihre Serverleistung für Warnzwecke und ernten Mehrwert Informationen über Reporting.
Es gibt Serverüberwachungstools, die Ihnen dabei helfen können. Sie können auch helfen, die Anwendungen oder die gesamte Infrastruktur zu überwachen. Stackify Retrace ist ein hervorragendes Tool, um eine erfolgreiche Serverüberwachungsstrategie sicherzustellen. Stackifys Retrace APM-Lösung bietet Ihnen eine Vogelperspektive auf den Stack Ihres Servers. Die Retrace-Plattform analysiert automatisch alle Anwendungen, die zu Ihrem IT-Framework beitragen, sodass Sie eine Vielzahl leistungsbasierter Metriken überwachen und Maßnahmen ergreifen können, bevor kleine Fehler und Inkonsistenzen außer Kontrolle geraten. Retrace gibt Ihrem Team:
- App-Leistungsüberwachung
- App-Verwaltungsfunktionen
- Ein zentrales Protokollierungstool
- Eine zeilenweise Ansicht Ihres Codes und wie er zum Gesamtbild passt
- Robuste Fehlerverfolgungsberichte
- Eine Reihe von Echtzeit-Serverüberwachungsfunktionen
- Individuelle Benutzerüberwachungsfunktionen
Mit einer All-in-One-Lösung zur Leistungsüberwachung wie Retrace können Sie Ihren Server-Stack einfach analysieren und Schwachstellen lokalisieren, bevor ein größerer, katastrophaler Ausfall auftritt. Es gibt Ihnen einen langen Überblick darüber, wie Ihr Server und seine konstituierenden Apps unter Netzwerklast funktionieren.
Zu überwachende Schlüsselbereiche
Unabhängig davon, ob Ihre Server unter Windows oder Unix ausgeführt werden, sind diese wichtigen Leistungsbereiche ein guter Ausgangspunkt für jede Serverüberwachungsstrategie. Es ist wichtig, diese Leistungsmetriken als Indikatoren für Leistungsengpässe zu verfolgen.
Physischer Status des Servers
Dies gilt für Vor-Ort-Server; Vor-Ort-Server müssen vor Umweltgefahren und -schäden geschützt werden. Abgesehen von den Servern in einem sicheren Raum zu halten, müssen Sie sicherstellen, dass die Temperatur und Stromversorgung der Server.
Die Temperatur darf den empfohlenen Wert für eine effiziente Leistung in Ihrer Serverumgebung nicht überschreiten. Wenn die Temperatur konstant ansteigt, kann dies auf ein Lüfterproblem oder etwas anderes hinweisen. Sie müssen weiter untersuchen.
Sie müssen auch die Stromversorgungsregler am Stromeingang Ihres Servers überwachen. Sie müssen Stromstöße und -einbrüche bewältigen und ausgleichen. Sollte jedoch die Hauptversorgung ausfallen, kann Ihre unterbrechungsfreie Stromversorgung (USV) Ihnen etwas Zeit verschaffen, um auf die Notstromversorgung umzuschalten.
Zentraleinheit (CPU) & Speicher
Wenn sich die Leistung eines Servers verschlechtert, sind die üblichen Verdächtigen die CPU-Auslastung des Servers und die Speicherressourcen. Wenn die CPU-Auslastung Ihres Servers ungewöhnlich hoch ist oder eine hohe Speicherauslastung vorliegt (weniger freier Speicherplatz verfügbar), leidet die Leistung Ihrer Anwendungen.
Es ist gut zu wissen, was die wichtigsten CPU- und speicherintensiven Prozesse auf Ihrem Server sind. Dies ist wichtig, um Probleme mit der Ressourcennutzung schnell zu beheben. Zu den zu messenden Metriken gehören die Anzahl der CPU-Prozesse, die Anzahl der CPU-Threads und die CPU% -Interruptzeit.
Sie müssen die Speichernutzung Ihres Servers überwachen. Dies schließt verfügbaren freien Speicher, die Preise Seiten geschrieben werden, um physischen Speicherplatz freizugeben, unter anderem. Alle diese Metriken können Ihnen helfen, den Zustand Ihres Servers jederzeit zu verstehen.
Server Uptime
Ihre Website muss rund um die Uhr laufen und verfügbar sein. Die Server-Uptime misst die Zeit, die ein System in Betrieb war. Diese Metrik ist nützlich, um Sie zu warnen, wenn das System möglicherweise unwissentlich neu gestartet wurde.
Wenn Sie eine Diskrepanz zwischen dem erwarteten Serververfügbarkeitszeitraum und der Serververfügbarkeitszahl feststellen, ist das System mindestens einmal ausgefallen. Bestätigen Sie, ob alle geplanten Aufgaben, die voraussichtlich zur gleichen Zeit wie beim Systemausfall ausgeführt werden, abgeschlossen wurden.
Festplattenaktivität
Die Festplattenaktivität ist die Zeit, die ein Laufwerk benötigt, um Anforderungen aktiv zu verarbeiten. Es gibt mehrere wichtige Metriken, die überwacht werden müssen:
- Festplattenbelastungszeit – misst den Prozentsatz der Zeit, die die Festplatte aktiv ist. Wenn dieser Wert hoch ist, bedeutet dies, dass sich Ihre Anforderungen für den Zugriff auf die Festplatte häufen.
- Eingabe– und Ausgabevorgänge (I/OPs) – gibt die Arbeitslast auf dem Laufwerk an. Die Überwachung dieser Metrik kann helfen, die Arbeitsbelastung Ihrer Festplatte zu verstehen.
- Disk read/write – misst die Zeit, die zum Lesen/Schreiben von Datenblöcken von der Festplatte benötigt wird. Der niedrigere Wert bedeutet, dass die Leistung gut ist.
- Datenträgerwarteschlangenlänge – misst die Zeit, die benötigt wird, um eine Anforderung in einer Warteschlange zu bearbeiten. Für eine optimale Leistung sollte die Länge der Datenträgerwarteschlange minimal sein.
Beachten Sie, dass die Überwachung der Leistung der Festplatte für Aufgaben, die stark e / A-intensiv sind, von entscheidender Bedeutung ist.
Auslagerungsdateiverwendung
Nicht verwendete oder nicht verarbeitete Daten werden in der Auslagerungsdatei gespeichert.Operationen, die den begrenzten Arbeitsspeicherplatz (RAM) des Betriebssystems (OS) überschreiten, werden ebenfalls an die zu speichernde Auslagerungsdatei gesendet.
Wenn Sie feststellen, dass die Auslastung hoch ist, bedeutet dies, dass die Auslagerungsdatei des Systems nicht ausreicht, um die Anforderungen Ihres Servers zu erfüllen.
Eine weitere wichtige Metrik ist der Seitentausch. Wenn Ihrem Server der Arbeitsspeicher ausgeht, wird ein Bereich des Festplattenspeichers reserviert, um vorübergehend Daten zu speichern, um mehr Speicherplatz freizugeben. Wir empfehlen keinen Seitentausch. In der Regel bedeutet dies, dass Sie nicht genügend Arbeitsspeicher zum Ausführen Ihres Servers bereitgestellt haben.
Denken Sie daran, dass der Seitentausch eine kurzfristige Lösung für die Erschöpfung der Speicherkapazität ist. Da der Seitenwechsel die Antwortzeit verkürzt, sollte dies vermieden werden.
Kontextwechsel
Kontextwechsel ist ein intensiver Prozess. Es tritt auf, wenn der Kernel (Computerprogramm im Kern des Betriebssystems eines Computers) den Prozessor von einem Prozess oder Thread zu einem anderen wechselt. CPU-Ressourcen werden jedes Mal verwendet, wenn ein Kontextwechsel stattfindet. Wenn also ein umfangreicher Kontextwechsel stattfindet, werden immer mehr wichtige CPU-Ressourcen beansprucht.
Dies wird durch das Ausführen mehrerer ausgelasteter Prozesse oder Anwendungsfehler verursacht, die die Anzahl der Kontextwechsel erhöhen. Ein plötzlicher Anstieg des Kontextwechsels auf einem Server kann auf ein Problem hinweisen. Daher ist die Überwachung von Kontextwechseln für die Leistung Ihres Servers unerlässlich.
Zeitsynchronisation
Systeme im selben Netzwerk, die Dateien gemeinsam nutzen oder miteinander kommunizieren, haben zeitgebundene Aktivitäten. Also, stellen Sie sich vor, wenn die Systemuhren nicht synchronisiert sind? Die Ergebnisse könnten katastrophal sein.
Ungenaue Uhren können Daten überschreiben oder Versionskonflikte verursachen. Schlimmer noch, es kann dazu führen, dass Programme falsch funktionieren. Überwachen Sie immer Systemtakt-Offsets gegen einen Referenztakt.
Handles Usage
Handles beziehen sich auf die Ressourcen, auf die eine Anwendung verweist. Die Anwendungen, die auf Ihrem Server ausgeführt werden, fordern Ressourcen an und empfangen sie. Manchmal vergisst die Anwendung aufgrund eines Programmfehlers, den Griff nach Gebrauch zurückzugeben. Dies ist ein Griffleck.
Denken Sie daran, dass Ressourcen auf einem Server endlich sind. Wiederholte Handle-Lecks können den Server im Laufe der Zeit ‚erschöpfen‘, wodurch sich die Leistung des Servers verschlechtert. Überwachen und handhaben Sie die Nutzung im Laufe der Zeit genau. Wenn die Anzahl der offenen Griffe drastisch oder konstant ansteigt, kann dies zu einem Griffleck führen.
Sie müssen die Täter untersuchen und identifizieren. Sie können solche Prozesse entweder beenden oder die Programme patchen .
Prozessaktivität
Es kann vorkommen, dass eine Anwendung neue Prozesse erstellt, ohne zuvor gestartete Prozesse anzuhalten. Die Handhabung und das Multitasking dieser Prozesse können Ihren Server belasten.
Infolgedessen wird Ihre Serverleistung drastisch leiden.Stellen Sie sicher, dass Anwendungen ordnungsgemäß ausgeführt und beendet werden. Dazu müssen Sie alle Prozessaktivitäten auf Ihrem Server verfolgen und überwachen.
Netzwerkverkehr
Die Überwachung der Netzwerkaktivität ist entscheidend für die Messung der Leistung Ihres Servers. Jede Netzwerkschnittstelle bietet eine Anzeige der Netzwerkaktivitätslast. Wenn sich die Bandbreitennutzung der maximalen Geschwindigkeit der Netzwerkschnittstelle nähert, kann dies auf einen möglichen Engpass hinweisen.
Durch die ständige Überwachung der Ein- und Ausgangsaktivitäten (E/A) auf der Netzwerkkarte können Sie mögliche Hardwarefehler oder Überlastungen erkennen. Sie können auch die Hardwareanforderungen planen, um eine optimale Serverleistung zu gewährleisten.
TCP-Aktivität
Ihre Anwendungen sind verbindungsorientiert. Sie verwenden TCP als Transportprotokoll. HTTP, SQL, SMTP verwenden TCP darunter. Wenn die Leistung der TCP-Schicht sinkt, sinkt auch die Leistung Ihrer Anwendung.
Es gibt mehrere wichtige Metriken, die bei der Überwachung von TCP helfen:
- Die Verbindungsrate zum und vom Server hilft bei der Angabe der Serverauslastung.
- Die Anzahl der Verbindungsabbrüche auf dem Server. Eine hohe Zahl könnte auf ein Problem hinweisen.
- % der erneuten Übertragungen – Erneute Übertragungen treten auf, wenn der Server keine Bestätigung vom Client erhält. Nach dem Timeout muss der Server die Übertragung erneut senden. Halten Sie Wiederholungen auf ein Minimum, um eine gute TCP-Leistung sicherzustellen. Beachten Sie, dass wiederholte erneute Übertragungen zu einer starken Verringerung des Durchsatzes führen können.
Betriebssystemprotokolldateien
Das wahrscheinlich gebräuchlichste Mittel zur Überwachung des Zustands Ihres Servers sind Betriebssystemprotokolle, da sie Fehlerdetails, Abstürze und andere Arten von Anomalien enthalten, um Ihnen bei der Fehlerbehebung zu helfen.
Während Windows System-, Sicherheits- und Anwendungsprotokolldateien anbietet, verfügt Unix über Systemprotokoll- und Cron-Protokolldateien, die im Verzeichnis /var/log gespeichert sind. Regelmäßige regelmäßige Überwachung, Analyse und Alarmierung von Protokollereignissen können Sie auf Serveranomalien aufmerksam machen.
- Über den Autor
- Neueste Beiträge
Über Jason Chow
- So überwachen Sie die Serverleistung – Mai 17, 2021