Come monitorare le prestazioni del server
Il monitoraggio del server è importante per le prestazioni ottimali del server per garantire che non ci siano interruzioni per la tua azienda. Tuttavia, il monitoraggio delle prestazioni del server può essere disperso e complesso. Tenere d’occhio tutto è diventata una battaglia in salita. Le informazioni sul server ti consentono di capire meglio cosa è andato storto. Strumenti, come Retrace, che rendono questa battaglia in salita più snella e gestibile. Impariamo come monitorare le prestazioni del server.
Che cos’è il monitoraggio del server?
Il monitoraggio del server implica tenere d’occhio varie metriche per garantire il suo funzionamento regolare. Il monitoraggio di diverse metriche aiuta a individuare facilmente i colli di bottiglia.
Dietro ogni servizio online business-critical, ci sono in genere più server responsabili-fisici o virtuali. Un server fisico può eseguire più motori, con conseguente più funzioni del server. Alcuni esempi di server fisici sono server di database, server di applicazioni e server Web
Perché il monitoraggio del server è importante
Il monitoraggio del server è essenziale per identificare in modo proattivo eventuali problemi di prestazioni prima che abbiano un impatto sull’utente finale. Inoltre, il monitoraggio del server aiuta a comprendere l’utilizzo delle risorse di sistema del server. Ciò consente di pianificare meglio la capacità del server.
Il monitoraggio del server fornisce una buona indicazione della reattività e della disponibilità del server, il tutto in nome di garantire l’assenza di interruzioni nell’erogazione del servizio ai clienti.
Le metriche di monitoraggio possono anche indicare una minaccia alla sicurezza informatica. Ciò è essenziale con il web hosting in cui l’esposizione al Web può comportare un aumento del profilo del server Web delle minacce.
Come monitorare le prestazioni del server
Didascalia: Nel web hosting, i pannelli di controllo spesso includono strumenti di monitoraggio che possono aiutare a mostrare l’utilizzo di varie risorse.
La chiave per una strategia di monitoraggio del server di successo è identificare le aree su cui concentrarsi e creare una linea di base delle prestazioni. Questo interpreta correttamente le prestazioni del server a fini di avviso e raccoglie informazioni a valore aggiunto tramite reporting.
Ci sono strumenti di monitoraggio del server che possono aiutarti in questo. Possono anche aiutare a monitorare le applicazioni o l’intera infrastruttura. Stackify Retrace è uno strumento eccellente per garantire una strategia di monitoraggio del server di successo. La soluzione APM Retrace di Stackify ti offre una visione a volo d’uccello dello stack del tuo server. La piattaforma Retrace analizza automaticamente tutte le applicazioni che contribuiscono al framework IT, offrendo la possibilità di monitorare un’ampia gamma di metriche basate sulle prestazioni e di agire prima che piccoli errori e incongruenze sfuggano al controllo. Retrace dà la tua squadra:
- App di monitoraggio delle prestazioni
- App funzioni di gestione
- strumento di controllo centralizzato
- Una riga alla visualizzazione del codice e come si adatta con l’immagine più grande
- Robusto errore report di monitoraggio
- Una suite in tempo reale il monitoraggio del server di funzioni
- Singolo utente, funzioni di monitoraggio
Un all-in-one soluzione di monitoraggio delle prestazioni, come Ripercorrere, ti consente di sezionare il vostro stack di server e di individuare le aree di debolezza prima di una più grande, l’errore irreversibile si verifica. Ti dà una lunga visione di come il tuo server e le sue app costituenti funzionano sotto carico di rete.
Aree chiave per monitorare
Se i server sono in esecuzione su Windows o Unix, queste aree di prestazioni chiave servono come un buon punto di partenza per qualsiasi strategia di monitoraggio del server. È importante tenere traccia di queste metriche di prestazioni come indicatori dei colli di bottiglia delle prestazioni.
Stato fisico del server
Questo vale per i server in loco; I server in loco necessitano di protezione da rischi e danni ambientali. Oltre a mantenere i server in una stanza sicura, è necessario assicurarsi che la temperatura e l’alimentazione dei server.
La temperatura non può superare il livello consigliato per prestazioni efficienti nell’ambiente server. Se la temperatura inizia ad aumentare costantemente, potrebbe segnalare un problema di ventola o qualcos’altro. Avrai bisogno di indagare ulteriormente.
È inoltre necessario monitorare i regolatori di alimentazione sull’ingresso di alimentazione del server. Essi devono gestire e appianare sbalzi di tensione e cali. Tuttavia, se l’alimentazione principale si rompe, il gruppo di continuità (UPS) può guadagnare un po ‘ di tempo per passare all’alimentazione di backup.
Unità di elaborazione centrale (CPU)& Memoria
Ogni volta che le prestazioni di un server si degradano, i soliti sospetti sono l’utilizzo della CPU del server e le risorse di memoria. Se l’utilizzo della CPU del server è insolitamente elevato o vi è un elevato utilizzo della memoria (meno spazio di memoria disponibile), le prestazioni delle applicazioni ne risentiranno.
È bene sapere quali sono i migliori processi CPU e che consumano memoria sul tuo server. Questo è importante per risolvere rapidamente i problemi di utilizzo delle risorse. Le metriche da misurare includono il conteggio dei processi della CPU, il conteggio dei thread della CPU e il tempo di interrupt % della CPU.
È necessario monitorare l’utilizzo della memoria del server. Questo include la memoria libera disponibile, le pagine tariffe sono scritti per liberare spazio di memoria fisica, tra gli altri. Tutte queste metriche possono aiutarti a capire lo stato del tuo server in ogni momento.
Uptime del server
Il tuo sito web deve essere funzionante e disponibile tutto il giorno. L’uptime del server misura la quantità di tempo in cui un sistema è stato operativo. Questa metrica è utile per avvisarti quando il sistema potrebbe essere stato riavviato inconsapevolmente.
Se si rileva una discrepanza tra il periodo di disponibilità del server previsto e la cifra di uptime del server, il sistema non è riuscito almeno una volta. Verificare se sono state completate tutte le attività pianificate previste per l’esecuzione nello stesso momento in cui il sistema non è riuscito.
Attività disco
Attività disco è il tempo impiegato da un’unità disco per elaborare attivamente le richieste. Ci sono diverse metriche chiave che devono essere monitorate:
- Tempo occupato disco – misura la percentuale di tempo in cui il disco è attivo. Se questo valore è alto, significa che le richieste di accesso al disco si stanno accumulando.
- Operazioni di input e Output (I / OPs) – indica il carico di lavoro sull’unità disco. Il monitoraggio di questa metrica può aiutare a comprendere il carico di lavoro a cui è sottoposto il disco.
- Lettura/scrittura disco-misura il tempo impiegato per leggere/scrivere blocchi di dati dal disco. Il valore più basso significa che le prestazioni sono buone.
- Lunghezza coda disco: misura il tempo impiegato per soddisfare una richiesta in una coda. Per ottenere le migliori prestazioni, la lunghezza della coda del disco dovrebbe essere minima.
Prendere nota che il monitoraggio delle prestazioni del disco è altamente cruciale per le attività che sono fortemente I/OPS intensive.
Utilizzo del file di paging
I dati non utilizzati o non trattati vengono memorizzati nel file di paging.Anche le operazioni che superano lo spazio RAM (random Access Memory) limitato del sistema operativo (OS) vengono inviate al file di paging da memorizzare.
Quando si scopre che il suo utilizzo è elevato, ciò significa che il file di paging del sistema non è sufficiente per soddisfare le esigenze del server.
Un’altra metrica importante è lo scambio di pagine. Ogni volta che il server sta esaurendo la memoria di lavoro, un’area di spazio su disco è riservata per salvare temporaneamente i dati in modo da liberare più spazio. Non raccomandiamo lo scambio di pagine. In genere, ciò significa che non è stato eseguito il provisioning di memoria sufficiente per eseguire il server.
Ricorda, lo scambio di pagine è una risoluzione a breve termine per esaurimento della capacità di memoria. Poiché lo scambio di pagine riduce il tempo di risposta, questo dovrebbe essere evitato.
Interruttori di contesto
Il cambio di contesto è un processo intensivo. Si verifica quando il kernel (programma per computer al centro del sistema operativo di un computer) passa il processore da un processo o thread a un altro. Le risorse della CPU vengono utilizzate ogni volta che si verifica un cambio di contesto. Quindi, quando si verifica un esteso cambio di contesto, vengono assorbite risorse CPU sempre più importanti.
Ciò è causato dall’esecuzione di più processi occupati o bug delle applicazioni che aumentano il numero di cambi di contesto. Un improvviso aumento del cambio di contesto su un server può indicare un problema. Pertanto, il monitoraggio degli switch di contesto è essenziale per le prestazioni del server.
Sincronizzazione dell’ora
I sistemi sulla stessa rete che condividono file o comunicano tra loro hanno attività legate al tempo. Quindi, immaginate se gli orologi di sistema non sono sincronizzati? I risultati potrebbero essere disastrosi.
Orologi imprecisi potrebbero causare la sovrascrittura dei dati o creare conflitti di versione. Peggio ancora, può causare il funzionamento errato dei programmi. Monitorare sempre gli offset dell’orologio di sistema rispetto a un orologio di riferimento.
Utilizzo delle maniglie
Le maniglie si riferiscono alle risorse a cui fa riferimento un’applicazione. Le applicazioni in esecuzione sul server richiedono e ricevono risorse le utilizzano dopo di che vengono restituite al sistema operativo. A volte, a causa di un errore di programma, l’applicazione ‘dimentica’ di restituire la maniglia dopo l’uso. Questa è una perdita di maniglia.
Ricorda che le risorse su un server sono finite. Ripetute perdite di handle possono ‘esaurire’ il server nel tempo, causando il deterioramento delle prestazioni del server. Monitorare e gestire l’utilizzo da vicino nel tempo. Se il numero di maniglie aperte aumenta drasticamente o in modo coerente, ciò potrebbe implicare una perdita di maniglia.
Dovrai indagare e identificare i colpevoli. È possibile terminare tali processi o patchare i programmi .
Attività di processo
Possono esserci casi in cui un’applicazione crea nuovi processi senza arrestare i processi precedentemente avviati. La gestione e il multi-tasking tra questi processi possono appesantire il server.
Di conseguenza, le prestazioni del server ne risentiranno drasticamente.Assicurarsi che le applicazioni vengano eseguite correttamente e uscire correttamente. Per fare ciò, è necessario monitorare e monitorare tutte le attività di processo sul server.
Traffico di rete
Il monitoraggio delle attività di rete è fondamentale per misurare le prestazioni del server. Ogni interfaccia di rete fornisce un’indicazione del carico di attività di rete. Se l’utilizzo della larghezza di banda si avvicina alla velocità massima dell’interfaccia di rete, ciò potrebbe indicare un possibile collo di bottiglia.
Monitorando costantemente le attività di input e output (I/O) sulla scheda di rete, è possibile individuare possibili guasti hardware o sovraccarichi. È inoltre possibile pianificare i requisiti hardware per garantire prestazioni ottimali del server.
Attività TCP
Le applicazioni sono orientate alla connessione. Utilizzano TCP come protocollo di trasporto. HTTP, SQL, SMTP usa TCP sotto. Se le prestazioni del livello TCP diminuiscono, lo stesso vale per le prestazioni dell’applicazione.
Esistono diverse metriche importanti che aiutano a monitorare TCP:
- La velocità di connessione da e verso il server consente di indicare il carico di lavoro del server.
- Il numero di connessioni scende sul server. Un numero elevato potrebbe indicare un problema.
- % delle ritrasmissioni-le ritrasmissioni si verificano quando il server non riceve un riconoscimento dal client. Al timeout, il server deve inviare nuovamente la trasmissione. Per garantire buone prestazioni TCP, mantenere le ritrasmissioni al minimo. Tenete a mente che ritrasmissioni ripetute possono provocare una grave riduzione del throughput.
File di log del sistema operativo
Probabilmente il mezzo più comune per monitorare lo stato del server sono i log del sistema operativo in quanto contengono dettagli di errore, arresti anomali e altri tipi di anomalie per aiutarti a risolvere qualsiasi problema.
Mentre Windows offre file di registro di sistema, sicurezza e applicazioni, Unix ha file di registro di sistema e cron memorizzati nella directory /var/log. Il monitoraggio, l’analisi e l’avviso periodici regolari degli eventi di log possono aiutare a segnalare eventuali anomalie del server.
- Circa l’Autore
- Ultimi Post
Su Jason Chow
- Come per Monitorare le Prestazioni del Server di Maggio 17, 2021