Cómo Supervisar el Rendimiento del Servidor
La supervisión del servidor es importante para un rendimiento óptimo del servidor y garantizar que no haya interrupciones en su negocio. Sin embargo, la supervisión del rendimiento del servidor puede ser dispersa y compleja. Vigilar todo se ha convertido en una batalla cuesta arriba. La información en el servidor le permite comprender mejor lo que salió mal. Herramientas, como el retroceso, que hacen que esta batalla cuesta arriba sea más ágil y manejable. Aprendamos a supervisar el rendimiento del servidor.
¿Qué es la supervisión del servidor?
La supervisión del servidor implica vigilar varias métricas para garantizar su funcionamiento sin problemas. El monitoreo de diferentes métricas ayuda a identificar fácilmente los cuellos de botella.
Detrás de cada servicio en línea crítico para el negocio, generalmente hay varios servidores responsables, físicos o virtuales. Un servidor físico puede ejecutar varios motores, lo que resulta en múltiples funciones de servidor. Algunos ejemplos de servidores físicos son servidores de bases de datos, servidores de aplicaciones y servidores web
Por qué es importante la supervisión del servidor
La supervisión del servidor es esencial para identificar proactivamente cualquier problema de rendimiento antes de que afecte al usuario final. Además, la supervisión del servidor ayuda a comprender el uso de recursos del sistema del servidor. Esto le permite planificar mejor la capacidad del servidor.
El monitoreo del servidor proporciona una buena indicación de la capacidad de respuesta y disponibilidad del servidor, todo con el fin de garantizar que no se interrumpa la entrega de su servicio a sus clientes.
Las métricas de monitoreo también pueden indicar una amenaza de ciberseguridad. Esto es esencial con el alojamiento web, donde la exposición a la web puede resultar en un mayor perfil de servidor web de amenazas.
Cómo Supervisar el Rendimiento del Servidor
Leyenda: En el alojamiento web, los paneles de control a menudo incluyen herramientas de monitoreo que pueden ayudar a mostrar el uso de varios recursos.
La clave para una estrategia de monitoreo de servidores exitosa es identificar las áreas en las que centrarse y crear una línea de base de rendimiento. Esto interpreta perfectamente el rendimiento de su servidor con fines de alerta y obtiene información de valor agregado a través de informes.
Hay herramientas de monitoreo de servidores que pueden ayudarlo con esto. También pueden ayudar a monitorear las aplicaciones o toda la infraestructura. Stackify Retrace es una excelente herramienta para garantizar una estrategia de monitoreo de servidores exitosa. La solución de APM de rastreo de Stackify le brinda una vista panorámica de la pila de su servidor. La plataforma de rastreo analiza automáticamente todas las aplicaciones que contribuyen a su marco de TI, lo que le brinda la capacidad de monitorear una amplia gama de métricas basadas en el rendimiento y tomar medidas antes de que los pequeños errores e inconsistencias se salgan de control. Desandar le da a su equipo:
- Monitoreo del rendimiento de la aplicación
- Funciones de administración de la aplicación
- Una herramienta de registro centralizada
- Una vista línea por línea de su código y cómo se ajusta al panorama general
- Informes robustos de seguimiento de errores
- Un conjunto de funciones de monitoreo de servidor en tiempo real
- Funciones de monitoreo de usuario individual
Una solución de monitoreo de rendimiento todo en uno, como Retrace, le permite diseccionar fácilmente su pila de servidores y detectar áreas de debilidad antes de que se produzca una falla catastrófica más grande. Le da una visión a largo plazo de cómo funciona su servidor y sus aplicaciones constituyentes bajo carga de red.
Áreas clave para monitorear
Ya sea que sus servidores se ejecuten en Windows o Unix, estas áreas clave de rendimiento sirven como un buen punto de partida para cualquier estrategia de monitoreo de servidores. Es importante hacer un seguimiento de estas métricas de rendimiento como indicadores de cuellos de botella de rendimiento.
Estado físico del servidor
Esto se aplica a los servidores en el sitio; los servidores en el sitio necesitan protección contra daños y peligros ambientales. Aparte de mantener los servidores en una sala segura, debe asegurarse de que la temperatura y el suministro de energía de los servidores.
La temperatura no puede exceder el nivel recomendado para un rendimiento eficiente en su entorno de servidor. Si la temperatura comienza a aumentar constantemente, podría indicar un problema con el ventilador u otra cosa. Tendrá que investigar más a fondo.
También necesita monitorear los reguladores de la fuente de alimentación en la entrada de alimentación de su servidor. Deben gestionar y suavizar las sobretensiones y caídas de energía. Sin embargo, si se rompe la fuente de alimentación principal, su Fuente de Alimentación ininterrumpida (UPS) puede comprarle tiempo para cambiar a la energía de respaldo.
Unidad de procesamiento central (CPU) & Memoria
Cuando el rendimiento de un servidor se degrada, los sospechosos habituales son la utilización de la CPU del servidor y los recursos de memoria. Si el uso de CPU de su servidor es inusualmente alto o hay una alta utilización de memoria (menos espacio de memoria libre disponible), el rendimiento de sus aplicaciones se verá afectado.
Es bueno saber cuáles son los principales procesos que consumen CPU y memoria en su servidor. Esto es importante para solucionar rápidamente los problemas de uso de recursos. Las métricas a medir incluyen el Recuento de procesos de CPU, el Recuento de Subprocesos de CPU y el % de tiempo de interrupción de la CPU.
Deberá supervisar el uso de memoria de su servidor. Esto incluye memoria libre disponible, las páginas de tarifas están escritas para liberar espacio de memoria física, entre otros. Todas estas métricas pueden ayudarlo a comprender el estado de su servidor en todo momento.
Tiempo de actividad del servidor
Su sitio web debe estar funcionando y disponible durante todo el día. El tiempo de actividad del servidor mide la cantidad de tiempo que un sistema ha estado operativo. Esta métrica es útil para avisarle cuando el sistema puede haberse reiniciado sin saberlo.
Si descubre una discrepancia entre el período de disponibilidad del servidor esperado y la cifra de tiempo de actividad del servidor, el sistema ha fallado al menos una vez. Confirme si se completaron todas las tareas programadas que se esperaba que se ejecutaran aproximadamente al mismo tiempo que cuando el sistema falló.
Actividad de disco
La actividad de disco es el tiempo que tarda una unidad de disco en procesar solicitudes de forma activa. Hay varias métricas clave que deben monitorearse:
- Tiempo de ocupación del disco: mide el porcentaje de tiempo que el disco está activo. Si este valor es alto, significa que sus solicitudes de acceso al disco se están acumulando.
- Operaciones de entrada y salida (I / OPs): indica la carga de trabajo en la unidad de disco. La supervisión de esta métrica puede ayudar a comprender la carga de trabajo a la que está sometido el disco.
- Lectura/escritura del disco: mide el tiempo que se tarda en leer / escribir bloques de datos del disco. El valor más bajo significa que el rendimiento es bueno.
- Longitud de la cola de disco: mide el tiempo que se tarda en atender una solicitud en una cola. Para obtener el mejor rendimiento, la longitud de la cola de disco debe ser mínima.
Tenga en cuenta que la supervisión del rendimiento del disco es muy importante para las tareas que requieren mucha I/OPs.
Uso del archivo de página
Los datos no utilizados o no procesados se almacenan en el archivo de página.Las operaciones que exceden el espacio limitado de memoria de acceso aleatorio (RAM) del sistema operativo (SO) también se envían al archivo de página que se va a almacenar.
Cuando encuentra que su uso es alto, esto significa que el archivo de paginación del sistema no es suficiente para satisfacer las necesidades de su servidor.
Otra métrica importante es el intercambio de páginas. Cuando el servidor se está quedando sin memoria de trabajo, se reserva un área de espacio en disco para guardar temporalmente los datos a fin de liberar más espacio. No recomendamos el intercambio de páginas. Por lo general, esto significa que no ha aprovisionado suficiente memoria para ejecutar el servidor.
Recuerde, el intercambio de páginas es una resolución a corto plazo al agotamiento de la capacidad de memoria. Dado que el intercambio de páginas reduce el tiempo de respuesta, esto debe evitarse.
Conmutadores de contexto
La conmutación de contexto es un proceso intensivo. Ocurre cuando el núcleo (programa de computadora en el núcleo del sistema operativo de una computadora) cambia el procesador de un proceso o subproceso a otro. Los recursos de CPU se utilizan cada vez que se produce un cambio de contexto. Por lo tanto, cuando se produce un cambio de contexto extenso, se toman más y más recursos de CPU importantes.
Esto se debe a la ejecución de varios procesos ocupados o errores de aplicación que aumentan el número de cambios de contexto. Un aumento repentino en la conmutación de contexto en un servidor puede indicar un problema. Por lo tanto, la supervisión de los conmutadores de contexto es esencial para el rendimiento de su servidor.
Sincronización de tiempo
Los sistemas de la misma red que comparten archivos o se comunican entre sí tienen actividades de duración limitada. Por lo tanto, imagínese si los relojes del sistema no están sincronizados? Los resultados podrían ser desastrosos.
Los relojes inexactos pueden hacer que los datos se sobrescriban o crear conflictos de versiones. En el peor de los casos, puede hacer que los programas funcionen incorrectamente. Supervise siempre las compensaciones de reloj del sistema con respecto a un reloj de referencia.
Manejadores de uso
Los manejadores se refieren a los recursos a los que hace referencia una aplicación. Las aplicaciones que se ejecutan en su solicitud de servidor y los recursos de recepción los usan, después de lo cual se devuelven al sistema operativo. A veces, debido a un error del programa, la aplicación ‘olvida’ devolver el controlador después de su uso. Esto es una fuga de mango.
Recuerde que los recursos de un servidor son finitos. Las fugas de manija repetidas pueden «agotar» el servidor con el tiempo, causando que el rendimiento del servidor se degrade. Supervise y maneje el uso de cerca a lo largo del tiempo. Si el número de mangos abiertos aumenta de forma drástica o constante, esto podría implicar una fuga de mangos.
Tendrá que investigar e identificar a los culpables. Puede terminar dichos procesos o parchear los programas .
Actividad de proceso
Puede haber instancias en las que una aplicación cree nuevos procesos sin detener procesos iniciados previamente. El manejo y la multitarea en estos procesos pueden sobrecargar su servidor.
Como resultado, el rendimiento de su servidor se verá drásticamente afectado.Asegúrese de que las aplicaciones se ejecutan correctamente y salen correctamente. Para ello, debe realizar un seguimiento y supervisar todas las actividades de proceso en su servidor.
Tráfico de red
El monitoreo de la actividad de red es crucial para medir el rendimiento de su servidor. Cada interfaz de red proporciona una indicación de la carga de actividad de la red. Si el uso de ancho de banda se acerca a la velocidad máxima de la interfaz de red, esto podría indicar un posible cuello de botella.
Al monitorear constantemente las actividades de entrada y salida (E/S) en la tarjeta de red, puede detectar posibles fallas de hardware o sobrecarga. También puede planificar los requisitos de hardware para garantizar un rendimiento óptimo del servidor.
Actividad TCP
Sus aplicaciones están orientadas a la conexión. Utilizan TCP como protocolo de transporte. HTTP, SQL, SMTP usan TCP debajo. Si el rendimiento de la capa TCP disminuye, también lo hace el rendimiento de la aplicación.
Hay varias métricas importantes que ayudan con la supervisión de TCP:
- La velocidad de conexión hacia y desde el servidor ayuda a indicar la carga de trabajo del servidor.
- El número de caídas de conexión en el servidor. Un número elevado podría indicar un problema.
- % de las retransmisiones: las retransmisiones se producen cuando el servidor no recibe un acuse de recibo del cliente. Al finalizar el tiempo de espera, el servidor tiene que enviar la transmisión de nuevo. Para garantizar un buen rendimiento de TCP, mantenga las retransmisiones al mínimo. Tenga en cuenta que las retransmisiones repetidas pueden resultar en una reducción severa del rendimiento.
Archivos de registro del sistema operativo
Probablemente el medio más común de monitorear el estado de su servidor son los registros del sistema operativo, ya que contienen detalles de errores, bloqueos y otros tipos de anomalías para ayudarlo a solucionar cualquier problema.
Mientras que Windows ofrece archivos de registro de Sistema, Seguridad y Aplicaciones, Unix tiene archivos de registro de sistema y archivos de registro cron almacenados en el directorio /var/log. El monitoreo periódico, el análisis y la alerta de eventos de registro pueden ayudarlo a alertarlo de cualquier anomalía del servidor.
- Sobre el Autor
- Últimas entradas
Acerca de Jason Chow
- Cómo Supervisar el Rendimiento del Servidor de Mayo 17, 2021