サーバーのパフォーマンスを監視する方法
サーバーの監視は、ビジネスの中断を防ぐために、サーバーのパフォーマンスを最適化するために重要です。 ただし、サーバーのパフォーマンス監視は分散して複雑になる可能性があります。 すべてに目を維持することは、上り坂の戦いとなっています。 サーバー上の情報を使用すると、何がうまくいかなかったのかをよりよく理解できます。 Retraceのようなツールは、この上り坂の戦いをより合理化され、管理しやすくします。 サーバーのパフォーマンスを監視する方法を学びましょう。
サーバー監視とは何ですか?
サーバー監視は、円滑な運用を確保するために、さまざまなメトリックに目を離さないことを含みます。 さまざまなメトリックを監視することで、ボトルネックを簡単に特定できます。
すべてのビジネスクリティカルなオンラインサービスの背後には、通常、物理的または仮想的な複数のサーバーがあります。 物理サーバーは複数のエンジンを実行する可能性があり、その結果、複数のサーバー機能が実行されます。 物理サーバーの例としては、データベースサーバー、アプリケーションサーバー、およびwebサーバー
サーバー監視が重要な理由
サーバー監視は、エンドユーザーに影響を与える前にパフォーマ また、サーバー監視は、サーバーのシステムリソースの使用状況を理解するのに役立ちます。 これにより、サーバーの容量をより適切に計画することができます。
サーバーを監視することで、サーバーの応答性と可用性を良好に示すことができます–すべては、顧客へのサービスの配信に中断を生じさせないことを保証す
監視指標は、サイバーセキュリティの脅威を示すこともできます。 これは、webへの露出が増加した脅威のwebサーバープロファイルにつながる可能性があるwebホスティングに不可欠です。
サーバーのパフォーマンスを監視する方法
キャプション:webホスティングでは、コントロールパネルには多くの場合、さまざまなリソースの使用状況を表示するのに役立つ監視ツールが含まれています。
サーバー監視戦略を成功させるための鍵は、焦点を当てる領域を特定し、パフォーマンスベースラインを作成することです。 これは、サーバーのパフォーマンスをアラートの目的で解釈し、レポートを通じて付加価値の高い情報を取得します。
これに役立つサーバー監視ツールがあります。 また、アプリケーションやインフラストラクチャ全体の監視にも役立ちます。 Stackify Retraceは、サーバー監視戦略を成功させるための優れたツールです。 StackifyのRetrace APMソリューションは、あなたのサーバーのスタックの鳥瞰図を提供します。 Retraceプラットフォームは、ITフレームワークに貢献するすべてのアプリケーションを自動的に分析し、パフォーマンスベースの幅広いメトリックを監視し、小さなエラーや不整合が制御不能になる前にアクションを実行することができます。 Retraceはあなたのチームを与えます:
- アプリのパフォーマンス監視
- アプリ管理機能
- 集中ログツール
- コードの行ごとのビューと全体像との適合
- 堅牢なエラー追跡レポート
- 一連のリアルタ6532>個々のユーザー監視機能
retraceのようなオールインワンのパフォーマンス監視ソリューションでは、サーバースタックを簡単に分析し、大規模で壊滅的な障害が発生する前に弱点の領域を特定することができます。 それはあなたのサーバーとその構成のアプリがネットワーク負荷の下でどのように機能するかの長いビューを提供します。
監視するための重要な領域
サーバーがWindowsまたはUnix上で実行されているかどうかにかかわらず、これらの重要なパフォーマンス領域は、サーバー監視戦略の出発点 パフォーマンスのボトルネックの指標として、これらのパフォーマンス指標を追跡することが重要です。
サーバーの物理的状態
これはオンサイトサーバーに適用されます。 サーバーを安全な部屋に保つことは別として、サーバーの温度と電源を確保する必要があります。
サーバー環境での効率的なパフォーマンスのために、温度は推奨レベルを超えることはできません。 温度が一貫して上昇し始めると、ファンの問題や他の何かを知らせる可能性があります。 あなたはさらに調査する必要があります。
また、サーバーの電源入力の電源レギュレータを監視する必要があります。 彼らは、電力サージやディップを管理し、滑らかにする必要があります。 ただし、主電源が壊れた場合、無停電電源装置(UPS)は、バックアップ電源に切り替える時間を購入することができます。
中央処理装置(CPU)&メモリ
サーバーのパフォーマンスが低下するたびに、通常の容疑者はサーバーのCPU使用率とメモリリソースです。 サーバーのCPU使用率が異常に高い場合、またはメモリ使用率が高い場合(使用可能な空きメモリ領域が少ない場合)、アプリケーションのパフォーマンスが低下
あなたのサーバー上のトップのCPUとメモリを消費するプロセスが何であるかを知ることは良いことです。 これは、リソース使用量の問題を迅速に修正するために重要です。 測定するメトリクスには、CPUプロセス数、CPUスレッド数、およびCPU%割り込み時間が含まれます。
サーバーのメモリ使用量を監視する必要があります。 これには利用可能な空きメモリが含まれ、ratesページは物理メモリ空間を解放するために書き込まれます。 これらのすべての指標は、常にサーバーの健全性を理解するのに役立ちます。
サーバーの稼働時間
あなたのウェブサイトは24時間稼働していなければなりません。 サーバーの稼働時間は、システムが稼働している時間を測定します。 このメトリックは、システムが無意識のうちに再起動した可能性があるときに警告するのに役立ちます。
予想されるサーバーの可用性期間とサーバーの稼働時間の数値との間に不一致が見つかった場合、システムは少なくとも一度は障害が発生しています。 システムの障害が完了したときとほぼ同じ時間に実行される予定のすべてのタスクが完了したかどうかを確認します。
ディスクアクティビティ
ディスクアクティビティは、ディスクドライブが要求を積極的に処理するのにかかる時間です。 監視する必要があるいくつかの主要な指標があります:
- Disk busy time–ディスクがアクティブになっている時間の割合を測定します。 この値が高い場合は、ディスクへのアクセス要求が積み上げられていることを意味します。
- 入出力操作(I/OPs)–ディスクドライブの作業負荷を示します。 このメトリックを監視すると、ディスクが受けているワークロードを理解するのに役立ちます。
- ディスク読み取り/書き込み–ディスクからのデータブロックの読み取り/書き込みにかかる時間を測定します。 低い値は、パフォーマンスが良好であることを意味します。
- ディスクキューの長さ–キュー内の要求を処理するのにかかる時間を測定します。 最高のパフォーマンスを得るには、ディスクキューの長さを最小限に抑える必要があります。
ディスクのパフォーマンスを監視することは、I/OPsを大量に消費するタスクにとって非常に重要であることに注意してください。
ページファイルの使用
未使用または未処理のデータがページファイルに格納されます。オペレーティングシステム(OS)の制限されたランダムアクセスメモリ(RAM)領域を超える操作も、格納されるページファイルに送信されます。
その使用量が高いことがわかった場合、これはシステムのページングファイルがサーバーのニーズに対応するのに十分ではないことを意味します。
もう一つの重要な指標は、ページスワップです。 サーバーが作業メモリを使い果たしているときは、ディスク領域の領域が一時的にデータを保存するために予約され、より多くの領域が解放されます。 ページの交換はお勧めしません。 通常、これは、サーバーを実行するのに十分なメモリをプロビジョニングしていないことを意味します。
覚えておいてください、ページの交換は、メモリ容量の枯渇に対する短期的な解決です。 ページ交換は応答時間を短縮するので、これは避けるべきです。
コンテキストスイッチ
コンテキストスイッチは集中的なプロセスです。 これは、カーネル(コンピュータのOSのコアにあるコンピュータプログラム)がプロセッサをあるプロセスまたはスレッドから別のプロセスに切 CPUリソースは、コンテキストの切り替えが発生するたびに使用されます。 そのため、広範なコンテキスト切り替えが発生すると、ますます重要なCPUリソースが取り込まれます。
これは、複数のビジープロセスを実行しているか、コンテキスト切り替えの数を増加させるアプリケーションのバグが原因で発生します。 サーバー上でのコンテキスト切り替えの急激な増加は、問題を示す可能性があります。 したがって、コンテキストスイッチの監視は、サーバーのパフォーマンスに不可欠です。
時刻同期
ファイルを共有したり、相互に通信したりする同じネットワーク上のシステムには、時間制限のあるアクティビティがあります。 だから、システムクロックが同期されていない場合を想像してみてくださ 結果は悲惨なことができます。
クロックが不正確な場合、データが上書きされたり、バージョンの競合が発生する可能性があります。 さらに悪いことに、プログラムが正しく機能しない可能性があります。 基準クロックに対するシステムクロックオフセットを常に監視します。
Handles Usage
Handlesは、アプリケーションが参照するリソースを参照します。 サーバー要求および受信リソースで実行されているアプリケーションは、それらを使用した後、OSに返されます。 時には、プログラムエラーのために、アプリケーションは使用後にハンドルを返すのを忘れます。 これはハンドルリークです。
サーバー上のリソースは有限であることを覚えておいてください。 ハンドルリークが繰り返されると、時間の経過とともにサーバーが”排気”され、サーバーのパフォーマンスが低下する可能性があります。 使用法をそのうちに密接に監視し、扱って下さい。 開いているハンドルの数が大幅にまたは一貫して増加した場合、これはハンドルの漏れを意味する可能性があります。
犯人を調査して特定する必要があります。 このようなプロセスを終了するか、プログラムにパッチを適用することができます。
プロセスアクティビティ
以前に起動したプロセスを停止せずにアプリケーションが新しいプロセスを作成する場合があります。 これらのプロセス間での処理とマルチタスクは、サーバーに負担をかける可能性があります。
その結果、サーバーのパフォーマンスが大幅に低下します。アプリケーションが正しく実行され、正しく終了するようにします。 これを行うには、サーバー上のすべてのプロセスアクティビティを追跡して監視する必要があります。
ネットワークトラフィック
ネットワークアクティビティの監視は、サーバーのパフォーマンスを測定する上で重要です。 各ネットワークインターフェイスは、ネットワークアクティビティの負荷を示します。 帯域幅の使用量がネットワークインターフェイスの最高速度に近づいている場合、これはボトルネックの可能性を示している可能性があります。
ネットワークカード上の入出力(I/O)アクティビティを常に監視することにより、ハードウェアの障害や過負荷の可能性を検出できます。 また、最適なサーバーパフォーマンスを確保するためのハードウェア要件を計画することもできます。
TCPアクティビティ
アプリケーションは接続指向です。 彼らはトランスポートプロトコルとしてTCPを利用しています。 HTTP、SQL、SMTPの下にTCPを使用します。 TCP層のパフォーマンスが低下すると、アプリケーションのパフォーマンスも低下します。
TCPの監視に役立ついくつかの重要なメトリックがあります:
- サーバーとの接続レートは、サーバーのワークロードを示すのに役立ちます。
- サーバー上で接続が切断された回数。 高い数値は問題を示す可能性があります。
- 再送信の%–サーバーがクライアントから確認応答を受信しない場合に再送信が発生します。 タイムアウト時に、サーバーは送信を再度送信する必要があります。 良好なTCPパフォーマンスを確保するには、再送信を最小限に抑えます。 繰り返し再送信すると、スループットが大幅に低下する可能性があることに注意してください。
OSログファイル
サーバーの正常性を監視する最も一般的な方法は、問題のトラブルシューティングに役立つエラーの詳細、クラッシュ、およびその他の
Windowsはシステム、セキュリティ、アプリケーションのログファイルを提供しますが、Unixはシステムログとcronログファイルを/var/logディレクトリに格納し ログイベントの定期的な定期的な監視、分析、および警告は、サーバーの異常を警告するのに役立ちます。
- 著者について
- 最新記事
ジェイソン・チャウについて
- サーバーのパフォーマンスを監視する方法-May17, 2021