問題のトラブルシューティングのための技法

トラブルシューティングとは、問題解決への系統的なアプローチです。 トラブルシューティングの最終目標は、対象のシステムが予期したとおりに動作しない原因を判別し、その問題を解決する方法を決定することです。 トラブルシューティング作業には、一般によく使用される特定の手法が役立つ場合があります。

トラブルシューティング・プロセスの最初のステップは、問題をうまく記述することです。 問題を記述することは、お客様と IBM 技術サポート担当員が、問題の原因を探る作業をどこから始めるべきかを知るために役立ちます。 このステップには、以下の基本的な質問に回答していただくことが含まれます。

通常、これらの質問に回答することで問題を適切に記述できるようになり、それが問題の解決につながります。

問題の症状は?

問題の記述を始める際に、最も明らかな質問は「問題は何か?」ということです。 この質問は単純なように思われますが、これをいくつかのさらに絞り込んだ質問に分けることで問題をさらに具体的に記述できます。 例えば、以下のような質問です。

どこで問題が発生するか?

問題の発生場所を特定することは必ずしも簡単ではありませんが、問題解決における最も重要なステップの 1 つです。 報告を行うコンポーネントと、障害が発生したコンポーネントの間には、何層ものテクノロジーが介在する可能性があります。 ネットワーク、ディスク、およびドライバーは、問題を調査する際に考慮すべきコンポーネントの一部に過ぎません。

問題の発生場所を絞り込んで問題の層を切り分ける上で、以下の質問が役立ちます。

ある層で問題が報告されても、必ずしもその層が問題の発生源であるとは限りません。 問題の発生源を特定するためには、その問題が存在する環境を理解することも必要です。 オペレーティング・システムとバージョン、対応するすべてのソフトウェアとバージョン、およびハードウェア情報など、時間をかけて問題の環境を詳しく記述してください。 サポートされている構成の環境内で実行していることを確認してください。多くの問題は、たどってみると、同時に実行することが想定されていない、または同時に作動させた状態で十分にテストされていない、非互換のレベルのソフトウェアである場合があります。

いつ問題が発生するか?

障害に至るまでのイベントの詳細な時系列の記録を (特に発生が一回限りである場合) 作成してください。 最も簡単に時系列で記述する方法は、逆方向にたどる方法です。エラーが報告された時から始めて (できるだけ厳密に、ミリ秒に至るまで)、使用可能なログおよび情報を逆方向にたどります。 通常は、診断ログで最初に見つけた疑わしいイベントまでを調べるだけで十分です。

イベントの時系列の記述を詳細に作成するために、以下の質問に対する回答を用意します。

このようなタイプの質問に回答することで、問題調査のための基準枠が得られます。

問題が発生する条件は?

問題発生時に稼働していたシステムや実行されていたアプリケーションを知ることは、トラブルシューティングの重要な部分です。 問題の根本原因を突き止めるためには、ご使用の環境に関する以下の質問が役立つことがあります。

このようなタイプの質問に回答することは、問題が発生する環境を説明して依存関係を相互に関連付けるために役立ちます。 単に同じような時刻に複数の問題が発生していても、必ずしもそれらの問題に関連があるとは限らないことに留意してください。

問題を再現できるか?

トラブルシューティングの観点からすれば、問題を再現できることが理想的です。 一般に、問題を再現できる場合は、より多くのツールや手順を駆使して調査することが可能になります。 そのため、再現できる問題は、たいていデバッグおよび解決が容易です。

ただし、再現可能な問題は不都合を生じることもあります。問題が発生すると業務に大きな影響が出る場合は、問題を再現することは望ましくありません。 可能であれば、テスト環境または開発環境で問題を再現してください。通常、そのような環境では、調査時の柔軟性が高まり、制御が容易になります。


フィードバック