KENTAa920atamaitai_TP_V-2

コンピューターシステムの管理者は、システムの保守・メンテナンス作業の中で「システムトラブルへの対応」を行う必要があります。トラブル対応は、程度にもよりますが緊急性を要したり原因がなかなかわからなかったりとつらい作業です。

システム管理者は、「できれば、トラブル対応はしたくない」というのが本音でしょう。それでは、システム管理者が早くトラブル対応の悩みから解放されるためにはどのようなことに気をつければ良いでしょうか。

ここでは、システム管理者がトラブル対応の悩みから解放されるための着目点についてお話ししていきます。ここで述べる内容を理解し実践していけば、システムトラブルを最小限に抑えてシステム管理者のストレスを減らすことが可能になるでしょう。

保守・メンテナンスでは、作業のマニュアル化と動作監視を行う

日常の、システムの保守・メンテナンス作業で重視すべき事項は、2つあります。一つ目は、「作業のマニュアル化」です。

例えば、トラブルの連絡を行うときに「トラブルに気づいた人は、誰に連絡するのか」「平日日中の連絡先は、どこか」「夜間休日の連絡先は、どこか」「トラブルの連絡時における連絡事項は、何か」など事前に決めておくべきことはたくさんあります。

保守作業の大部分は、マニュアル化できる作業です。マニュアル化しておけば、自分以外の他の人が保守作業を引き継ぐときにもスムーズに進みます。

ひどいのは、保守作業のマニュアルが一切ないことです。そのような場合、システムトラブルが起こるたびに現場のユーザーもシステム管理者も対応に混乱します。とても、本来の業務どころではなくなってしまうでしょう。業務効率を上げるために導入した業務システムが、逆に業務効率を落とすことにもなりかねません。

保守・メンテナンス作業で重視すべき事項の二つ目は、「システムの動作監視を行う」ことです。業務システムの場合、稼働してから徐々にデータが発生し蓄積されるデータが増えていきます。データの増加量の設計は、通常の場合システム設計時に行われます。

ところが、実際のデータの増加量はさまざまな理由により設計時と比べて変動します。「設計時の想定」と「現実の増加量」は違うのです。そのような状況で、実際のデータが設計時想定よりも早く増えていった場合は予定よりも早くデータがいっぱいになります。そして、さらにデータを保存するための空き容量が不足しシステムトラブルに発展してしまいます。

定期的にシステムの動作監視を行えば、このようなトラブルを未然に防ぐことができます。監視項目は、例えば「ディスクボリュームの空き容量」「データの増加量」「CPU(コンピューターの頭脳部分)の負荷」「メモリー(プログラムやデータを記憶する部分)の使用量」「システムイベントのログ」などと決めておきます。

そして、動作監視ではこれらの項目を確認してトラブルの予兆を捕まえます。日頃からこのような動作監視の作業を行うことは、トラブルを未然に防ぐための手段としてたいへん有効です。動作監視は、少しの手間で大きなメリットを享受できる作業です。

過去の実績を重視して設計を行い、テストを抜け漏れなく行う

それでは保守の前段階となるシステムの設計・構築段階において、トラブルの悩みから解放されるためにできることはあるでしょうか。結論から言えば、できることはあると思います。それは、「過去の実績を重視して設計を行う」「テスト抜けや漏れのないように行う」ことです。

システム設計において「過去の実績を重視する」ということは、逆に言えば「過去に実績のない技術的事項は、重点的に管理しなければならない」ことを意味します。

システム設計は、限られた時間内で行わなければなりません。そのため、「過去に実績のある事項の確認は最小限の時間で行い、実績のない事項を重点的に確認する」というような戦略的な思考が必要です。

そして、システム構築ではソフトウェアのテストを抜けや漏れのないよう行うことが大切です。抜けや漏れのないテストを行うために、そのテスト項目については詳細に検討するようにしましょう。

このように、システム管理者がトラブル対応の悩みから解放されるには、システムの保守・設計・構築の段階でそれぞれできることがあります。ここで述べたような事項に着目することにより、システムのトラブルを最小限に防ぎ日常の業務の効率化を図るようにしましょう。