トータルコスト削減と運用安定化の要(カナメ)

第2回 根が深い問題

概要

システム運用管理者や開発者にとって、電源や空調は水や空気と同じように「あって当たり前」の存在ではないでしょうか。しかし近年のサーバー高密度化や様々な対策要求に伴い、かつての汎用機(レガシー)のような、各種設備や温度・湿度をはじめとする環境の高度な監視・制御が必要になりつつあります。財団法人日本情報処理開発協会(以下、JIPDEC)の統計では、地震・火災や電源・空調など設備対策を必要とするものに起因するシステム停止原因の割合は約3割に上り、システム安定稼働対策の最大の要因となっています。一方で、設備は総務やビル管理業者・設備業者に任せきりで、詳細は知らないという例が多いと聞きます。本当にそれで良いのでしょうか。本稿では、経験に基づきこれらの実態について解き明かしていきます。

システムを維持するために必要な設備は、電気や空調から始まって認証装置やカメラに至るまで様々な種類があります。前回最後に触れたように、建築物の構造に関する知識が必要な場合もあります。今までシステム運用管理の面から、これらについて全体を網羅してバランスやパフォーマンスを議論されることはあまりありませんでした。なぜなら設備業界の中でさえ、電気や空調などそれぞれが個々の専門ジャンルになっており、たとえば電気も重電と弱電で分かれるなど、多くの種類の設備を1つの用途(システム運用)のために統合管理するのが難しかったという事情があります。さらにこれら設備を監視・制御するノウハウは「計装」というFA(ファクトリーオートメーション)業界のものであり、異業種技術の組み合わせが必要だったのです。

業種が違えば用語も感覚も異なります。たとえばIT業界で「アプリケーション」と言うと適用業務プログラムを指すことはご存知と思いますが、FA業界では全く同じ言葉を「事例」という意味で使います。私はミニデータセンターとも言われる総合災害対策・セキュリティ対策商品(大型金庫内にサーバー稼働空間を構築したもの)の技術設計をしていましたので、いつのまにか計装にもはまってしまいましたが、当初会話の中で出てくるこの単語の使い方には戸惑いました。またシステム運用管理では無停止は常識化していますが、設備業界では「停止」することが常識です。設備・環境管理を確立するためには、これら各業界のノウハウ・情報・技術を共有しつつ、それぞれのギャップを埋めてトータルコーディネートすることが必要なのです。その中でも重要なのは、利用者である「システム運用管理の感覚」です。これが最大の難関となります。

過去に設備に関わったことのあるシステム運用部門の方は、設備業者との押し問答やすれ違いに疲れてしまったのではないでしょうか。設備業界やFA業界の人たちにとって、IT業界はかなりハードルの高い別世界です。みなさんは「そんなことは無い」と言われるでしょうが、IT業界をベースとして各業界に入り込んだ経験から言わせて頂くと、やはりIT業界は「特殊」です。理由はその役割にあります。IT部門は、経営はもとより、生産管理や人事・経理など、企業内のすべての業務と密接に関わっています。そのため、各部門からの多種多様なレベル・内容の要求を、あまねく満たさなければならない宿命にあります。システム運用部門はその最前線にいるのですから、そのプレッシャーは大変なものです。でも他部門はそれを理解してくれません。まして業界の異なる設備業者にわかってもらうのは困難と言わざるを得ません。加えてただでさえ厳しい要求を、特有のIT用語によって設備業者に説明することになるのですから、システム運用の実現したいことが、どのくらい伝わるか疑問です。これを解決するIT設備に通じた事業者もありますが、システム運用部門と気持ちを一つにした、設備運用に対する直接的な支援と最適な説明は、永遠の課題と言えます。

システム運用部門は設備のプロではありません。実現したいことを、設備業者が正確に理解できるよう説明するのは至難の業です。一方設備業界は「言われたことだけを言われたようにやる」という傾向があります。これは「責任分界点」にこだわるからです。それに輪を掛けるのが「仕様外の仕様」です。製品には仕様書・取扱説明書がありますが、その製品のすべてを書ききったものはありません。重要な情報が漏れていることも時としてあります。それを知るためにはメーカーの開発者と直接情報交換するしかないのですが、普通はここまでやりません。

ところで設備業者に見積もりしてもらい、了解の上発注したけれど、できたものがどこか違っていたなんてことを経験された方はおられませんか。複数の業者に見積もりしてもらったら、桁違いの数字が出てきたなどということは無いでしょうか。このほとんどは要件定義と設計に問題があるのです。まず要件が設備業者にきちんと理解されていません。同類の設備機器でも色々な品質があります。「安く」と言われればそれなりのものを使って安くできますが、短寿命だったり性能を発揮できないことが往々にしてあります。障害率が高くなったり、作って1年もしないうちに手直しが必要になった、なんてありませんでしたか。逆に無意味に高価なものを組み込まれたりすることもあります。初期費用は安いが人件費を含めたランニングコストが高く付く場合もあります。結局トータルコストをコントロールすることができないことになります。仮に表面上設備が構築できたとしても、たとえば運用上の注意だとかフォローを期待することはできません。

今まで設備業者を悪く言ってきたように思われるかもしれませんが、そんな意図はありません。これが設備業者の限界だからです。設備業者は言われた設備を、安全確実かつ定められた工期で施工する(取り付ける)という任務があります。これだけでもとっても大変な仕事です。

前回述べたように、近年のブレードサーバーやストレージに象徴される高密度化によって、かつての汎用機が求めていたような厳密な環境管理が必要になりつつありますが、これらの稼働環境仕様について理解している設備関係者はあまりいないでしょう。一方で災害対策やセキュリティ要求など、課題は急激に複雑化しています。いまシステムは問題なく動いているから大丈夫、と思われている方は多いと思いますが、早めに準備しておかないと何かあったときの対処やトレースは大変になります。何しろ本稿最初に述べた通り、設備に起因する障害は、全体の3割もあるのですから。

しかしこれだけ根の深い問題があると、対策はそう簡単ではありません。

※本文中の引用に関しましては、日経BP様・JIPDEC様の許可を得ております。

連載一覧

コメント

筆者紹介

及川正稔(おいかわ まさみ)

1961年生まれ、宮城県出身。

約3年間公務員勤務の後、1987年から20年間、大手警備会社のIT子会社にて主にシステム運用管理を担当し、大型汎用機のプリンタレーザー化やA-AUTO・A-SPOOL等の導入を主管。

2002年から同社データセンターの設備管理を担当してISMS認証取得や旧安対(安全対策実施事業所認定)継続に関わるとともに、ミニデータセンターとも言われる総合災害対策・セキュリティ対策商品(大型金庫内にサーバー稼働空間を構築したもの)の技術企画・設計監理・運用支援や、電算室構築企画・設計に携わった。

2007年4月、お客様サイドに立った電算室等の設備・環境の設計監理、運用支援を主業務とするデボウトスキル株式会社を設立 代表取締役に就任。

バックナンバー