加速する運用保守アウトソーシング(第6回)

成功事例からひも解く!IT運用自動化のポイントとは

2016.06.22 Wed連載バックナンバー

 自動化はITの運用管理を最適化する有効な手段の一つ。しかし自動化ツールを導入すれば万事うまくいくわけではなく、自社のシステムを監視し、障害を検知して構造を深く理解した上で、組み込まないと意味をなさないものになることもあります。その一方でパートナーとの緊密な連携により生み出した自動化プロセスが、現在、さまざまな領域で実装されているのも事実です。今回は成功事例を紹介しながら、最前線の自動化実装のヒントを探っていきます。

 

障害対策、ガバナンス強化に向けた自動化のケース

 最初は日本、中国、APAC、欧州、北米、南米という6リージョンのビジネスユニットでグローバルな事業展開を図るA社の事例です。A社ではリージョンごとに分かれていたネットワーク基盤の統合を機に、バラバラだった運用管理を日本側で一括して行うことにしました。国内からグローバルまで、カバー領域が拡大する中で、運用を最適化するために2つの自動化が実装されています。

 1つ目は、「障害時の初期切り分けの自動化」です。同社が運用の効率化に向けて導入したマネジメントサービスは、機器や回線の遮断時にメールを自動送信する機能を搭載していました。同社のネットワークは冗長構成となっているため、その初報メールに冗長化した回線の情報を含めること、さらに障害の重要度をひと目でわかるようにすることが自動化の目的でした。また、人手ではなく機械的に故障個所を判定する場合、同一の事象で何通も初報メールが飛んでしまうため、1通にまとめたいという要望もありました。

障害時初期切り分けの自動化(1)

 通常の障害検知では監視側からルーターやスイッチといった機器に対して定期的にpingを打ち、正常か異常かを判断します。これを冗長構成のネットワークで自動化する場合、アクト回線、スタンバイ回線それぞれにぶら下がる通信機器同士の親子関係を正確に定義することが前提条件でした。

障害時初期切り分けの自動化(2)

 この親子関係の定義により詳細な障害状況を判断し、その結果を初報メールとして発信するプロセスは完成します。また、「アクト・スタンバイ回線の故障」「アクト回線の故障」「スタンバイ回線の故障」という3つの障害に対して、「プライオリティ1・2・3」という重要度を設定。初報メールの件名に記載することで、障害内容がひと目でわかり、メールに記載された詳細情報により障害時の初動対応がスムーズに行えるようになっています。さらに、これまで人の手で約20分かかっていた初期切り分けが、自動化により瞬時に対応可能になりました。二次対応以降の復旧対応がスムーズになったことや、人的なミスが無くなったことにより、ネットワーク基盤の信頼性が大きく向上したことも大きなメリットと言えます。

 さらに同社では「社内的な変更要求フローの自動化」にも取り組んでいます。これは導入したマネジメントサービスの機能を使ったもので、ルーターやスイッチの設定など、グローバル拠点からの変更要求に対する承認をすべて日本側で実施するというもの。ガバナンス強化を目的として実装されました。

 自動化のポイントはアカウントごとに権限を分けていること。社内及びパートナーに対して権限を細かく定義し、変更要求の各フローで権限者に「承認依頼メール」を送信。承認後は自動的に次のフローに進むようになっています。また、変更要求の進捗状況、履歴が、いつでもポータル画面上で把握できることも大きな強み。これにより依頼内容の事前確認にかかる稼働の削減に成功しています。

 

ADアカウント管理を自動化したケース

 続いては、さまざまなプロダクトのサポート対応をアウトソースするB社の事例です。同社が利用するAD(Active Directory)をはじめとするプロダクトのサポートは外部の「サービスオーダーセンター」が一括して対応。なかでもADのアカウントに関するオーダーが全体の7割を占めていました。しかしADに関する契約内容の上限があり、上限を超えた課金対象となるオーダーについては社内にて対応していました。その追加オーダーが月100件を超えることもあり、アウトソース以上の稼働が発生していました。また、ADアカウントの追加・変更・削除といったオーダー対応には4営業日かかっており、このリードタイムを短縮することも、事業の効率化に向けた大きな課題となっていました。

従来のサポート体制

 こうした課題を解決するために同社が取り組んだのが、ADアカウント管理のセルフマネジメントに向けた自動化の実装でした。これは「サービスオーダーセンター」を経由することなく、自動化ツールのポータル上からユーザー自身でアカウント追加、削除、変更が行える仕組みです。従来の契約内容の上限を気にすることなく簡単な操作で処理が行えるため、IT部門の稼働が劇的に軽減しました。また、リードタイムも4営業日から5分程度に短縮され、事業のスピード感も格段に向上しています。

 なお、この自動化プロセスの実装で高いハードルとなったのが、同社が独自に設定したアカウントの命名規則ルールに対応する工程でした。申請したアカウントがルールに則ったものかどうか、重複はしていないかなどを自動的に判断する仕組みが求められたのです。こうした固有のルール対応はカスタマイズでつくり込んでいく必要があり、同社のシステムを深く理解するパートナーの協力によって実現しました。このような個別対応は市販の自動化ツールでは極めて困難だということは覚えておくべきでしょう。

 なお、このセルフマネジメントに向けた自動化には次のステップがあります。直近の課題はADに「Office365」を加えたアカウント変更管理の自動化です。ただ、ADに比べてOffice365の自動化にはクリアすべきハードルが多く、現在、パートナーとの連携により実装に向けて取り組んでいると言います。

 このケースにおいて、最も簡単な解決策は契約内容の上限を撤廃することでした。しかし、それでは社内稼働が軽減できる反面、運用コストの上昇を避けることはできません。そこでパートナーから提案を受けたのが自動化の実装でした。この自動化をはじめ、パートナーからのさまざまな改善提案を受けて、同社では導入当初に比べて30%の運用コスト削減に成功しています。

IT運用の課題を自動化導入により改善

 

自動化で喫緊の経営課題を解決したケース

 前回の記事でも解説しましたが、自動化を実現する上で欠かせないポイントは承認フローの実装にあります。すべてをパートナーにまかせるのではなく、運用の要所となる“手綱”だけはしっかりと自社で握って主導できるといった仕組みをつくることです。そこで、3つめの事例はDR(ディザスタリカバリ)やセキュリティなどの課題を、“手綱”を握りつつ自動化で強化したC社のケースを紹介しましょう。

 C社は東日本大震災の経験に基づき、DR対策が喫緊の課題になっていました。そこで東日本エリアのデータセンター(DC)に加えて、西日本エリアにDRサイトを構築します。しかし、万一の大規模災害時に自ら「DR発動」を判断し、切り替えるタイミングの“手綱”は握っておきたいと考えていました。一般的に緊急時にはサービスを提供するキャリアやベンダーが経路を自動的に切り替えるものと考えてしまいがちです。しかし、同社はその判断を自社で行いたいと考えていました。その理由は、メインのデータセンターとDRサイトの差異にありました。

 まずDRサイト側に、メイン側と同様の機能を100%備えることはコスト面で考えると現実的ではありません。事業継続に必要な最小限の構成にするのが前提となるため、大規模災害の発生時には、復旧までに長い時間がかかることを見極めた上で切り替える必要があったのです。そこで自らの判断で経路を切り替える自動化プロセスを実装。ユーザーの事業部門から社内サービスデスクへ「DR発動」の依頼があると、ポータル上のボタンを押すだけで設定を変更し、瞬時に経路が切り替わるように構築しました。これは万一の緊急事態にのみ効果を発揮する、いわば保険のようなものと言えるでしょう。とはいえ、ひとたびダウンすれば時間あたり数千万、数億円の損害が出てしまうようなシステムであれば、こうした経路切り替えのしくみは非常に価値あるものと言えるでしょう。

経路切り替え自動化の概要

 続いての取り組みは「アクセス制御の自動化」です。こちらの企業では社内のセキュリティ部門が日々、システムを監視してサイバーリスクへの対応を行っています。ただし、重点的に取り組んできたのがDDoS攻撃をはじめとする外部からの脅威への対策でしたので、社内からインターネットへのアクセスを監視はしているものの、新たな悪意あるサイトに対するポリシー変更の対応が追いつかないという課題を抱えていました。

 そこで通常は5営業日を要したポリシー変更を、監視アラームが鳴ったら即座に自らの手で対応できる自動化のプロセスを実装。こちらのプロセスについても先のDR事例と同様、ポータル上のボタンを押すだけの簡単な操作でポリシーの変更が可能です。もちろん、変更ログの登録や構成情報の更新などもデータベースで管理できるようになっています。

アクセス制御自動化の概要

 

最適な自動化の絵を描けるパートナーを選ぶ

 ひと言に自動化といっても、その適用領域は多岐にわたります。クラウド化、仮想化の浸透に伴い、IT基盤の運用にさらなるスピード感が求められるなかで、もはや自動化の実装は避けては通れない課題といえそうです。ちなみに、今回、ご紹介した自動化の事例はすべてNTTコミュニケーションズの「Global Management One」によって実現したもの。これは豊富なグローバルリソースを活かし、全世界統一の運用ポリシー、統一プラットフォームで提供。最先端の自動化技術、ITサービスマネジメントのベストプラクティス(ITIL v3)を融合し、グローバルに広がるすべてのIT環境(他キャリア、ベンダーのサービスを含む)の運用、監視、保守に対応できるサービスです。

 注目すべきは、顧客との関係を取り持つ運用のプロフェッショナルである「SM(サービスマネージャ―)」がNTTコミュニケーションズに約500人在籍していることです。コンサルティングにより顧客の要望を明確化し、顧客のシステム構成を深く理解した上で、事業のビジョンや成長戦略に貢献するIT運用の最適化を提案。必要に応じて「最適な自動化の絵を描くこと」がSMの重要なミッションの一つとなっています。

 こうした自動化の絵を描くだけではなく、豊富なサービスや技術の知見に基づき実装プランまでを提供できることがSMの強みと言えます。顧客より提示された最終的なゴールの目標を把握して、サービスの担当者や開発者に翻訳して伝える。いわゆる“つなぎ”の役割を担うユニークな存在です。顧客とともに運用を行い、課題を抽出し、自動化を交えて継続的な改善提案を行うだけではなく、ときには市場のトレンドを先読みしてビジネス、ブランド戦略にまで踏み込んだ価値も提供できるSMはGlobal Management Oneの大きな魅力となっています。

 自動化を交えた運用の最適化には、じっくり腰を据えて数年単位の長いスパンで取り組むのがセオリーです。くれぐれも“ツール”のみならず、ツールと顧客をつなぐ“人”に着目してパートナーは選ぶべきでしょう。それが、今回ご紹介した導入事例のような社内から称賛されるIT部門を生み出す前提条件と言えそうです。

※掲載されている内容は公開日時点のものです。
※掲載されているサービスの名称、内容及び条件は、改善などのために予告なく変更することがあります。

このテーマについてもっと詳しく知りたい

Bizコンパス編集部

Bizコンパス編集部

このページの先頭へ
Bizコンパス公式Facebook Bizコンパス公式Twitter