BtoBサービス基盤のシステム運用支援

企業向けに提供しているインターネット経由のサービスのシステム基盤の運用管理と既存業者から引き継いだ事例です。
お客様情報
業種 | インターネットサービス業 |
従業員数 | 300名 |
拠点 | 本社およびDC |
サービス提供開始 | 2019年04月~ |
情シス担当者 | 3名 |


概要
もともと一部のシステムを弊社データセンターに設置、その監視・運用をサービス提供していましたが、一部システムの運用に関して良い評価をいただいたので、お客様のメインシステムの運用管理を任されました。既存の事業者からそのまま引き継ぐだけではなく、運用の改善を行いながら引き継ぎを実施しました。
お客様課題
BtoBサービスを提供しているなか、いくつかの課題がありました。
- 200ノードを越えるサーバ、ネットワーク機器を該当部門で管理
- 該当部門はインフラに関してあまり知見がなかった
- データセンター事業者と自社運用部門で監視運用を行っていたがアウトソーシングできる割合が少なかった
- 運用業務をオペレーションレベルではなくもう少し高いレベルでアウトソーシングしたい
- インフラ構成、運用管理に関して相談するパートナーが欲しい

サービス提供内容
導入まで
弊社で提供したサービスについて、導入までの経緯、実際に提供したサービス内容、導入後の運用について記載します。
対象システムの構成把握
監視・運用管理の対象となるサーバ、ネットワーク機器の構成を把握しました。
機器構成だけではなく、稼働しているシステムの特徴、サービスの内容に関してもヒアリングや資料の提示を受けて把握していきました。
構成項目 | 説明 |
---|---|
サーバ機器 | 物理サーバ機器のメーカー、機種、台数、OS、ミドルウェア、用途などを調査確認 |
VM(仮想マシン) | 仮想環境があったので仮想環境上で稼働しているVM(仮想マシン)に関しても、OS、ミドルウェア、用途などを調査確認 |
ネットワーク機器 | ネットワークアプライアンスやセキュリティアプライアンス、ネットワークスイッチなどのメーカー、機種、台数を調査確認 |
その他 | その他アプライアンスなどの調査確認 |
対象システムの現状運用調査
システムの構成等に加え、実際のシステム運用業務を調査します。
運用項目 | 説明 |
---|---|
監視 | 対象システムに対しての監視 アラート通知はもちろん、パフォーマンス状態やログ監視などの取得状況なども調査確認 |
リカバリー&バックアップ |
システムのリカバリーに必要な運用業務について調査確認
などアラート発生からシステムによるサービス再提供までの手順などを調査確認した。 |
シシステム稼働に必要な定期的な運用業務の調査と確認
などの定期的に実施される運用業務を確認 |
|
運行業務 | 定期実行業務以外でシステム運行時に必要な適時処理について |
その他 |
システム運用の再設計
既存事業者及びお客様情報システム部門から業務を引き継ぎするにあたり、現行の運用をそのまま引き継ぐだけではなくより改善された状態で引き継ぐ形にしました。
そのため、運用自体の再設計を行いました。
見直した項目 | 説明 |
---|---|
監視項目の追加・変更 | 障害検知やアラート通知関係の監視は豊富でしたが、パフォーマンス監視やキャパシティ管理のための監視情報が不足していたので監視項目を追加しました。 これらの項目はサービスの可用性や継続性に対する計画に必要な項目なので追加しました。 |
定型業務の半自動化 | 定型的に行われている運用業務を自動化ツールを使って自動処理できるようにしました。 これは完全な自動化ではなく、オペレーター等が直接機器等に対して行うオペレーション部分を自動化(ジョブ化)するような形で実施しました。 |
運用SEによるサポート | 定型化された業務だけではなく、運用に詳しいエンジニア(基盤と運用の両方を手がける弊社の運用SE)がお客様システムの課題や問題について相談を受ける窓口を設置しました。 単純なアウトソーシングではなく積極的にお客様サービスに関与していくとしました。 |
- 導入時から変更して実施することはリスクもあるため、移行当初は既存の運用を踏襲します。
- あきらかに追加や変更が必要な運用業務から見直し、改善した業務での実施としました。
- 現在有用な運用業務に関しては変更なしか、あるいは半自動化の対象としました。
運用業務の再実装と引き継ぎ
再設計された監視設計や運用業務設計をもとに運用を実装していきました。
実施項目 | 説明 |
---|---|
監視設定 | 監視再設計を元に弊社監視サービスに設定を実施。監視を始められるように設定していきました。 |
自動化ジョブ実装 | 弊社自動化プラットフォームに自動化可能な業務をジョブとして登録していきました。 |
オペレーションチームへの運用実装 | 弊社の運用オペレーションチームへ障害対応や運用代行のうち人的作業が行うものに関して実装しました。 また、オペレーションチームへの実装は以下のような資料を作成して実施していきます。 |
運用業務の再実装と引き継ぎ
再設計された監視設計や運用業務設計をもとに運用を実装していきました。
作成資料名 | 内容 |
---|---|
運用規定書 |
運用業務を実施するにあたって必要な情報や実施規定を記載する資料です。運用業務に関してお客様と合意するための文章でもあります。
など具体的に記載します。 |
運用手順書 | 実際に障害発生時や運用代行作業時に使用する手順書です。対応フローと対応手順があります。 |
対応フロー | アラート発生や障害の通知、また定期的に実施する運用業務などの作業フローを記載する資料です。 システムは複数の要素によって構成されているので、その切り分けや後述する対応手順(オペレーション手順)の使いどころなどをフローに沿って記載します。 |
対応手順 | 各対象に対しての画面操作やコマンド実行について記載されたオペレーションマニュアルです。 実際の対応方法について記載されています。対応フローに沿って必要な箇所でこの手順を行う形で実際のオペレーションは進みます。 |
導入後
実運用と運用の見直し
実際の運用がはじまると、初期段階での見直しが入ります。
見直し項目 | 内容 |
---|---|
監視見直し | 監視項目の過不足を確認し整理します。 不足項目は追加しますが、過剰な監視も運用に対して負荷があがる原因になるので抑制や削減を行います。 |
定期処理の見直し | 定期実施している処理の方法を見直します。手順の追加、不要な手順の統合などを行います。 |
中長期の見直し提案
構成情報や監視情報の蓄積をもとに、サービスシステム基盤の中長期的な見直しの提案をします。サービスのスケールアウトやサービスの継続性などを考慮した提案を都度行っています。
提案例 | 説明 |
---|---|
プログラムの更新自動化 | 数の多いサーバに対してのプログラム一斉適用を、Gitと自動化システムを使って一斉適用できるように提案 |
一部システムのクラウド移行 | 現行ではオンプレミスの仮想環境で稼働しているVMをクラウド上に移行してスケールアウトとパフォーマンス調整しやすい形に移行する提案 |
成果・効果
お客様の一部業務を弊社で引き継ぐことができました。これによりお客様情報システム部門の負担が軽減でき、本来業務であるアプリケーション開発に重点をおいた業務にシフトすることができました。
現在
サービス向けのシステム基盤のリプレース計画などに参画し、システム基盤の設計・構築・運用と全体を担う形になっています。
今後、新サービス追加などがある場合も弊社にてシステム基盤のサポートができる体制になっております。