SysAdmin's Group システム管理者の会
日本最大規模の
システム管理者のネットワーク

運用ノウハウを学ぶ

システム管理に関わるベーシック情報やトレンドをご案内します!

auカブコム証券がGoogle発SREで変わったこと 第4回 auカブコムSRE ができるまで~後編~
2021年3月24日 10:00

 auカブコム証券では2020年4月よりSREグループを発足させ、約1年間組織として活動を継続してきました。前回記事では「auカブコムSRE ができるまで~前編~」と題し、グループ誕生の背景について、2019年当時の運用グループの課題を踏まえご紹介しました。「システム品質の改善」「運用業務のプレゼンス向上」という2つのモチベーションがあったため、現場のメンバーで集まって課題洗い出しを行い、課題解決のアプローチや目標達成に至るまでのプロセスを考えたものを1枚の紙にまとめ、「運用ロードマップ」として、改善にむけて歩き出してきました。

 後編となる本記事では、自分たちで作成したロードマップの具体的内容や、活動を通じてつかんだ手ごたえ、チームの活動が少しずつ周囲に認められるようになった話、そして「auカブコム流SREグループのはじめかた」についてお話ししていきます。

●運用ロードマップの活動

 前回記事では当社が実際に作成した運用ロードマップの画像を掲載しましたが、内容について少し補足させていただきます。
ロードマップの中では、大きく分けて5つのトピックで施策を設定しました。

 1. グループの方針
 2. 運用グループのあるべき姿と3年後(2022年)の目標
 3. 運用業務体系と改善アプローチ
 4. 半期ごとの重要施策
 5. 半期で行うタスクと工数の計画

 「1.グループの方針」の中で、活動の軸である品質向上を目標に掲げ、「2.運用グループのあるべき姿」の中で1年後、3年後それぞれどういう組織になっていたいのか、という目標を明確にしました。具体的には当社の場合、2020年の目標は「SRE組織化や自動化による手作業50%減」、 2022年の目標は「考えるが主体の部門、運用完全自動化、利益を生む組織へ」というビジョンを掲げています。
「3. 運用業務体系と改善アプローチ」では現場が抱えていた課題を「定例作業」「障害対応」「保守」などの種類でカテゴライズし、それぞれのカテゴリに対する改善アプローチを記載。「4.半期ごとの重要施策」では目先の半期で課題改善に向けて何をするのか?特にコストかけて取り組む課題は何か?を定めました。「5.半期で行うタスクと工数の計画」では各課題に対して担当者と実施時期を具体的に設定しています。

さて、一枚の紙にまとめたロードマップの中で半年後・3年後という遠い先のゴールを設定したあとは、目の前のスケジュールと相談です。日々、目の前の作業に追われ、意識しないとなかなか改善活動の時間をとるのが難しいという現実もあり、チームで意識していたことは、「改善活動時間を長く確保する」のはなく、「まずは一日30分程度、改善の時間にあててみること」でした。

2019年当時、ロードマップの施策の中で優先的に対応を進めていたのは主に以下となります。いきなり大きな目標というよりは、まずは少なくてもいいので結果が見えることを意識しました。

 ・インシデント管理高度化
 ・アラート削減/エラー分析
 ・定型監視作業自動化
 ・社内OA問い合わせのFAQ化
 ・アカウント管理改善

運用ロードマップの活動を継続していくにあたり、グループ内だけでの進捗確認だけでは周囲へは活動内容が伝わりません。また、長期間の取り組みのため周囲からのフィードバックも大切です。そのため、実施していたのは、月次経営層向けのロードマップの達成状況と運用障害件数推移の報告です。運用グループが、システム品質改善のために行っている取り組みを周囲に理解してもらい、実績と成果がどのように表れているのかを報告することが活動の継続のために重要だと考えました。途中経過と効果を周囲にしっかりとアピールし、活動を理解してもらうこと=「プレゼンスの向上に繋がる」と考えたためです。
 また、毎月、進捗報告とともに、月次運用トピックを用意して、取り組みの紹介、それによる効果の狙いを資料で提出していました。


図2 活動の例(リリース作業の一部自動化のしくみ)
(クリックで拡大)

 ロードマップの目標を一過性のものにしないためにも、定期的に会社に進捗報告して活動をアピールすることは、その時にチームに求められていることを考え、目標を押さえ続けるうえで非常に重要だったと思います。

 

●1年でつかんだ手ごたえ

 2019年の1年間を通じてロードマップを継続し、進捗状況や取り組みを報告していたため、運用チームの業務への認識が徐々に会社内に浸透していきました。周囲から「何の仕事をやっているのか見えにくい」と思われてしまいがちな運用チームにとって大きな一歩でした。同時に、活動のモチベーションの1つであった品質改善については、1年を通じて運用障害件数の減少という定量的な結果を出すこともできました。
もちろん、ロードマップの施策の中には、結果としてなかなか成果の出なかったものはありました。ですが、それも1年間取り組んだからこそ、「なぜ成果を出すことが難しかったのか」を判断する材料になり、今後はどうすればいいか、への大きなヒントになっています。
 ロードマップの活動が徐々に浸透しはじめ、少しずつチームとして目指していた姿に近づいてきたことに加え、運用障害件数も減少。組織として徐々に認められてきたという実感があり、やりがいがありました。
 次第に、活動当初は一つのキーワードでしかなかった「SRE」という言葉が、数年後の遠くのチーム目標ではなく、次のauカブコム証券の目指す運用のかたちとして、より手の届く目標として感じられるようなっていったのです。
 SRE組織化を目指していけるのではないか、と同じく手ごたえを感じていたマネージャーにより、2020年4月に増員が提案され、メンバー数は8名に、組織名も新たに、新生「SREグループ」が発足しました。

 

●auカブコムSREのミッション

 SREグループが発足した当時、これまでの運用グループの活動は社内に浸透しつつありましたが、「SRE」という言葉自体はあまり認識されておりませんでした。あまり浸透していない新しい名前がグループであるがゆえに、経営層の思い描く「SREグループ」、現場のメンバーが思い描く「SREグループ」、マネージャーが考える「SREグループ」のかたちがそれぞれ異なっていたのです。
そこでSREグループ長はまず、「SRE」に対する共通の認識を社内で作ることが必要だと考えました。最初に「auカブコムSREはこういうミッションに取り組むグループです」と定義することで、会社全体として共通認識をもつことができます。そして、周囲にグループのミッションを理解してもらうことで、運用ロードマップのつづきを「SREロードマップ」としてさらにパワーアップして継続していくことができ、もう一段レベルアップした運用が実現できると考えていました。

会社がSREチームに期待していたこと つまりauカブコムのSREのミッションは
「運用の高度化は継続しつつも、よりお客様サービス目線での運用改善に切り込んでいくこと」でした。そのため、お客様サービスへ影響を伴うような障害発生時の早期課題解決に向けたPD(Problem Determination)の旗振り、お客様のご要望のうち軽微なシステム改修で実現できるお声の早期対応、当社重要システムのKPI設定と閾値監視の高度化という課題をロードマップに追加しました。

ここまでの工程は第2回記事でご紹介した「SREのはじめかた Step1:SREに関する認識の共有」です。SREチームを形成していく上での活動指針となる重要なポイントであり、当社ではSREグループ長が先導して経営層やマネジメントの考えをくみ取り、メンバーにフィードバックしながらグループとして1年のロードマップを話し合っていきました。グループのミッションを明確にし、ロードマップの内容を決めるまでに約2カ月かかりましたが、それくらいSTEP1の工程は今後のグループ形成にとっても重要な期間です。

 

●まとめ

 auカブコムSREができるまで」と題し、前編・後編に分けてauカブコム証券SREグループの生い立ちやグループ発足後の組織形成についてご紹介しました。
 2019年当時、運用チームメンバーが日々の業務で疲弊してしまっていたという現実や、大障害によりシステム品質を見つめなおす必要があったことをきっかけとして、「品質改善」「運用チームのプレゼンスをあげたい」という2つの大きな目標を掲げてから、本当に色々と試行錯誤してきました。改善の効果を感じるまでに、長い時間はかかったものの、auカブコムSREができたことによって確実に運用レベルの底上げが実現できていると感じています。そしてSREグループの発足から1年経った今、チームとしてはさらに一段階レベルの高い「サービス運用」を実現すべく、今後の目標や展望についてメンバーで集まって話し合っています。

会社によって抱えている課題も求められていることも全く異なると思います。私たちも当社の課題に向き合い、求められていることを実現しようと試行錯誤してきて、今があります。
当社のこの経験が読者の方に少しでも有益な情報になればと思います。

「SREができるまで」にフォーカスしてきた第3回・第4回の連携を終え、残り2回の記事では2020年度1年間のSREロードマップの活動を通してSREとして出した成果、新しい取り組み、さらに今後どのような目標を抱えて活動を継続していくのかという内容をご紹介していきたいと思います。
次回もよろしくお願いします。

 

     auカブコム証券では一緒に働く仲間を募集しています。
     当社に少しでもご興味をもった方がいましたら、ぜひ当社で一緒に働いてみませんか?

     採用についてはこちら
     auカブコム証券株式会社の会社情報 (Wantedly)
     https://www.wantedly.com/companies/kabu2

 

 

 

スキルアップ
auカブコム証券がGoogle発SREで変わったこと
Googleが提唱した新しいエンジニアの役割であるSRE。この役割を取り入れる企業は年々増加しています。当社でも19年10月、システム運用負荷に限界を感じていた担当者たちが、SREの概念を取り入れはじめました。エラー削減・自動化などの成果により社内機運が高まり、20年4月より正式に社内でSREグループが誕生しました。 SREの概念とは?auカブコム流の考え方、アレンジ、目標など、当社の取り組みを紹介します。
記事一覧へ
筆者紹介

道場大(みちばだい)
2011年FX専業の会社に入社し、金融業界に進出。システム担当として各種サービスの設計、構築、保守、運用に広く携わる他、お客様対応、当局対応にも深く関わり、2015年にシステム責任者に就任。対顧サービス完全クラウド化など、多岐に渡る主要プロジェクトを歴任。
2019年スキル拡張を目的とし、auカブコム証券に転職。初年度実績を評価され、本年4月より技術部SREグループ長に就任。チームビルディングの傍ら、auカブコム流SREを体現。SREロードマップ実現に向けて邁進。


太田有美(おおたゆみ)
2016年auカブコム証券会社に新卒入社。2017年よりシステムインフラ部署でサーバ設計構築を担当。2020年4月に新体制であるSREグループ発足により、初期SREメンバーとして活動。旧運用チーム時代から新SREグループ誕生の過程で運用高度化を実感した経験を生かし、当社の体験をコラムでわかりやすくお伝えできるよう邁進中。


コメントを書く

未ログイン: ログインする

コメント: ログイン(会員登録)すると、コメントを書き込むことができます。

  • 新着Q&A
  • 最新の回答
回答数:22019年11月12日

システム管理者認定講座<全コース共通>試験のみ受験希望の方はこちら

動画で見るセミナー
動画で見るセミナー

皆様からのご要望にお応えして、第14回システム管理者の会 感謝の日イベントでご講演いただきましたauカブコム証券株式会社 道場 大様の講演動画を公開いたします。 見逃してしまった方や、もう一度観たいといった方はこちらからご覧ください。

個人情報保護方針
運営者につい て
利用規約
サイトマップ