giftee Tech Blog

ギフティの開発を支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信しています。

SRE NEXT 2025に参加しました!

アイキャッチ

どうもみなさん、こんにちは!ギフティでエンジニアをやっているj-maki(じぇまき)です。

2025年7月11日〜12日の2日間にわたって開催されたSRE NEXT 2025に参加してきました。 私は昨年に引き続き、今回が2回目の参加でしたが、ブースやセッションなど、さらにパワーアップしているのを感じました。学びも多く、とても楽しい時間を過ごせたので、この記事ではその様子や感想を自由に書いていきます!

SRE NEXT 2025 バナー

スポンサーブース

ブースは活気があり、賑やかな雰囲気が印象的でした。 個人的には、中央のスペースに長机とお菓子が置かれていて、知り合いと談笑したり休憩したりできるのがとてもありがたかったです。運営の方々のお心遣いに感謝です!

スポンサーブースの様子

ブース以外にも、恒例の参加者アンケート企画やジョブボードも盛り上がっていました! SRE本読んでいる? We are hiring

セッションレポート

さて、ここからはセッションの感想を書いていきます。 どのセッションも面白かったのですが、今回はその中でも特に印象に残った4つのセッションを紹介します。

対話型音声AIアプリケーションの信頼性向上の取り組み ~ Webアプリケーション以外でどうSREを実践するのか ~

まず紹介するのは、株式会社IVRyの森谷浩幸さんと渡部龍一さんによるセッションです。 対話型音声AIアプリケーションの信頼性向上への取り組みについての発表でした。 前半の森谷さんのパートでは、特にLLMをプロダクトに組み込む際の「ハルシネーションの抑制」や「LLM APIの安定運用」という2つの課題に焦点を当てて説明されていました。解決策として、1つのタスクを複数のコンポーネントに分割することや、最新のLLMモデルを使うのではなくユースケースに合った安定したモデルを採用する方法などが紹介されていました。 後半の渡部さんのパートでは、WebSocketを使ったアプリケーション運用の難しさと、それを解消するための安全なデプロイ手法について説明されていました。さらに、音声対話システムの信頼性を評価するために、システム的Anomalyと対話的Anomalyを区別したSLI/SLO(サービスレベル指標/目標)の設計が重要であるという内容でした。

個人的な感想ですが、セッションを聴く前はIVRyさんの電話サービスについては以前から知っていたものの、自分が普段開発しているWebサイトとは信頼性への向き合い方がまったく異なるのだろうという印象を持っていました。 しかし実際には、最新技術に飛びつくのではなく、課題に応じて必要最小限の技術を選択したり、通信の監視や最悪の事態を想定した冗長化など、Webアプリケーションにも通じる普遍的な学びが多く語られていて、思わずうなずきながらセッションを聴いていました。

また、音声対話システムのSLO設計の難しさについて、「ユーザーの目的達成を最上位のSLOとする」という原点に立ち返って考えられていた点がとても印象的でした。普段はAPIの成功率やレスポンスタイムなどの数値ばかりに目が行きがちですが、本当にユーザーの目的達成に貢献できているかを意識することの大切さを改めて感じました。 全体を通して、個別の課題解決を抽象化・一般化して言語化されていた点が印象的で、SREとして非常に高いレベルで課題に向き合っていることに感服しました。

IVRyさんのブースでは、実際にこのセッションの内容が組み込まれたプロダクトを体験できるコーナーがありました。飲食店の予約の電話が体験できるのですが、予算だけ伝えるといくつかプランの選択肢を提案してくれたり、選択肢の名前を直接指定せずに「安い方」といった曖昧な言い方でもシステムがうまく判断してくれて、とても体験が良かったです。まさにセッションで聞いたエンジニアの努力がプロダクトに反映されていてることが実感できて素晴らしい展示でした。

とあるSREの博士「過程

次にご紹介するのは、さくらインターネット株式会社のyuuk1さんによるセッションです。 「技術を使う側から作る側になりたい」という思いから博士課程に進学された経緯や、そこで取り組まれた「時系列データベース」「ネットワークコールグラフトレーシング」「AIOps」といった3つの研究テーマについて紹介されていました。さらに、生成AI時代における博士課程の意義についてもご自身の見解を話されており、「自分の中で知的活動の体系を構築し、継続的に積み重ねていくこと」の大切さを発表されていました。また、これは必ずしも博士課程に進まなくても、誰しもが日々の中で実践できることだと語られていたのが印象的でした。

個人的な話になりますが、セッションを聴きながら私自身の大学院(修士)時代の指導教官から言われた数々の言葉を思い出し、懐かしさとともに不思議な感覚でした。 特に当時は、研究成果を評価する際によく使われる「新規性」「信頼性」「有効性」「了解性」といった観点について、指導教官から繰り返し指摘を受けていたのを思い出しました。エンジニアとして日々会社で仕事をしていてこれらのことをすっかり忘れていた(笑)のですが、今回yuuk1さんの発表を聞いて、過去の自分がかじったアカデミックな考え方も普段のエンジニアとしての仕事にもっと意識的に取り入れていきたいなと思いました。そして自分が良いと思える何かを作った時には論文という形ではないかもしれませんが、積極的に体系化してアウトプットしていきたいですね。

数万リソースのCI/CDを爆速に!Terraform・ArgoCD改善の全記録

お次はサイバーエージェントの石川雲さんの発表です。 AmebaのCI/CDプラットフォームにおけるパフォーマンス改善について紹介されていました。特に、TerraformによるCIプロセスの劇的な高速化と、ArgoCDおよびFluxCDを用いたCDプロセスの運用最適化が中心テーマでした。数万にも及ぶリソースの処理に伴う遅延やリソース肥大化といった具体的な課題から、それらに対するTerraformモジュールの最適化、並列処理の導入、そしてArgoCD/FluxCDの水平スケーリングやパラメータチューニングといった多岐にわたる解決策が、詳細な構成図とともに発表されていました。

自分もここまでの規模ではありませんが、TerraformやArgoCDを日々運用しているのでとても興味深い発表でした。特にArgoCDのキャッシュの挙動や調整Jitterなどは全く気にしたことすらない概念だったため、ここまで気を配ってチューニングしている方がいるのかと驚きました。 また、印象に残った点としては、KubeVelaなどの生成リソースのステータスがOutOfSyncになってしまう問題についても、AnnotationとTrackingIDを使ってPruneの対象から外しつつ、運用者の心理的負担を減らすために常にSync状態に保つなど、徹底的に改善していく姿勢がとても素晴らしいと感じました。

システム障害対応のツマミになる話

最後に紹介するのは野村総合研究所の木村誠明さんのキーノートです。 木村さんご自身の著書『システム障害対応の教科書』に書かれている障害対応のアンチパターンや実践的なプラクティスを掻いツマミつつ紹介し、懇親会でのツマミにもなりそうな話題として発表されていました。 私自身、以前から『システム障害の教科書』を拝読しており、普段の障害対応はもちろんのこと障害対応訓練を企画・実施する際にも参考にしていたので、著者ご本人のお話を直接聞けてとても感激しました。 著書にも書かれていますが、「システム障害対応の目的はシステム復旧ではなく、ユーザーへの影響を最小限に抑えること」や、「インシデントコマンダーと作業担当を同じ人が兼任してはいけない」といったポイントは、分かっていても実践が難しい部分だと改めて感じたので、今一度しっかり心に刻みたいと思います。

また、3.11の震災時にどのようにシステム障害を復旧されたかというエピソードの紹介と共に、「災害など有事の際にサービスを継続させるノウハウは、あまり公開されていない」というお話もされていたのが印象的でした。 有事のシステム復旧対応はもちろん、書籍でも述べられている通り、これまで障害対応のノウハウは暗黙知とされ語られないことが多く、語られたとしても断片的なアドバイスや武勇伝ばかりだったという課題がありましたが、このセッションはまさにその課題の解決の一助になる内容だったと感じます。 私自身も、障害対応などのノウハウはできるだけ社内だけでなく、インターネットやコミュニティに発信していきたいと改めて思いました。ちょうど良い機会なので、以前の自分のチームで実施した障害対応訓練の記事も宣伝しておきます。

さて、セッションの紹介は以上です。都合により泣く泣く見逃したセッションも多かったのでアーカイブの公開が待ち遠しいですね。

懇親会

セッションが終わった後は、同じ建物内のフロアを貸し切って懇親会が開催されました。さまざまな方と直接お話しできる貴重な機会で、とても賑やかで楽しい時間でした。 乾杯の場面で鏡開きまでやってしまうとは、SRE NEXTさすがです!

懇親会の乾杯として鏡開きをする弊社CTOと各社スポンサーの皆様の図

また、弊社はドリンクスポンサーとしてビールとサイダーを提供しました。デザイン部署と協力して今回のために作成したオリジナルラベルも、参加者の皆さんから「可愛い!」と好評で嬉しかったです。

懇親会で心残りがあるとすれば、前述のセッションでご紹介した木村さんにお話しに行くつもりがタイミングを逃してしまい、ほとんど会話できなかったのが残念でした。 他にも時間が足りず、まだまだ話し足りない方が多くいたので、来年以降の楽しみにしたいと思います。

終わりに

今回もSRE NEXTを通じて、さまざまな知見や実践例に触れることができ、大変刺激を受けました。普段の業務ではなかなか出会えない考え方や工夫、そして現場でのリアルな課題解決の話をインプットできたのは、貴重な経験でした。 また、こうした学びを得るだけでなく、自分自身も日々の業務や取り組みを積極的にアウトプットしていきたいという気持ちがより一層強まりました。 次回はSRE NEXTのプロポーザルが採択されるように頑張ります。 最後までお読みいただき、ありがとうございました!