Databricks Data + AI Summit 2026 最速レポート Day1「エージェントの可観測性」関連セッション紹介 | DATUM STUDIO株式会社
Databricks 

Databricks Data + AI Summit 2026 最速レポート Day1
「エージェントの可観測性」関連セッション紹介

みなさんこんにちは!DATUM STUDIOの亀井です。

私は現在、アメリカ・サンフランシスコで開かれているDatabricksの年次イベント、Data + AI Summit 2026(DAIS 2026)に来ています。会期は6月15日から18日までの4日間、160カ国以上から3万人を超える参加者が集まり、800以上のセッションが行われるデータ・アナリティクス・AIの巨大カンファレンスです。

最速レポートDay1-1の記事では、会場の雰囲気とPartner Summit Keynote、LTについてお届けしましたが、本記事では私が初日に参加したセッションの中から、最近の自分の関心ごとだった「エージェントの可観測性(observability)」に関するテーマのものを2本まとめて紹介します。

会場の雰囲気

会場はサンフランシスコの中心部、Moscone Center一帯です。建物の正面には「DATA+AI SUMMIT」の大きなバナーが掲げられていました。

North・West・Southの3棟をまたいで使う規模で、初日からどの会場も人・人・人。赤いカーペットの敷かれた入口は朝から来場者でごった返していて、特にエージェント関連のセッションは立ち見が出るほどの盛況でした。

会場内には #ROAD2SUMMIT のラッピングを施したランボルギーニも展示されており、写真を撮る人で賑わっていました。

さて、近年では「エージェントの可観測性(observability)」に注目が集まっています。エージェントの挙動を記録したトレース(agent traces)をどのように集め、正規化し、ビジネスの成果と結びつけるか、というテーマですが、本日はこれにぴったりな2本のセッションを聴いてきました。

What Is Your Agent Doing?(dltHub)

1本目のセッションは、dltHubのThierry Jean氏(Lead AI Engineer)による「What Is Your Agent Doing? Making Sense of Agent Traces」です。

発表では、「”エージェントは何をしているのか”という同じ問いでも、立場によって知りたいことが異なる」というメッセージが投げかけられました。

CEOは「このAI投資は、持続的な優位になるのか」、CFOは「どのチーム・顧客・成果がコストを生んでいるのか」、Engineeringは「どのエージェントが”残る成果”を出すのか」、Productは「いつ失敗して人間に引き継ぐべきか」、Salesは「エージェント機能でどの顧客が伸びる/離反するのか」。同じトレースを見ていても、見たいものはそれぞれ異なります。

そのうえで、散らばったマルチベンダーのトレースを自社データから切り離したままでは、何も判断できないと指摘されました。dltHubは、各種の可観測性プラットフォームに散らばるトレースをDatabricksへ取り込み(bronze)、OpenTelemetryのGenAI Semantic Conventionで共通フォーマットに正規化し(silver)、分析・BIに使える形へ整える(gold)という、いわゆるメダリオン構成で「トレースの整備」を引き受けると提案していました。

「エージェントが自分のトレースを自分で取り込む」パイプラインが急増しているというデータも紹介され、トレースの整備はもはや当たり前の前提(table stakes)になりつつある、と締めくくられました。

BI for AI(Databricks)

2本目のセッションは、DatabricksのOleksandra Bovkun氏(Sr. Developer Advocate)による「BI for AI: Transforming OTel Agent Telemetry into Enterprise Analytics」です。

1本目のセッションが「トレースをどう集めて整えるか」という内容であったのに対し、こちらは「整えたトレースをどう分析して、ビジネス価値を語るか」という、続編のような内容でした。

最初に提示されたのが「Surveillance, not learning(監視であって、学習になっていない)」というスライドです。

トレースを数百万件も貯めているのに、実際にやっているのは「壊れたときにrequest IDで検索して、エラーを数件ピン留めして、あとは放置する」だけだと言います。これでは”とても高機能で、とても高価な受信トレイ”にすぎない、と問題提起されました。

ここでは、データの置き場所を変えるだけで問える質問が変わる、と説明されました。

(1)今は、trace viewerで1件ずつデバッグ
(2)次は、トレースをSQLテーブルにして全件横断で挙動を理解
(3)最後は、ビジネスデータにJOINして価値を測る

という3つのステップが示されました。

Databricksでは、MLflowのAutologで記録したOTel(OpenTelemetry)トレースがそのままUnity Catalog上のDeltaテーブル(_otel_spans)として格納されるため、以降はSQLで分析できると紹介されていました。

デモも具体的でした。

ai_classifyでユーザーの問い合わせ意図を分類し、variant_getでコストや「推論ループ」の長さ(LLM呼び出しのspan数)を集計します。実プロダクトのクエリは2〜3回のLLM呼び出しで「検索 → 思考 → 応答」と回る一方、お断りした的外れな質問はきっかり1回で終わるといった違いが、SQLで確認できると示されました。

発表の核となったのが「One extra argument」というスライドです。

関数の引数にcustomer_idを1つ足すだけで、トレースが顧客テーブルやサポートチケットのテーブルとJOINできるようになります。「悪いインタラクションは、本当にサポートチケットにつながるのか?」といった問いに、ETLなしの1クエリで答えられると説明されました。

最後は「うちのエージェントは本当にビジネス価値を出しているのか?」という問いに対し、「Yes、しかも今ならそれを証明できるし、どこで失敗しているかも正確にわかる」と締めくくられました。引数を1つ足すだけでビジネスとつながるというシンプルさが、印象に残りました。

まとめ

2本まとめての紹介でしたが、共通するメッセージはシンプルで、「エージェントは作って終わりではなく、トレースを集めて・正規化して・ビジネスデータと結びつけて初めて価値を語れる」ということでした。

dltHubの発表が「トレースをどう整えるか(入口)」、Databricksの発表が「整えたトレースでどう価値を測るか(出口)」と、ちょうど対になる内容で、エージェントの可観測性について全体像を掴むのに良い2本だったと思います。

DATUM STUDIOでも生成AI・エージェント構築の案件が増えてきていますが、「作った後」をどう運用・評価するかは多くのお客さまに共通する課題です。本日参加した2本のセッションは、その実装イメージを持ち帰るうえで参考になる内容でした。

明日以降も気になったセッションについて紹介していきますので、ぜひご覧いただけるとうれしいです!

このページをシェアする: