2026.06.03 Snowflake　

Snowflake Summit 2026 最速レポートDay2
【セッション解説】-Fivetran × dbt Labs が描く「Open Data Infrastructure」とエージェント時代のデータ基盤-

1 はじめに：なぜいま「Open Data Infrastructure」なのか？
2 AIがゲームを変える：エージェントは「新しい主要データ消費者」
3 MDS から ODI へ：何が変わるのか
4 Fivetran + dbt Labs：信頼できるインフラ
5 新発表（1）：dbt Core v2.0
6 新発表（2）：dbt State / dbt Wizard / Agents Schema
7 コンテキストはどこに置くべきか：共有 vs 個人
8 ライブデモ：「Fivetran Chat」
9 まとめ：信頼できるのは「すでに持っているデータ基盤」

DATUM STUDIOの唐内です。

現在サンフランシスコで開催中の「Snowflake Summit 2026」より、業界の注目を集めたDay2のセッションをご紹介します。

登壇は、前日（2026年6月1日）に経営統合（合併）を発表したばかりのFivetranのCEOであるジョージ・フレイザー氏と、dbt Labsの創業者（統合会社社長）であるトリスタン・ハンディ氏のお二人です。テーマは、合併の中核コンセプトである「Open Data Infrastructure（オープン・データ・インフラストラクチャ / ODI）」です。

「AIエージェントが主要となるデータ消費者の時代に、いまのデータ基盤は耐えられるのか？」という問いを軸に、新発表のプロダクトと、実際にエージェントで社内データを分析するライブデモまで盛り込まれた、密度の高い内容でした。

はじめに：なぜいま「Open Data Infrastructure」なのか？

この10年で普及した「モダンデータスタック（MDS）」は、人間がBIツール越しにデータを見ることを前提に設計されてきました。しかし2026年現在、データを読みに来る主役は人間からAIエージェントへと移りつつあります。

エージェントはマシン速度で動き、無限に並列化でき、24時間止まりません。つまり桁違いの量のクエリをデータ基盤に投げてきます。これがコスト・ガバナンス・オブザーバビリティのすべてに新たな負荷をかけます。両社が掲げるODIは、この変化に「オープンスタンダードとポータビリティ」で備えよう、という提案です。

AIがゲームを変える：エージェントは「新しい主要データ消費者」

冒頭、両氏は同業者アンケートの数字（AIを生産性向上に重視＝77% / ハルシネーション懸念＝71% / ウェアハウス・コンピュート支出増＝57%）を引きつつ、「自分の前提に柔軟であれ」と強調しました。変化が速すぎて「毎年、仕事の50〜100%を学び直す」感覚だとおっしゃており、思わず何度もうなずいてしまいました。

そのうえで提示されたのが「いまのデータ基盤を信頼してエージェントを動かせるか？」という、3つの問いです。

1.規模に応じてエージェントのコストを捌けるか
2.データはガバナンスされ、正確で、追跡可能か
3.ポータブルで、オープンスタンダードの上に作られているか

Fivetran社内では、エージェントの活用によりクエリ量が月10%（＝年3倍）で増加しているとのこと。量の急増にどう備えるかが、まさに今回のテーマです。

MDS から ODI へ：何が変わるのか

両氏によれば、ODIはMDSの単なる言い換えではなく、業界が経ている進化に名前を与えたものです。主な変化点は次の2つです。

1．セマンティックモデルのマルチコンシューマ化：以前は単一のBIツールに全振りできたが、今はAIエージェントも消費できる必要がある
2．データレイク（オープンテーブルフォーマット）の重要性：コスト抑制と、将来対応の鍵。2年前のIcebergを巡る動きが転換点だった

そして「エージェントに必要なインフラ」を次の3本柱で整理しています。

1.信頼でき、ガバナンスされた、エージェント向けデータ
2.柔軟でポータブルなデータ（定義・リネージ・ロジックがクラウド / ツールをまたいで持ち運べる）
3.スケーラブルで最適化されたインフラ（暴走するコンピュート / トークンコストを抑える）

ODIは「12種類のツールの寄せ集め」ではなく、オープンスタンダードに基づくリファレンス実装であり、好きな部品を抜き差しできる点がポイントだと説明されました。

Fivetran + dbt Labs：信頼できるインフラ

具体的なレイヤー構成は、以下のとおりです（下から上へ）。

・Fivetran Managed Data Lake service：Open format（Iceberg等） / Catalogs。デスティネーション設定だけでソースのミラーをIcebergで取得でき、更新・削除も自動
・Pipelines：Ingestion / Transformations / Activation
・Management：Orchestration / Observability / Security
・Governed context：Lineage / Semantic layer / Metadata
・Any compute：Snowflake、Databricksほか任意のコンピュート
・Any model：OpenAI、Anthropic、Gemini ほか任意のモデル
・最上段：Intelligence / Operations / Applications（Agents, AI, Analytics & Operations）

取り込みはFivetran、変換管理はdbt、リネージ・セマンティックの標準もdbtが担う、という役割分担です。

新発表（1）：dbt Core v2.0

dbt史上、メジャーバージョンが上がるのは1.0以来2回目です。dbt Fusionエンジンの成果を、信頼されたOSS標準（Apache 2.0ライセンス）に取り込んだのが本リリースです。

・オープンソースランタイム：dbtプラットフォームの裏側と同じエンジンを、自由に使い拡張できる
・完全なローカル配布：コア言語・ウェアハウスアダプタ・SQL解析が機能制限なしでローカル利用可能
・シームレスなプラットフォームアクセス：ターミナルからログインすれば、既存ワークフローを変えずに追加機能を解放

速度面では、プロジェクトと測り方によりますが、dbt buildが10〜30倍高速化。Pythonランタイムとの二重保守をやめ、エンジンを一本化した点も大きな意味を持ちます。

「合併後にdbtが、オープン性から離れるのでは」という懸念に対する、明確な回答と言えそうです。

新発表（2）：dbt State / dbt Wizard / Agents Schema

今週発表された新機能は、次の3つです。

1.dbt State：
データ・コードの変更を検出し、ビルドが必要なモデルだけを再構築。CloudとCoreをまたいで結果を再利用・クローンできる。dbt Core 1.7+ / Fusion / dbt Platformで利用可

2.dbt Wizard：
dbtに特化したエージェント型コーディングハーネス。リネージ・テスト・コントラクト・メトリック定義の豊富なコンテキストを持つ。Codexベースで、無料・BYOK（自分のAPIキーを持ち込む）方式。Claude CodeなどからもSkills / MCP / API経由で利用可

3.Agents Schema（オープンソース）：
DWH / データレイク内の1スキーマを、エージェント向け共有コンテキスト層に指定する仕組み。ファイルシステムのAGENTS.mdのDWH版。agentsスキーマのrootテーブルにMarkdownでマップを書き、各プロバイダが行を寄稿する

dbt Stateは特に効果が大きく、後述のとおり社内で64%のコンピュート削減を実現したとのことです。

コンテキストはどこに置くべきか：共有 vs 個人

「コンテキストをDWHに置くべき」とはいえ、すべてが対象ではありません。両氏は2つの軸（キュレーションの重要度 / 個別権限の重要度）で整理しました。

・個人コンテキスト（GDrive、Gmail など）：
私的で、キュレーションをあまり要さない。MCPやAPI直接呼び出しが有効。ClaudeやChatGPTの組み込みコネクタが適する

・共有コンテキスト（Salesforce、Zendesk、Postgres など）：
BIと同様にキュレーションが必須。一方で個別権限は通常は不要。自前のデータ基盤に集約し、AIをその上に乗せるべき（APIを直接叩く別経路を作らない）

「AIにコンテキストを提供することを、今後のデータチームの役割の一部とみなす」というメッセージが、印象的でした。

ライブデモ：「Fivetran Chat」

本セッションのハイライトが、ジョージ氏が実際に使ったという対話型分析エージェント「Fivetran Chat」のデモです。

ノートPC上のエージェントがDWHに接続し、Agents Schemaを頼りに分析します。経営会議中の素朴な問いから、その場で以下の内容が返ってきたといいます。

・データレイク採用顧客の内訳：
コマーシャル389社 / エンタープライズ104社。コマーシャルの社数が大半だが、売上加重ではエンタープライズの浸透も近い

・上位20社と累積シェア：
上位20社でData Lake売上の35.00%、最大の単一アカウントでも3.89%と、集中は緩やか

・Gong通話記録の横断分析：
上位各社の通話記録を読み、「なぜデータレイクを採用したか」を再構築。動機はウェアハウスコスト、マルチエンジンの柔軟性、CDCの鮮度 / 正確性、脆いコネクタ / API保守の置き換えに集約された

使った部品は、Fivetranコネクタ＋10年使ってきたdbtモデル＋agentsスキーマのMarkdown＋短いCodex Skill（Skill Creatorで約3分）のみ。新しいものをほとんど導入せず、この体験を作れる、という点が要諦でした。

まとめ：信頼できるのは「すでに持っているデータ基盤」

dbt Stateによる差分ビルドは、設計パートナー実績で平均30%、Fivetran社内では変換コンピュートの64%という大幅なコスト削減につながったと紹介されました。

Ramp（コンテキスト豊富なコーディングエージェントがマージPRの50%超を駆動）、OpenAI（高インパクトな分析を”日単位でなく分単位”で）、Infinite Lambda（18か月分を数週間に圧縮）など、実適用事例も示されました。

セッションの結論はシンプルで、AIエージェントを動かす最良のデータ基盤は、多くの場合「あなたがすでに持っているデータ基盤」である——少しの拡張（ドメイン追加、データのマップ作成）を施し、オープンスタンダードの上に組むことで、特定ベンダーに縛られずエージェント時代に備えられる、というメッセージでした。

DATUM STUDIOでも、Snowflakeを中心としたELTパイプライン設計やCI / CD、データ基盤のガバナンス設計を数多く手がけています。

今回のODIの考え方は、これからエージェント活用を見据えてデータ基盤を整える企業にとって、実践的な指針になりそうです。

このページをシェアする：

前へ次へ

Snowflake Summit 2026 最速レポートDay2【セッション解説】-Fivetran × dbt Labs が描く「Open Data Infrastructure」とエージェント時代のデータ基盤-