Databricks Data + AI Summit 2026 最速レポート Day2
Keynoteで注目の新機能「Genie Ontology」「CustomerLake」を紹介
みなさんこんにちは!DATUM STUDIOの亀井です。
サンフランシスコで開催中のDatabricks Data + AI Summit 2026(DAIS 2026)2日目のレポートをお届けします。
参加したKeynoteでは、Genieのオントロジー連携や「Zero Ops」、LTAP(Lakehouse Transactional / Analytical Processing)など、数多くの新機能が発表されました。本記事では、その中でも個人的に気になった「Genie Ontology」と「CustomerLake」について、デモやブログで公開されている情報を整理してお伝えします。
Genie Ontology
Genie Ontologyは、Genie One / Genie Agents / Genie Code を支える、自動かつ自己改善型のコンテキストレイヤーです。エージェントのハルシネーションを抑え、ground truthを踏まえた回答を実現するための仕組みとして紹介されました。
コア技術となるのは、信頼できる情報源を特定する「OntoRank」という仕組みです(CEOはダサい名前だとおっしゃっていましたが、私は好きです)。 Google の PageRank に近い考え方で、以下の観点からソースの重み付けを行うと説明されていました。
- 1. 定義はどこから来たか
- 2. そのソースの作成者の相対的な権威性
- 3. どれだけ頻繁に参照されているか
- 4. 認定済み・広く使われているアセットとの結びつきの強さ
- 5. 鮮度(どれだけ新しいか)
これらを評価し、最も重みの大きいソースに基づいて回答する仕組みです。意味的類似度や単一のリンク構造だけに頼るのではなく、複数の指標から、競合する定義の衝突を自動で解決できる点が特徴とされています。
エンタープライズの現場でよくある「定義が乱立して、どれが正しいか分からない」という課題に対するアプローチと言えそうです。
ベンチマークを含めた追検証はまだできていないため、セマンティックレイヤーの新しい形として、引き続き関連セッションを追っていきたいと思います。
CustomerLake
CustomerLakeは、Databricksにネイティブに組み込まれた、新しいエージェント型の顧客データプラットフォーム(CDP)です。
Lakehouseのガバナンス・拡張性・セキュリティを土台に、キャンペーン自動化、アクティベーション、パーソナライゼーションといったCDPの機能をエージェントが実行します。
中心となるのは、2つのエージェント機能です。
(1)プロファイルエージェント:
Databricks内で、生の顧客データを3rd-partyデータも含めて集約し、ビジネス活用が容易な高解像度な顧客レコード(顧客360プロファイル)に統合します。
(2)キャンペーンエージェント:
Unity Catalogによって管理されるデータ(Lakehouse Federationで接続される外部データを含む)を根拠として、顧客のセグメント設計からキャンペーン施策への展開までワンストップで支援するエージェントです。
これらのうち、キャンペーンエージェントについて、Databricksのブースでデモを見せていただきました。
Genie Oneに似たチャット欄から、作成したいキャンペーンを要望します。今回のデモでは、「新しく就航した NYC–リスボン便について、ヨーロッパ行きを検討しているがまだ予約していない層をリターゲティングしたい」という内容を入力します。

キャンペーン案を作成するにあたって必要となる情報(利用チャネルなど)が不足している場合は、エージェント側から確認の質問が返ってきます。
デモでは「このキャンペーンでどのチャネルを使うか」を尋ねられ、Braze・Bloomreach・Iterable といったメール配信基盤や、Meta Ads・Google Ads・LinkedIn Ads といった広告チャネルが候補として提示されました。「Decide for me(エージェントに任せる)」という選択肢も用意されています。

必要な情報が揃うと、キャンペーン案がドラフトとして提示されます。デモで作成されたのは「NYC–Lisbon New Route Retargeting」という90日間のBrazeメールキャンペーンで、サマリには主目的(優先路線の座席稼働率向上)、コンバージョン目標(90日以内にNYC発リスボン着の予約完了)、成功指標(キャンペーン接触に紐づく予約数)、利用チャネル、終了条件などが表形式で整理されていました。

「Build campaign」を押すと、Configure画面でオーディエンス・KPI・アトリビューションウィンドウなどの設定を確認・調整できます。オーディエンス(EWR 発でヨーロッパを検索した層、約4.1万人)やコンバージョン指標(接触後にリスボン便を予約した層、約2,800人)には「Drafted by Genie」と付いており、エージェントが下書きした内容を人が確認・編集する流れになっています。

オーディエンスの定義も確認できました。「直近7日間のWeb検索の出発空港が、NYC_EWR」「検索先がリスボン」「検索回数が1回より多い」「Route Affinityがeurope」といった条件(Qualification)と、「すでに目的地を予約済み」「メール配信を停止している」層を除外する条件(Exclusion)が、ルールベースで組み合わされていました。
SQLを書かずに、属性条件の組み合わせでセグメントを定義できる形になっています。

実際に配信されるメールのプレビューも生成されます。デモでは「Jordan, EWR to Lisbon is now open for booking」という件名で、宛名・路線のおすすめ・おすすめの渡航時期などがパーソナライズされた本文が表示されました。配信は初回(Launch)とリマインド(Reminder)の2通構成で、「予約が確定したら2通目は送らない」「サポートチケットが未解決の顧客には送らない」といった送信ルール(Standard Operating Procedure)も併せて定義されていました。

作成したオーディエンスは、Syncsの画面から LinkedIn Ads・Braze・Meta・Google Ads など、各チャネルへ定期同期できます。デモ環境にはすでに複数の同期ジョブがスケジュール登録されており、CDPとして外部チャネルへのアクティベーションまで一貫して扱えることが示されていました。

また、各オーディエンスにはInsightsのダッシュボードが用意されており、オーディエンスサイズの推移に加えて、チャーンリスクスコア・フライト頻度・チケット単価といった属性のブレイクダウンを確認できます。プロファイルエージェントが整備した顧客360プロファイルが、こうした分析の土台になっていると考えられます。

デモを通して見ると、CustomerLakeは「自然言語での要望 → キャンペーン定義 → オーディエンス・メール生成 → 外部チャネルへの同期」までを一連で扱えるよう設計されていました。各ステップでエージェントが下書きを用意し、人がレビュー・編集する流れになっており、Lakehouseのガバナンスやセキュリティの上で施策を完結させるという狙いが見て取れます。Genie Ontologyと同様、こちらも現時点でデモ・発表ベースの情報に基づいた機能なので、実データでの挙動や運用面に関する動向を引き続き追っていきたいと思います。
おわりに
Day2は、Genie OntologyとCustomerLakeという、エージェントを支えるコンテキスト層と、エージェントが実際に業務を回すアプリケーション層の双方に触れることができた一日でした。
明日以降のセッションでも関連する発表に注目し、レポートしていきます。
最後までお読みいただき、ありがとうございました!