Snowflake 

Snowflake Summit 2025 最速レポート2日目①
-Platform Keynote編 –

こんにちは、DATUM STUDIOの淡島です。そろそろ時差ボケに苦しめられてきていますね。今日もがんばっていきましょう。
今回は、Snowflake Summit 2025 2日目の朝一に開催されたPlatform Keynoteの模様を紹介したいと思います。

オープニング

AIは私たちの生活に変革をもたらしています。
AI技術は目覚ましい進歩を遂げており、非構造化データから迅速に洞察を得ることや自然言語を用いてデータから有益な情報を抽出することが可能になりました。
しかしながら、AIの導入にあたってはいくつかの課題があります。例えば、AIの導入によって他のビジネスチャンスを逸してしまう可能性や本番環境の導入に時間を要するのではないかという懸念、そして適切なガバナンスが確立されているか、といった点です。
Snowflakeはこれらの課題に真摯に取り組み、AI分野においてもシンプルで連携性があり、信頼できるエコシステムを提供することを目指しています。

▲オープニングの様子

SINGLE UNIFIED PLATFORM

Data + Compute + AIをCross Cloud/Regionで実行していくAppを作っていこうと思っています。
Snowflakeが特に集中したいのは非構造化データの取り扱いです。非構造化の取り扱いにおいてシンプルにしたいと考えています。また、AIについてはState-of-the-Artのモデルをガバナンスが効いた環境で提供することを目指しています。そして、こうした機能についてベンダーロックインを回避するために、 IcebergやApache Polarisに対応していくことが皆さんにとっての柔軟性・選択肢を確保できるようになると考えています。

Cost Management/Adaptive Compute/Simplified Cost

Admin画面上で、組織内でのコスト消費状況について確認できる画面の提供を始めます。
Marriot社より、事例について解説。Snowflakeはデータのスケールには対応できるが、コストのマネジメントが難しいと感じています。
ここでSnowflakeが、Adaptive Computeという機能を追加しました。元々SnowflakeではファイルおよびCompute量に応じてコストを計算していたのですが、そこをシンプルかつ、安価で提供できると思っています。

Horizon Catalog

全てのデータガバナンスのために、データに関する全ての情報をカタログとして管理・閲覧できる機能を追加します。認証に関しても悪質なアクセス元IPの遮断などが実行できるようになりました。また、こうしたカタログの対象をSnowflakeに閉じることなくPostgresSQLなどのデータソース、TableauなどのBIツール、dbt™などのリネージツールに対しても実行できるようにする予定です。こうした取り組みを通じてデータのサイロ化を回避します。

Snowflake Openflow

Apache Nifiによって構築されているOpenflowに対して、Oracleとの連携を新たに追加しました。
こうした取り組みによって、Snowflakeに対してリアルタイムでデータ連携を様々なデータソースから実行することができます。他にも、非構造化データの取り込みからCortexの適用までを実行するFlowを構築することもできるようになります。
具体的な事例としてアストラゼネカ社では、従来の2倍の速度かつ、約30%のコストダウンを実現することができました。

デモでは実際に用意されているConnectorをもとに、Openflowによってデータ取り込みを即座に実行できることを確認できました。特にCDCに基づくデータ取り込みについては、元々Snowflakeでは難しかったところがあったと感じていたので素晴らしいと思いました。

dbt project on Snowflake

dbt projectをSnowflake上で導入できる機能を開発予定です。加えてdbt labとの提携により、最近開発されたdbt fusionエンジンをSnowflake上で統合することを決定しました。
デモでは、Openflowで取り込んだデータをSnowflake内のdbt projectをworkspace上で実行できるように動作させていました。
これにより、OpenflowでETL処理をdbt projectとして実行するフルマネージドなエンジンを、Snowflake上でInterfaceを管理できるようになりました。

Snowflake Postgres

Snowflake上でTransactionテーブルを取り扱うために、Postgresエンジンを導入する予定となっています。元々Hybridテーブルで想定されていたtransaction向けテーブルを、よりエンタープライズに向けて利用可能にしたいと考えられているのかな、と感じました。

GEN2 Warehouse

Warehouseの計算速度をAnalytic Workloadsの2.1倍に、マネージドなSparkの1.9倍に高速化することができたそうです。

AI-Ready Data

企業において自分たちのデータをどのようにAIに活用させたらいいのか、という問題に対してSemantic Viewによって取り組めるようにしています。こうしたSemantic ViewはCortex Analystと統合できています。Cortex Analystについては非常に便利なのですが、もう少し価格が安いとうれしいなぁと思っています。他にも、Knowledge Extensionによってデータ拡張を実行できるようになったそうです。

Snowflake Intelligence

Snowflake Intelligenceは、 Google のNotebookLMに類似した機能なのかなと考えています。推察ですが、内部的にRAGを実行してかつ、マーケットプレイスに用意されたToolsとの連携によってエージェント機能を内包することも可能になるチャットツールという印象を受けました。

まとめ・感想

2日目のPlatform Keynoteにおいても、様々な新機能が発表されました!
個人的に気になっているものは
1. Horizon Catalog
2. Snowflake Openflow
3. dbt project on Snowflake
4. AI-Ready Data

あたりでしょうか。Horizon Catalogではメタデータ活用を、Openflowとdbt projectではAirflowを、そしてAI-Ready Dataではセマンティックを本格的にSnowflake上で実行するんだという意気込みが伝わってきますね。
今後もSnowflakeに注目していきたいと思います。

このページをシェアする:



DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。