Snowflake 

Snowflake Summit 2025 最速レポート3日目⑥
-Revolutionizing Data Movement with Snowflake Openflow編-

こんにちは、ちゅらデータの菊地です。
本日もSnowflake Summit 2025の最速レポートをお届けします。
昨日同様、What`Newを中心にセッションを回りつつ、夜は「APJ Partner Reception」に参加してきました。
今回の記事でご紹介する表題のセッションでは「Snowflake Openflow」の紹介、デモ、今後の展望について解説されていました。

▲Snowflake Openflowのイントロダクションスライド

Openflowの紹介

セッションでは Openflowの概要について、以下のように説明されていました。

  • ・「どこからでもどこへでも、データを移動できるムーブメントサービス」である
  • ・従来のETL/ELTツールでは、ソースごとに個別にパイプラインを構築・管理する必要があり、クラウド間やオンプレミスとの連携が複雑化している
  • ・OpenflowはApache NiFiをコネクタSDKとして採用し、Snowflakeと連携することで、すべてのデータフローを統合的に管理・監視できるように設計されている
▲Openflowのアーキテクチャ概要図

また、上記のアーキテクチャ図をもとにOpenflowは以下の要素で構成され、これによりリアルタイムでデータを取り込み・整形・検証し、AI時代の要件を満たす基盤を提供する点が強調されていました。

  • ・Extract/Load/Preprocess/Activate 各フェーズを実行するコンポーネント
  • ・Snowflake上および顧客VPC・オンプレミス環境へのハイブリッド展開
  • ・ガバナンスと監視を一元化

Openflowはバッチ処理やストリーミング、構造化・非構造化データ、マルチモーダルデータなど、さまざまな種類のデータを複数のソースから異なるターゲットへ柔軟に移動できる仕組みであり、例としてSharePointやBox、PostgresからSnowflakeにデータを送ったり、S3上のIcebergに直接書き込むことも可能である点などが紹介されていました。

▲利用可能なコネクタのプレビュー画面
▲Openflowのコネクタカテゴリを示す図

中でも一押しされていると個人的に感じたのが、利用可能なコネクタの多さでした。
投影資料や発表内容から、パブリックプレビュー段階で提供されているコネクタをまとめると以下のようになりました。

  • ・Database:PostgreSQL、MySQL、SQL Serverなど
  • ・Streaming:Apache Kafka、Amazon Kinesis、Pulsarなど
  • ・Unstructured:Box、Google Drive、SharePoint、Slackなど
  • ・SaaS:Google Ads、LinkedIn Ads、Meta Ads、Workdayなど
  • ・Others:Amazon S3、Azure Blob Storage、Azure Data Lake Storage、SFTP、MQTTなど

セッションでは Google Drive コネクタを用いてDrive上のファイルをそのまま取り込みつつ、Cortexによる全文解析とSnowflakeでのAI問い合わせが可能である点と、今後も様々なコネクタの追加を検討している点が強調されていました。

データ連携デモ

▲架空の企業であるAcme Autoのデータ連携フロー

サンプルシナリオとして、架空の企業であるAcme Autoのデータ連携フローが紹介されました。

  1. 1.車両センサー情報をKafkaに送信
  2. 2.販売履歴をPostgreSQLに保管
  3. 3.サービスマニュアルをBoxに保管し、Cortexで全文解析
  4. 4.これらを一つのランタイムでまとめ、Snowflakeに流し込む
  5. 5.Cortexが解析結果をもとにディーラーへ通知
▲ランタイムスケーリングの設定画面

まずはランタイムの作成ですが、写真の通りMIN/MAXノード数の指定が可能であり、自動水平スケーリングが提供されているとのことでした。

また、これによりリソース最適化とコスト削減を実現しつつ、多様なデータソースを効率的に処理できる点が強調されていました。

▲NiFiでのデータフロー設計画面とモニタリング

その後、NiFi UI上で ConsumeKafkaやPutSnowpipeStreamingなどのコネクタを設定し、リアルタイムで処理状況をモニタリングする様子を見せていただきました。

▲Cortexを使用したセンサーデータ解析画面

最後に、実行完了後に出力されたCortexを使用した解析画面を紹介します。
画像右側でチャットベースの問い合わせも行われていました。

一瞬の出来事すぎたので正直言うと置いてけぼりを食らってしまいましたが、裏を返せばここまでの作業を一つのUIかつ、こんな短時間で実現可能ということであり、とんでもない世界が到来してしまったな、と感じた次第です。

今後の展望

▲今後のコネクタロードマップ及び、Oracle社とのパートナーシップ締結

上記画像の内容をまとめると、Openflowでは今後以下の拡張が予定されています。

  • ・SaaS:Zendesk、Shopify、CrowdStrike、Asana、Notion、Zoomなど
  • ・Streaming:ActiveMQ、MQTT、 Google BigQuery など
  • ・Unstructured: Gmail 、Dropbox、Microsoft OneDrive、MongoDB、Oracleなど

また、キーノートでも触れましたが、Oracleとの提携もこのタイミングでも発表され、Openflowを使ってOracleからSnowflakeへのデータ移動が可能になるとのこと!

個人的な話になりますが、Oracle Databaseを扱う仕事に5年ほど従事していたため、この発表は特に目を引かれたのとSnowflakeの未来を想像してかなりワクワクしました。

非常に濃い内容で、今後Openflowから目を逸らすことはできないと感じたセッションでした。

このページをシェアする:



DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。

関連記事