Snowflake 

Snowflake SUMMIT 2023 最速レポ(3日目)

こんにちは!DATUM STUDIOの向井です。
昨日に引き続き、Snowflake SUMMIT の3日目レポートをお送りします!

ビルダーキーノート

朝は、開発者向けのキーノートが開催されました!主に2日目の内容のデモがメインとなります。
はじめにnative appのアーキテクチャについて説明がありました。その後、ブースでデプロイの様子を見せてもらったのですが、native appは以下の要素から成り立っているそうです。

  • ・streamlitの画面
  • ・udf
  • ・procedure
  • ・セットアップスクリプト(SQL文)
  • ・その他設定ファイル

もはやwebアプリと変わらないくらい、作り込むことができそうな気配を感じます!

デモに関してはTasty Bytesという、架空の企業をモチーフにした形で進んで行きました。

課題として挙げられたのは

  • ・可視化に関して、バッチ処理で十分なチームとリアルタイムに分析をしたいチームがある
  • ・MLのコードをきちんと書くチームがあれば、分析のみを行うチームもいる(当然扱う言語も異なる)
  • ・可視化まで、非常に時間がかかっている

などの実際にもありそうな課題が山積している状態です。これらをSnowflakeの新機能を用いて解決していく様です!

はじめにstreaming対応として、kafka connectorで流れてくるストリームデータをDynamic tableで定期的に取り込みを行う様子がデモされました!

次は、機械学習を行う前処理としてSnowparkのデモがありました。
従来のpandasを使った処理をSnowparkで置き換えて、2億行の処理をたったの1秒で終えていました!(ウェアハウスサイズはXL)

次にML関数の紹介がありました。create snowflake.ml.stateful_forecast という構文で、簡単に予測を行うことができていました。

Snowsightから簡単にプロットを行うことができ、結果もかなりそれらしいものになっていました。

最後にstreamlitでの可視化が行われました。
最も素晴らしいと感じた点は、streamlit側でデータの編集ができ、再予測ができることです。

右下の方に「update prices」というボタンがあるのがわかるでしょうか。
こちらは商品の価格を更新するためのボタンで、未来の日付の商品価格を編集することで、売り上げの再予測を行うことができます。

最後に実際に似たような構築を行っているDTCCさんの事例紹介がありました。

ストリーミングからML、可視化とすべてをSnowflake上で行っており、未来を感じさせる発表でした!

What’s New: App Dev with Snowpark Container Services and Snowflake Native Apps

こちらのセッションは、Snowpark Container Serviceの深掘りをするセッションでした。 最初に、Snowpark Containerとnative app frameworkの紹介がありました。

次に、実際の活用事例としてamplitudeのnative appが紹介されました。 動画のため写真が撮れなかったのですが、カスタマージャーニーなどの顧客分析をコーディングなしで行っている様子がデモされました!

What’s New: Snowflake Native App Framework

こちらはNative appの紹介のリピート講演でした。はじめに、Native App Frameworkの簡単な振り返りがありました。

appの紹介がされていましたが、AirbyteもSnowflakeで動かせるようになるようです。

開発方法やmarketplaceでの利用方法の紹介の後、事例紹介としてキーノートでも登場したDTCCの事例紹介がありました。実際に動いている画面も見ることができたので、とてもイメージしやすいですね!データはそれぞれの部署ごとで、画面の構成だけを共通化していたので、分析のサイロ化を防ぐことに対して、とても効果的な印象でした。

Best Practices for Snowflake’s Native Data Governance Capabilities

1.Know Your Databr
 ・どれが個人情報か
 ・誰が個人情報にアクセスしているか
2.Protect Your Data
 ・masking policyやrow acces policyの適用
 ・カラムが個人情報を含むかどうかの分類
3.Connect Your Ecosystem
 ・functional roleやuserへの適用

を挙げており、それぞれの手順が紹介されました。

roleの設計では、個人情報にアクセスするための権限としてgovernance roleを定義します。

総じてかなり細かく網羅的に作業を行う必要があると感じ、改めてこれまで行ってきたことを見返そうと、身の引き締まる思いでした。

まとめ

明日は全体的にセッション開催の間隔に余裕があるので、ブース展示や会場の様子についてもレポートしたいと思います。また、Andrew Ngを迎えたパネルディスカッションも必見です!
明日のレポートもお楽しみに!

Snowflake SUMMIT 2023最速レポ1日目の記事はこちら
Snowflake SUMMIT 2023最速レポ2日目その①の記事はこちら
Snowflake SUMMIT 2023最速レポ2日目その②の記事はこちら

このページをシェアする:



DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。