Haruka.K

データエンジニアリング本部
データエンジニア部

Haruka.K 2019年度新卒入社

筑波大学大学院図書館情報メディア研究科修了。DATUM STUDIOではデータエンジニア部に所属し、新卒にして主体的に案件を推進。周囲からの信頼も厚く、Supershipグループで毎年行われるAwardで新卒MVP候補にノミネートされている。現在はクラウド周辺のスキル獲得にも励んでいる。

Haruka.K

短期インターンがきっかけでDATUM STUDIOへ入社

入社前はどのようなことをされていたのですか?

大学生の頃は図書館情報学を学べる学部に所属しており、形態素解析やディープラーニングなどを使って小説を分析する研究を大学院まで行っていました。学部の授業では、図書館運営や目録の作り方などを学んだり、OPAC(オンライン蔵書目録)をプログラミングで作ったりしていました。カリキュラムとしては図書館司書の資格を取ることができる学部ですが、卒業後は図書館司書以外にも多様な業種へ進む人がいましたね。
私が通った大学では図書館情報学の中で専攻が分かれていて、図書館や知識寄りの専攻と、情報学寄りのシステム系専攻がありました。高校時代は文系で、大学までプログラミングに触れたことがありませんでしたが、授業の中で興味を持ち、システム系を専攻しました。当初は司書に興味がありましたが、裏側にある本の情報を貯めるDBやシステムに興味を持った延長で、今に至っています。

DATUM STUDIOに入社したきっかけは何ですか?

就職活動の際に「逆求人」という形で1日に8社くらいと面談する就活イベントがあり、DATUM STUDIOに出会いました。その面談がきっかけで1週間の短期インターンに参加することになり、そこで出た課題が「不動産データをスクレイピングして分析した結果を発表する」というものでした。
作業内容は自由度が高く、何を発表するか、何を求められているのか、を考える作業が楽しかったです。また、プログラミングに詳しい方と協力して作業できる機会もあり、刺激になりました。このインターンでの社内の雰囲気が研究室に近く、働きやすそうに思えたので、入社を志望しました。

現在担当されているプロジェクトや業務内容について教えてください。

今のプロジェクトでは、IT企業でデータパイプラインのマイグレーションを行っています。データパイプラインとは、さまざまな情報源からのデータを加工して蓄積する作業を自動化するものです。大規模な会社の場合、顧客のデータなどが毎日大量に増えていきますが、それを分析できるようにするためにバッチ処理として1日分のデータを加工して蓄積しています。
今回のマイグレーションでは、従来のパイプラインについて調査し、元のデータがどこにあって、どのように加工された上で蓄積されているのかを確認します。そして、従来のパイプラインと同じ動作をする新しいパイプラインの実装や、データが取れているか確認するテストを行っています。
すでにインフラとして動くパイプラインがありますが、データの内容によっては対応できない処理もあるため、追加で実装する場合もあります。このため、サーバーやプログラミング、データベースなどの知識が必要になります。

Haruka.K

さまざまな業務に取り組んだことで引き出しが増えた

入社後、印象に残っているプロジェクトや業務を教えてください。

新卒で入社してから最近まで、同じクライアント様の分析を支援していました。そのプロジェクトは商品の購入予測に関するPoCで、お客様のデモグラフィック属性や商品に関する情報をもとに、営業担当者に予測結果をお伝えしていました。
実際に使用する営業担当者は購入確率だけを見ても納得感がないので、単純に購入確率を提示するのではなく、「こういう特徴があるので購入しやすい」など納得感が得られるような理由を付加するなど、工夫して結果を提示しました。
短期間で多くのテーブル情報を受領し、そこからデータが入っている内容を察して特徴量を作成して予測モデルを構築したことは、スピード感ややりがいがあったため印象に残っています。また、機械学習の結果を使用する状況を考えながら進めることは重要だと感じたプロジェクトでした。

データエンジニアならではのおもしろさを教えてください。

分析業務の中で、「欲しいデータがない」「データの取り方が悪くてマスターしかない」「更新履歴が残っていない」など、蓄積方法があまりよくない場合があります。データエンジニアはデータの構成を考えていくことで、そういった状況を変えていける立場にもあるため、魅力的だと感じています。これまで歯痒い思いをすることが度々あったので、それを変えていきたいです。
DATUM STUDIOでは、世の中に出ていない大量のデータを扱うこともあります。実際に他のメンバーの皆さんが触っているものでは、億単位の件数のデータもあります。分析するときは必要なデータだけを処理しますが、開発フェーズでは溜めている多くのデータに関わるため、データの内容が勉強になることもあります。
また、分析する担当者の立場に立って、実際にデータが使われる場面を想像しながら下準備をすることは楽しいです。どのような集計をするのか、どういった場面でどのようにデータを示していくのかを考えることはお客様のビジネスの未来につながりますし、実際にお礼を言っていただけたときはやりがいを感じます。

Haruka.K

プロジェクトとは別領域の勉強もしながら、幅広い案件へポジティブに取り組む

業務外の時間はどのように過ごしていらっしゃいますか?

私は割とインドアで、小説や技術書を読んだりゲームをしたりと、ゆっくり過ごすことが多いです。また、学びたい気持ちがあるので、案件に関係するかに関わらず、少しだけ勉強をしています。
最近ではGCP(Google Cloud Platform)のProfessional Data Engineerの資格を取得しました。基礎知識を養うことで、全体像が把握しやすくなったと感じています。

あなたが思うDATUM STUDIOで働くメリットを教えてください。

他の会社に比べると、案件や業務の幅が広いのが特徴です。IT系のプロダクトを作っている会社では、たとえばゲーム開発の場合はそれに専念することが多いと思います。しかし、DATUM STUDIOでは業界を問わず多くの案件があるので、さまざまな業務に関わることが可能です。いろいろなデータや環境に触れてみたいと思っている方にとって、DATUM STUDIOで仕事することは大きなメリットになると思います。
案件の幅が広いことに最初は不安もあると思いますが、それをポジティブに考えて、意欲的に学び、習得した技術や知見を生かせる環境だと思います。自社開発で自由にやっているわけではなくお客様の環境で作業をするので、一定の制約がある中で最善の方法を考えることを楽しいと思えるかが重要です。

これからの目標や身につけたいスキルなど、働くうえでの展望を教えてください。

これまでは集計や分析の案件が多かったのですが、その中で手早く正確に業務を行っていくためには、エンジニアリングスキルが重要だと考えるようになり、データを分析して活かす前段階であるデータ基盤の設計や運用により興味を持つようになりました。
また、勉強のために会社の書籍を管理する図書館アプリを作る活動を進めています。データを分析するだけでなく社内の書籍を管理し、貸出をアプリでできるように開発を進めています。

※本記事の掲載内容は、取材当時(2022年3月時点)のものです。

是非、我々と一緒にカオスに
一筋の光を見出す面白さを
体感しませんか?

スタートアップならではの、スピード感・裁量の大きさとエンタープライズの支援による大きなインパクトを生み出せる機会があります

インタビューイメージ