毎回超満員!噂のR勉強会に行ってみた(第49回TokyoR参加レポート)
データ分析に関わったことがある人ならば, R という言葉を聞いたことがあるだろう。R とは,データ分析を行うためのプログラミング言語と実行環境だ。筆者の所属する DATUM STUDIO 株式会社でも R を用いたデータ分析を日常的に行っている。 R は聞いたことがあるが,周りに使ったことがある人がいない,難しそう,といった理由で,なかなか使い始めるに至らない初心者も多いのではなかと思う。あるいは R は使っているが,より有効に利用するにはどうすれば良いのか,自分のやっているデータ分析は正しいのだろうかと悩むユーザーもいるのではなかろうか。 そんな人達にオススメなのが,各地で有志によって運営されている R の勉強会である。勉強会には初心者から上級者までが集まり,実務で R をどのように活かしているか,あるいはどのように活かすべきか,といった議論が活発に行われる。 2015 年 7 月 19 日 (土) に, R の勉強会のひとつである「第49回R勉強会@東京(#TokyoR)」 (以下 Tokyo.R) が開催された。筆者も R のスキルアップのために,本イベントに参加したので,ここに報告しよう。Tokyo.R は 3 部構成だ。
- ひとつ目は,初心者を主な対象者として, R についての基礎について学ぶ初心者セッション
- ふたつ目は, R にある程度触れたことがあるユーザーを対象として,より実務よりな内容について学ぶ応用セッション
- そして最後に, R に関するなんらかのトピックを 5 分間という短い時間で紹介するライトニングトークセッション,通称 LT である。
それぞれのセッションからいくつかピックアップして内容を紹介する。 まず初心者セッションからは「はじめての R」だ。
発表者は最近出版された『みんなの R』の翻訳者のひとりだ。余談であるが,彼のご厚意により勉強会の最後にジャンケン大会で勝ち残った五名を対象に本書が献本された。総勢 80 名近くの参加者から,幸運にも筆者は勝ち残ることができ,本書をいただいた。初心者から中級者に向けて R の全体をつかむことができる良書であるので, R を勉強したい人はぜひとも購入しよう。 閑話休題,本発表の内容に戻ろう。本発表では R の開発環境である RStudio のインストールにはじまり, R の重要なデータ構造であるデータフレームの扱いについての解説が内容の多くを占めた。データ分析を行うプロセスの中でもデータの変形や集計といった操作は基本であるため,この発表により R に不慣れなユーザーが, R を使ってデータを扱って何かすることができるという感覚を養うことができるだろう。 次に応用セッションからは「Rで始める☆文字列処理」を紹介する。
プログラミング経験の浅い人は意外に思うかもしれないが,プログラミングで文字列 (単語や文章) を扱うのは難しい。さらに日本語を扱うとなると,文字化け問題とぶつかることも日常的だ。だからといって,データ分析を扱う上で文字列処理は避けて通れない。本発表は,そんな文字列処理のつらみを軽減するために, stringr や stringi といったパッケージ (R から利用可能な処理をまとめたもの) が良いという紹介だ。 R で文字列の扱いに困り,手をこまねいている人に対する救いとなるかもしれない。 LT セッションからは「○○でかんたんお部屋探し!」を紹介する。
本発表では,最近なにかと流行の Deep Learning を用いて和式トイレの識別をしようという試みを行っている。仲介業のウェブサイトからトイレの画像を収集し,画像の前処理やラベル付け (取得した画像が和式なのか洋式なのかといった正解を教えることで,未知の画像を識別するためのヒントとすることができる) を行うことで, 86% もの精度で和式トイレを識別することができたという。 LT のため発表時間は 5 分と短いが,データの取得から処理までにかけた苦労は相当なものだろう。発表資料にあるように R を使うことで Deep Learning が簡単に利用できる。 Deep Learning を気軽に試してみたい人にオススメしたい。
最後に全体を通じて筆者のオススメの発表をひとつ紹介したい。「Japan.R 開催のお知らせと R でワンライナー」という LT だ。
前半の内容は, Japan.R に関する報告だ。 Japan.R とは Tokyo.R をはじめとした各地の勉強会が集結した勉強会で,年に一回開催されている。普段は会えないような各地の R ユーザーが集結するイベントなので,ぜひ参加すると良いだろう。 後半の内容は, R を用いたシェルスクリプトを記述しやすくするためのプログラムの紹介だ。 R 単体でデータ操作を行うのではなく, awk のような別のプログラムとの連携を行うことを前提としている。 R はあまり得意ではないので,他のプログラムと共同で作業を行いたいという人にオススメしたい。 以上のように Tokyo.R には R 初心者から中上級者まで興味を持てるような様々な内容の発表がある。筆者も何回も参加しているが,内容が豊富で,毎回どの発表も楽しく聞くことができる。 R を始めてみたい人や,すでに R を使っている人は,ぜひとも R の勉強会に参加してみると良いだろう。
DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。
Contact
Explore Jobs
関連記事