【Rで使える小技】RでExcel(xlsxファイル)を読み込む方法
今回はRでxlsxファイルを読み込む方法を紹介します。
xlsxファイルはExcel2007から用いられ、現在はEXCELブックファイルの標準拡張子になっています。Rユーザーの方々でもEXCELデータを読み込んでRで分析する機会もあることでしょう。
今回の記事では、xlsxファイルをRで読み込む際に気をつけるべき点についてまとめてみました(Rはversion 4.1.1、統合開発環境であるRStudio(Version 1.4.1717)を使っています。)
RStudioに読み込ませるファイル
下記(売上.xlsx)ファイルを読み込みます。Rコードでの処理用にスクリプトファイルを準備し、同じフォルダにこのデータファイルも保存しています。
商品名 | 売上 |
A | 1000 |
B | 2000 |
C | 1300 |
D | 2500 |
E | 7400 |
F | 10000 |
G | 3000 |
H | 3300 |
I | 6600 |
J | 2800 |
xlsxファイルの読み込み
例えばcsvファイルを読み込む関数は「read.csv(“ファイル名”)」がRのBaseパッケージに標準搭載されています。ではRでxlsxファイルを読み込むための関数にはどんなものがあるのでしょうか?「read.xlsx(“ファイル名”)」というコードで、作業用のカレントディレクトリからの読み込みを実行をしてみます。
X <- read.xlsx("売上.xlsx")
上記コードを実行するとコンソールエリアに以下のエラーが出てしまいます。
Error in read.xlsx(“売上.xlsx”) : could not find function “read.xlsx”
xlsxファイルを読み込む関数「read.xlsx」を使用するためには、必要なRパッケージを追加してインストールしなければなりません。以下の記事を参考にして必要なパッケージの確認をしました(https://oku.edu.mie-u.ac.jp/~okumura/stat/exceldata.html)。
「read.xlsx(“ファイル名”)」というコードでxlsxファイルの読み込みができる関数は、「openxlsx」と「xlsx」の2つのパッケージに搭載されています。
それぞれのパッケージには特徴があります。「openxlsx」はJavaに依存せず使用でき、使用するPC環境にJavaをインストールする必要がありません。もう一方の「xlsx」の場合はPCにJavaインストールが必要で、Rの「rJava」パッケージも併せてインストールします。
今回はJavaをPC環境にインストールしなくても使える点から、「openxlsx」パッケージでのxlsxファイル読み込み手順を見ていきましょう。
以下のコードを入力し、パッケージのインストールを進めます。
install.packages('openxlsx')
コンソールエリアに以下のように表示されればインストール成功です。
次に以下のパッケージを読み込むコードを書くことで、xlsxファイルを読み込む準備ができます。
library(openxlsx)
再度xlsxファイルを読み込むコードを実行しましょう。
X <- read.xlsx("売上.xlsx")
コンソールエリアの出力が以下のようになり、先程のエラーが表示されなくなります。
読み込んだデータXの型確認をstr関数でやってみましょう。
str(X)
データフレーム型で10行2列、各変数は文字列で読み込まれています。
データ先頭の数行をhead関数を使って確認します。
head(X, nrow(X))
head関数はデフォルトでは先頭6行のみ出力されるため、表示されるデータ数として読み込むデータの行数(nrow(X))を引数として追加します。読み込まれたデータが10行のみなのはstr関数の出力から確認できており、10行2列のデータフレームがhead関数の出力として表示されました。
以上によりRでxlsxファイル読み込みができることを確認できました。
まとめ
以上、今回はEXCELファイルからデータをRに読み込む初歩的な知識についてまとめてみました。初歩とは言え、xlsxファイルとcsvファイルとでは読み込む方法が異なります。Rでデータ分析を始める際、この段階で躓いてしまわないようご留意ください。
「openxlsx」パッケージ関する情報は以下のサイトに詳細や関連リンクがまとめられています。必要に応じて参照してみてください。
“openxlsx: Read, Write and Edit xlsx Files”
https://cran.r-project.org/package=openxlsx
DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。