【Rで使える小技】RでExcel(xlsxファイル)を読み込む方法
こんにちは。データ事業2部の友利です。
今回はRでxlsxファイルを読み込む方法を紹介します。
xlsxファイルはExcel2007から用いられていますが、xlsxファイルをRで読み込む場合には少々手を焼くのではないかと思い、今回の記事でまとめてみたいと思います。
なお、データの読み込みにはRの統合開発環境であるRStudioを使っていきます。
RStudioに読み込ませるファイル
下記(売上.xlsx)ファイルを読み込みます。
商品名 | 売上 |
A | 1000 |
B | 2000 |
C | 1300 |
D | 2500 |
E | 7400 |
F | 10000 |
G | 3000 |
H | 3300 |
I | 6600 |
J | 2800 |
xlsxファイルの読み込み
csvファイルを読み込む場合は「read.csv(“ファイル名”)」とコードを入力するため、今回のようなxlsxファイルを読み込む場合には下記のように「read.xlsx(“ファイル名”)」というコードを入力しがちです。
1 |
X <- read.xlsx("売上.xlsx") |
しかし、上記コードを実行するとコンソールエリアに
Error in read.xlsx(“売上.xlsx”) : could not find function “read.xlsx”
というエラーが出てしまいます。
read.xlsxで検索してみましょう。
エクセルの読み込み方をまとめたウェブページ(https://oku.edu.mie-u.ac.jp/~okumura/stat/exceldata.html)が見つかります。
関数read.xlsx()を利用するためには、「openxlsx」というパッケージをインストールする必要があるようです。
以下のコードを入力し、インストールを進めます。
1 |
install.packages('openxlsx') |
コンソールエリアに
package ‘openxlsx’ successfully unpacked and MD5 sums checked
と表示されればインストール成功です。
次に
1 |
library(openxlsx) |
とコードを書くことでxlsxファイルを読み込む準備ができます。
再度xlsxファイルを読み込むコードを入力しましょう。
1 |
X <- read.xlsx("売上.xlsx") |
先程のエラーが表示されなくなります。
では、本当にファイルを読み込むことができたかどうかを確認してみましょう。確認するには先頭行のみを確認できるhead関数がおすすめです。
1 |
head(X) |
とコードを書き、実行すると先頭から6行分のデータを確認できます。
これでRでxlsxファイルを読み込むことができました。
まとめ
以上、今回はデータを読み込むという初歩的な知識ですが、xlsxファイルはcsvファイルと読み込む方法が異なります。
Rでデータ分析を始める際にはこの段階で躓いてしまわないようご留意ください。
DATUM STUDIOは、クライアントの事業成長と経営課題解決を最適な形でサポートする、データ・ビジネスパートナーです。
データ分析の分野でお客様に最適なソリューションをご提供します。まずはご相談ください。