R语言Excel文件

R语言Excel文件

Microsoft Excel是使用最广泛的电子表格程序,它是以.xls.xlsx格式存储数据。 R可以使用某些excel特定的包直接读取这些文件的内容。一些常用的软件包有 - XLConnectxlsxgdata等。在这个篇文章中,我们将使用xlsx软件包。 R也可以使用这个包写入excel文件。

安装xlsx软件包

可以在R控制台中使用以下命令来安装xlsx软件包。它可能会要求安装一些这个包所依赖的附加包。按照相同的命令与所需的包名来安装附加的包。

install.packages("xlsx")

验证并加载“xlsx”软件包

使用以下命令来验证和加载xlsx包。参考以下代码 -

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

当脚本运行时,得到以下输出 -

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

注: 如果第一个输出结果为:FALSE,请 install.packages("xlsx") 语句重新加载安装。

准备xlsx文件用作为输入

打开Microsoft excel。将以下数据复制并粘贴到名为sheet1的工作表中。

id    name      salary    start_date    dept
   Rick      623.3        1/1/2012    IT
   Dan       515.2     9/23/2013   Operations
   Michelle  611        11/15/2014    IT
   Ryan      729        5/11/2014    HR
   Gary      843.25    3/27/2015    Finance
   Nina      578       5/21/2013    IT
   Simon      632.8        7/30/2013    Operations
   Guru      722.5        6/17/2014    Finance

如下所示 -

还将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为city

name     city
Rick     Seattle
Dan      Tampa
Michelle Chicago
Ryan     Seattle
Gary     Houston
Nina     Boston
Simon     Mumbai
Guru     Dallas

如下所示 -

将Excel文件另存为“input.xlsx”,应该将此文件保存在R工作区的当前工作目录中。

读取Excel文件

使用read.xlsx()函数读取input.xlsx,如下所示,结果作为数据帧存储在R环境中。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

当我们执行上述代码时,会产生以下结果 -

  id     name salary start_date       dept
    Rick 623.30 2012-01-01         IT
     Dan 515.20 2013-09-23 Operations
Michelle 611.00 2014-11-15         IT
    Ryan 729.00 2014-05-11         HR
NA     Gary 843.25 2015-03-27    Finance
    Nina 578.00 2013-05-21         IT
   Simon 632.80 2013-07-30 Operations
    Guru 722.50 2014-06-17    Finance