将数据导入R非常简单。对于Stata和Systat,请使用外部软件包。对于SPSS和SAS,我会推荐使用Hmisc软件包来简化和实现功能。有关获取和安装这些软件包的信息,请参阅软件包上的Quick-R部分。下面提供了导入数据的示例。
从逗号分隔的文本文件
# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems
mydata <- read.table("c:/mydata.csv", header=TRUE,
sep=",", row.names="id")
(要练习导入csv文件,请尝试此练习。)
从Excel中
读取Excel文件的最佳方法之一是将其导出到逗号分隔文件并使用上述方法导入它。或者,您可以使用xlsx 包来访问Excel文件。第一行应该包含变量/列名称。
# read in the first worksheet from the workbook myexcel.xlsx
# first row contains variable names
library(xlsx)
mydata <- read.xlsx("c:/myexcel.xlsx", 1)
# read in the worksheet named mysheet
mydata <- read.xlsx("c:/myexcel.xlsx", sheetName = "mysheet")
(要练习,请尝试将Excel工作表导入R.)
来自SPSS
# save SPSS dataset in trasport format
get file='c:\mydata.sav'.
export outfile='c:\mydata.por'.
# in R
library(Hmisc)
mydata <- spss.get("c:/mydata.por", use.value.labels=TRUE)
# last option converts value labels to R factors
(要练习用外来包导入SPSS数据,请尝试此练习。)
来自SAS
# save SAS dataset in trasport format
libname out xport 'c:/mydata.xpt';
data out.mydata;
set sasuser.mydata;
run;
# in R
library(Hmisc)
mydata <- sasxport.get("c:/mydata.xpt")
# character variables are converted to R factors
来自Stata
# input Stata file
library(foreign)
mydata <- read.dta("c:/mydata.dta")
(要练习用外来包导入Stata数据,请尝试此练习。)
从systat
# input Systat file
library(foreign)
mydata <- read.systat("c:/mydata.dta")
走得更远
试试这个交互式课程:在R中导入数据(第1部分),在R中使用csv和xlsx文件。要使用SAS,Stata和其他格式,请尝试第2部分。