当前位置:天才代写 > tutorial > 其他教程 > R语言阐明空间数据

R语言阐明空间数据

2017-12-04 08:00 星期一 所属: 其他教程 浏览:623

S语言是由AT&T贝尔尝试室开拓的一种用来举办数据摸索、统计阐明、作图的表明型语言。它的富厚的数据范例(向量、数组、列表、工具等)出格有利于实现新的统计较法,其交互式运行方法及强大的图形及交互图形成果使得我们可以利便的摸索数据。

  今朝S语言的实现版本主要是S-PLUS。它基于S语言,并由MathSoft公司的统计科学部进一步完善。作为统计学家及一般研究人员的通用要领东西箱,S-PLUS强调演示图形、摸索性数据阐明、统计要领、开拓新统计东西的计较要领,以及可扩展性。

  S-PLUS可以直接用来举办尺度的统计阐明获得所需功效,可是它的主要的特点是它可以交互地从各个方面去发明数据中的信息,并可以很容易地实现一个新的统计要领。

  S-PLUS有微机版本和事情站版本,它是一个贸易软件。Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开拓了一个R系统,其语法形式与S语言基内情同,但实现差异,两种语言的措施有必然的兼容性。R是一个GPL自由软件,此刻的版本是 1.00版,它比S-PLUS 还少很多成果,但已经具有了很强的实用性。我们在这里只管先容S-PLUS和R都能利用的成果,且以R为主。下面我们用S统称S-PLUS和R。

  参考资料:

  1.S的根基界面是一个交互式呼吁窗口,呼吁提示符是一个大于号,呼吁的功效顿时显示在呼吁下面。S呼吁主要有两种形式:表达式或赋值运算(用<-暗示)。在呼吁提示符后键入一个表达式暗示计较此表达式并显示功效。赋值运算把赋值号右边的值计较出来赋给左边的变量。可以用向上光标键来找回以前运行的呼吁再次运行或修改后再运行。

  2.S是区分巨细写的,所以x和X是差异的名字。

  3.我们用一些例子来看S-PLUS的特点。假设我们已经进入了S-PLUS(或R)的交互式窗口。假如没有打开的图形窗口,在R中,用:

  4.> x11()

  5.在S-PLUS Windows版顶用:

  6.> win.graph()

  7.可以打开一个作图窗口。然后,输入以下语句:

  8.> x1 <- 0:100

  9.> x2 <- x1*2*pi/100

  10.> y <- sin(x2)

  11.> plot(x,y, type=’l’)

  R是用于统计阐明、画图的语言和操尽兴况。R是基于S语言的一个GNU项目,所以也可以看成S语言的一种实现,凡是用S语言编写的代码都可以不作修改的在R情况下运行。R 是统计规模遍及利用的降生于 1980年阁下的 S 语言的一个分支。 S的主要设计者John M. Chambers 因为S语言方面的事情得到了1998年 ACM 软件系统奖(ACM Software Systems Award)。 R可以在多种平台下编译和运行,包罗UNIX (也包罗FreeBSD和Linux)、Windows和MacOS。该语言的语法外貌上雷同 C,但在语义上是函数设计语言的(functional programming language)的变种而且和Lisp 以及 APL有很强的兼容性。出格的是,它答允在“语言上计较”(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模仿和画图很是有用。官方网站: http://www.r-project.org/

  R是主要用于统计阐明、画图的语言和操尽兴况。R原来是由来自新西兰奥克兰大学的Ross Ihaka 和 Robert Gentleman 开拓。(也因此称为 R )此刻由”R开拓焦点团队”认真开拓。R是基于S语言的一个GNU项目,所以也可以看成S语言的一种实现,凡是用S语言编写的代码都可以不作修改的在R情况下运行。R的语法是来自Scheme。R的源代码可自由下载利用,亦有已编译的执行档版本可以下载,可在多种平台下运行,包罗UNIX (也包罗FreeBSD和Linux)、Windows和MacOS。R主要是以呼吁行操纵,同时有人开拓了几种图形用户界面。

  R内建多种统计学及数字阐明成果。R的成果也可以透过安装套件(Packages,用户撰写的成果)加强。因为S的血缘,R比其他统计学或数学专用的编程语言有更强的面向工具(面向工具措施设计)成果。R的另一强项是画图成果,制图具有印刷的质素,也可插手数学标记。固然R主要用于统计阐明可能开拓统计相关的软件,但也有人用作矩阵计较。其阐明速度可比美GNU Octave甚至贸易软件MATLAB。

  R的成果可以或许透过由用户撰写的套件加强。增加的成果有非凡的统计技能、画图成果,以及编程接口和数据输出/输入成果。这些软件包是由R语言、LaTeX、Java及最常用C语言和Fortran撰写。下载的执行档版本会连同一批焦点成果的软件包,而按照CRAN记载有过千种差异的软件包。个中有几款较为常用,譬喻用于经济计量、财经阐明、人文科学研究以及人工智能。

  CRAN为Comprehensive R Archive Network(R综合典藏网)的简称。它除了保藏了R的执行档下载版、源代码和说明文件,也收录了各类用户撰写的软件包。现时,全球有高出一百个CRAN镜像站。

  参看

  SPSS – 另一种统计阐明软件

  Stata – 另一种统计阐明软件

  SAS系统 – 另一种统计阐明软件

  S-PLUS – 同样建基于S语言的统计阐明软件

  但愿越来越多的人喜欢R( http://www.r-project.org/),喜欢R语言中文论坛( http://rbbs.biosino.org/Rbbs/forums/list.page)。下面按照CRAN的先容资料综述一下R阐明空间数据的成果( http://cran.r-project.org/web/views/Spatial.html; http://r-spatial.sourceforge.net/; http://sal.uiuc.edu/csiss/Rgeo//),仅仅是翻译总结资料,有差池的处所请品评指正。

  R阐明空间数据(Spatial Data)的包主要包罗两部门:

  1)导入导出空间数据

  2)阐明空间数据

  成果及函数包:

  1)分类空间数据(Classes for spatial data):

  包sp( http://cran.r-project.org/web/packages/sp/index.ht ml)为差异范例的空间数据设计了差异的类,如:点(points),栅格(grids),线(lines),环(rings),多边形(polygons)。别的sp提供总结数据,获取坐标等成果;提供绘图函数,而且答允在图上添加空间元素(spatial elements)和参考元素(reference elements),如:比例尺(scale bar),指北针(north arrows)等。此刻许多包都操作了sp包中的类,如:rgdal,maptools。

  2)处理惩罚空间数据(Handling spatial data):

  spsurvey包提供做概率抽样的函数( http://cran.r-project.org/web/packages/spsurvey/in dex.html);trip包扩展sp包的类,针对动物跟踪数据( http://cran.r-project.org/web/packages/trip/index. html);hdeco包用品级解析熵较量范例舆图(categorical map)( http://cran.r-project.org/web/packages/hdeco/index .html);GeoXp包答允交互式的阐明空间数据( http://cran.r-project.org/web/packages/GeoXp/index .html)。

  3)读写空间数据(Reading and writing spatial data):

  图像有向量式画图和光栅式两种。Rgdal可以读入和导出GDAL支持的光栅式名目( http://www.gdal.org/)和OGR( http://www.gdal.org/ogr/)支持的向量名目( http://cran.r-project.org/web/packages/rgdal/index .html)。ncdf包用来处理惩罚NetCDF文件( http://cran.r-project.org/web/packages/ncdf/index. html);maps包可毗连一些地理学数据库并展示地理图( http://cran.r-project.org/web/packages/maps/index. html);RArcInfo 包可读取ArcInfo v.7二进制文件和*.e00文件(project.org/web/packages/RArcInfo/index.html);maptools 包揽理和读入地理数据,也为PBSmapping包、spatsta包和sp类提供接口函数( http://cran.r-project.org/web/packages/maptools/in dex.html),还可以通到GSHHS 数据库;classInt包为专题舆图制图选择单变量的类间距( http://cran.r-project.org/web/packages/classInt/in dex.html);gmt包提供R和GMT 画图软件的接口( http://cran.r-project.org/web/packages/gmt/index.h tml)。

  4)点名堂阐明(Point pattern analysis):

  spatstat包做空间点漫衍型态(Spatial Point Patterns)阐明,优点在于模子拟合和仿真( http://cran.r-project.org/web/packages/spatstat/in dex.html);spatgraphs包提供点名堂的可视化图形( http://cran.r-project.org/web/packages/spatgraphs/ index.html);splancs包答允阐明多边形区域,包罗许多种要领,如: 2维核密度( http://cran.r-project.org/web/packages/splancs/ind ex.html);ecespa包提供书”Introduccion al Analisis Espacial de Datos en Ecologia y Ciencias Ambientales: Metodos y Aplicaciones”里用的点名堂阐明函数和数据( http://cran.r-project.org/web/packages/ecespa/inde x.html);aspace包计较空间中心统计(centrographic satistics)和最小凸多边形( http://cran.r-project.org/web/packages/aspace/inde x.html);spatialkernel包做多元数据的非参核密度预计和核回归预计( http://cran.r-project.org/web/packages/spatialkern el/index.html)。

  5)地质统计学(Geostatistics) :

  gstat 包做单变量和多变量地质统计,适合于大的数据集( http://cran.r-project.org/web/packages/gstat/index .html);geoR包(用贝叶斯模子, http://cran.r-project.org/web/packages/geoR/index. html)和geoRglm 包(用线性模子, http://cran.r-project.org/web/packages/geoRglm/ind ex.html)做基于模子的地质统计;fields包也提供很多雷同的函数( http://cran.r-project.org/web/packages/fields/inde x.html);spBayes包用蒙特卡洛一马尔科夫链要领(MCMC)做单变量和多变量的高斯模子( http://cran.r-project.org/web/packages/spBayes/ind ex.html)。

  RandomFields包模仿和阐明随机场( http://cran.r-project.org/web/packages/RandomField s/index.html);tripack包用于犯科则数据的三角丈量法( http://cran.r-project.org/web/packages/tripack/ind ex.html);akima包用于犯科则数据的线性或三次样条插值( http://cran.r-project.org/web/packages/akima/index .html);spatialCovariance包计较矩形数据的空间协方差矩阵( http://cran.r-project.org/web/packages/spatialCova riance/index.html)……。

  6)疾病制图和地域数据阐明(Disease mapping and areal data analysis):

  DCluster包用计数数据探测疾病的空间聚类,计较空间权重,测试空间自相关,成立空间回归模子等( http://cran.r-project.org/web/packages/DCluster/in dex.html);spgwr包做地理加权回归模子,检测平稳性( http://cran.r-project.org/web/packages/spgwr/index .html);spatclus包( http://cran.r-project.org/web/packages/spatclus/in dex.html)。spatclus包探测2维或3维空间点漫衍的任意形状的聚类( http://cran.r-project.org/web/packages/spatclus/in dex.html)。

  7)生态学阐明(Ecological analysis):

  R有许多阐明生态和情况数据的包。如:grasp包用GAM模子 (灰色代数曲线型模子)做情况预报( http://cran.r-project.org/web/packages/grasp/index .html);ade4包用做情况科学里的摸索和欧几里德要领( http://cran.r-project.org/web/packages/ade4/index. html);adehabitat包阐明动物的栖息地选择( http://cran.r-project.org/web/packages/adehabitat/ index.html);pastecs包做时空序列的解析和阐明( http://cran.r-project.org/web/packages/pastecs/ind ex.html);vegan包做群落和植被生态学中的排序要领( http://cran.r-project.org/web/packages/vegan/index .html);WeedMap包做空间预测( http://cran.r-project.org/web/packages/WeedMap/ind ex.html);clustTool包做聚类阐明( http://cran.r-project.org/web/packages/clustTool/i ndex.html)。更多资料见: http://cran.r-project.org/web/views/Environmetrics .html。

  R是一个有着统计阐明成果及强大作图成果的软件系统,是由Ross Ihaka和Robert Gentleman1配合创建。R语言可以看作是由AT&T贝尔尝试室所创的S语言成长出的一种方言1。因此,R等于一种软件也可以说是一种语言。S语言此刻主要内含在由Insightful2公司策划的S-PLUS软件中。R和S在设计理念上存在有着很多差异:关于这方面的具体内容各人可以参考Ihaka & Gentleman (1996) 或R-FAQ3,该文档同时随R一起宣布。

  R是在GNU协议General Public Licence4下免费刊行的,它的开拓及维护此刻则由R开拓焦点小组R Development Core Team详细认真。

  R的安装文件有多种形式,有在Unix 或Linux系统下所需的一些源代码(主要用C及Fortran 编写),及在Windows, Linux及Macintosh上利用的预编

  译二进制码。这些安装文件以及安装说明都可以在Comprehensive R ArchiveNetwork (CRAN)5 网站上下载。该网站提供的关于Linux的安装文件只合用于较新版本的Linux。详情请参考CRAN网站。

  R内含了很多实用的统计阐明及作图函数。作图函数能将发生的图片展示在一个独立的窗口中,并能将之生存为各类形式的文件(jpg, png, bmp, ps,pdf, emf, pictex, x?g; 详细形式取决于操纵系统)。统计阐明的功效也能被直接显示出来,一些中间功效(如P-值,回归系数,残差等)既可生存到专门的文件中,也可以直接用作进一步的阐明。

  在R语言中,利用者可以利用轮回语句来持续阐明多个数据集,也可将多个差异的统计函数团结在一个语句中执行更巨大的阐明。R利用者还可以警惕网上提供的用S编写的大量措施6,并且大大都都能被R直接挪用。

  一些 R 语言的进修资源

  http://www.r-project.org/ R 的官方网站

  http://cran.r-project.org/manuals.html R 官方文档

  http://www.bioconductor.org/ R 在生物学内里的应用, 主要是芯片数据.

  http://www.biosino.org/R/R-doc/ R的一些中文文档

  http://cran.r-project.org/doc/Rnews/ R 的官方杂志. 内里有一些详细问题的 R 例子.

  http://wiki.r-project.org/rwiki/doku.php R 的官方Wiki. 今朝还不足完善, 有一些详细的例子说明.

  http://addictedtor.free.fr/graphiques/ 一个不错R画图的例子网站(点击”Graphics List”, 就可以看到所有 R 图片的列表).

  http://zoonek2.free.fr/UNIX/48_R/all.html R在统计学方面应用最全的一个文档

  http://www.math.csi.cuny.edu/Statistics/R/simpleR/ index.html simpleR 的官方网站,主要用于家产方面的统计阐明

  http://statcomp.ats.ucla.edu/R/ UCLA 的 R 资源列表

  R for Beginners: 一本不错的 R 入门课本,例子较量通俗易懂. (已有中文版)

  simpleR: 我早期看过的一个例子较量多的文档,小我私家推荐。

  Using R for Data Analysis and Graphics – Introduction, Examples and Commentary: 写的通俗易懂,可操纵性强,比 simpleR 略为巨大一点,小我私家推荐。

  An Introduction to R: R 官方文档中面向一般用户的, 内容较全, 大概针对性不强,可以当手册查。 (已有中文版)

  Practical Regression and Anova using R: 用 R 做回归阐明,写得有点涩,需要一些数学功底。(该文档有点老)

 

    关键字:

天才代写-代写联系方式