INTRO Nav

其他教程

其他教程：包含了所有代写案例以及部分答案

4 Dec 2017

R画图基本（五）文氏图vennDiagram

文氏图是一种非经常用的图示手段，主要用于显示组与组之间重叠的水平。 R傍边可以画文氏图的包有好几个，利用起来各有特点。最原始的东西，来自于2004年的《Venn Diagrams in R》–Duncan J.Murdoch, Journal of Statistical Software. 可是，此刻已经无法找到venn包了。之后利用得较为遍及的有两个东西，一个是LIMMA内嵌的vennDiagram, 另一个是gplots傍边的venn。前者最多可以对3组数据画文氏图，后者可以最多对5组数 … 继续阅读“R画图基本（五）文氏图vennDiagram”

:

4 Dec 2017

SAS与R优缺点接头：从家产界到学界

摘要尽量在家产界照旧被 SAS 所统治，可是 R 在学术界却获得遍及的应用，因为其免费、开源的属性使得用户们可以编写和分享他们本身的应用。然而，很多正在得到数据阐明相关学位的学生们由于缺乏 SAS 履历的环境而在谋事情的路上坚苦重重，与此同时，他们要面临从学校熟悉的 R向 SAS 转型的疾苦。抱负环境是，你需要知道所有大概的编程语言，事情的时候利用与事情环境最匹配的谁人，虽然这个根基上是痴人说梦。我们的目标就是展示这两种差别庞大的语言各自利益，而且配合发挥他们的优势，我们同时还要指出那些不利用 … 继续阅读“SAS与R优缺点接头：从家产界到学界”

:

4 Dec 2017

如安在R中操纵非布局化数据？

先容现代化数据科学中的 DataFrame 观念源起R语言，而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不外在实际的网络数据通讯中，雷同DateFrame这样的名目却并不是主流，真正主流的方法其实是JSON（JavaScript Online Notation），所以接头如那里理惩罚非布局化数据就变得很是有意义了。加之，连年来 Redis、MongoDB、ELK等非布局化数据库的繁荣，MySQL 5.7之后也已经添加了对JSON名目标原生支持（之前可以用 … 继续阅读“如安在R中操纵非布局化数据？”

:

4 Dec 2017

现代分类要领在医学诊断中的应用——基于R的实现

1．引言跟着统计科学的日益成长，其对其他学科的渗透浸染日益加强，数据阐明要领在医学、生物学、社会学等各个学科中获得了遍及的应用，本文试图对收集到的某个临床医学数据运用决定树、神经网络、支持向量机、随机丛林等各类现代分类要领举办阐明，以佐证数据挖掘对其他学科的重要意义；另一方面，就各类现代分类要领的实际结果举办比拟。笔者从网上收集到关于某个脊椎病变的临床医学数据，该数据集为真实果真的非人造数据，发布地点为：http://archive.ics.uci.edu/ml/datasets/Verte … 继续阅读“现代分类要领在医学诊断中的应用——基于R的实现”

:

4 Dec 2017

超过R与C++的桥梁：Rcpp

因为写R扩展的需要，我用Rcpp其实有一阵子了。我一直在强调，把利便和富厚的R情况与系统级语言如C/C++等团结才是适合我现时计较的王道。但R自带的C/C++的API接话柄在是太难用，极端限制人的利用欲望。我试图把它们用最简朴的方法论述过，好比可以看这里和这里。但实际应用中无法因繁就简，照旧制止不了写一大堆反复代码，记一大堆生僻的API。于是Rcpp成了我的救星，出格是前两天进级后，我意外地发明白许多新的特性，固然还没真正利用，但预计会使得我的事情更有效率。把这个包的几篇文档拿来研究了一番，做了 … 继续阅读“超过R与C++的桥梁：Rcpp”

:

4 Dec 2017

实验用animation包来玩GIF动画

谢益辉建设的这个animation包实在是很好玩，上面这个GIF动画就是用lattic包绘制的静态图形构建的。要在R内里玩动画除了要安装animation包之外，还需要安装配套软件。譬喻安装ImageMagick，以利便生成GIF文件。动画生成道理很简朴，根基上就是在saveGIF内里嵌套一些轮回画图的代码，但要留意的是：对付lattice或是ggplot2画图呼吁，最后必然要利用print，否则出不了图。别的要在配置参数内里写清楚ImageMagick的安装路径。library(animati … 继续阅读“实验用animation包来玩GIF动画”

:

4 Dec 2017

R语言中获取果真数据的25种要领

Free Data:Data Source – PackageGoogle Finance historical data – quantmodGoogle Finance balance sheets – quantmodYahoo Finance historical data – quantmodYahoo Finance historical data – tseriesYahoo Finance current options … 继续阅读“R语言中获取果真数据的25种要领”

:

4 Dec 2017

在R语言顶用自助法求统计量置信区间

当样本不切公道论漫衍假设时，求样本统计量的置信区间就成为一个困难。而自助法(Bootstrap)的思路是对原始样本反复抽样发生多个新样本，针对每个样本求取统计量，然后获得它的履历漫衍，再通过求履历漫衍的分位数来获得统计量的置信区间，这种要领不需要对统计量有任何理论漫衍的假设。一般认为，只要样本具有代表性，回收自助法需要的原始样本只要20-30个,反复抽样1000次就能到达满足的功效。在R中举办自助法是操作boot扩展包，其流程如下：编写一个求取统计量的自界说函数将上面的函数放入boot（）函 … 继续阅读“在R语言顶用自助法求统计量置信区间”

:

4 Dec 2017

R语言最好的IDE——RStudio

看到许多的R语言课本，先容的编辑器可能IDE都是很简略的那些，就没有见到有人提到RStudio。对付不利用Emacs的人来说，RStudio真的是一个很好很好的IDE。 http://www.rstudio.org/ 在这里就可以下载了，还支持多平台，windows，Linux，Mac都能用，很是好。虽然，它的好不只是夸平台，尚有许很多多的有点。下面我将具体先容它。下面就是它的主界面。从图上可以看出，它总共有四个事情区域，左上是用来写代码的，左下也可以写代码，同时也是数据输出的处所。（记着， … 继续阅读“R语言最好的IDE——RStudio”

:

4 Dec 2017

R语言与数据挖掘进修条记(3)：数据摸索

在开始一个数据阐明项目之前，都很是有须要相识一下我们的数据，本日晚上主要整理数据摸索方面一些常用的代码：一、先看看数据我们首先要先相识一下数据的尺寸和布局： dim(iris) # 相识数据集的维度，有几多行几多列？ names(iris) # 数据有哪些列？ str(iris) # 数据的布局如何？ attributes(iris) # 数据的列名、行名和数据布局然后看看数据集前几行和后几行长成什么样子： iris[1:5, ] # 看看数据的前5行 head(iris) # 看看数据的 … 继续阅读“R语言与数据挖掘进修条记(3)：数据摸索”

: