其他教程
其他教程:包含了所有代写案例以及部分答案
-
国庆前写了个为GWAS海量数据画曼哈顿图的函数,在后头的测试和利用中有呈现了一点点问题,颠末国庆的尽力后稍作修改,批改了一些bug,主要是在处理惩罚数据时会时不时碰着为NA的数据,所以对此举办了一些预处理惩罚,担保措施安详和正常运行。 函数代码下载 代码如下: mhtObject<-setClass(“mhtObject”,representation(chr=”character”,bp=”numeric”,pval … 继续阅读“R语言 画曼哈顿图”
:
-
写R措施的人,相信城市碰着过“cannot allocate vector of size”可能“无法分派巨细为…的矢量”这样的错误。原因很简朴,根基都是发生一个大矩阵等工具时产生的,最爽性的办理步伐有两种,第一种是加大内存换64位系统,第二种是改变算法制止如此大的工具。第一种步伐,是较好的步伐,不外大工具的需求是没有止尽的,终究不是持久之道。第二种步伐是较好的思路,无论何等大的工具都是可以弄小的,无非就是分而治之、时间换空间等,对算法的研究也是没有止尽的。 进级硬件和改造算法是办理 … 继续阅读“R的内存打点和垃圾清理”
:
-
此刻网络上更为炙手可热的人物恐怕就是NBA新星林书豪(Jeremy Lin)了,可是俗话说:不怕不识货,就怕货比货。这位初生牛犊与其它NBA巨星对比,到底有何等优秀?尚有几多差距?照旧让数字来措辞吧。首先从这里下载2011-2012NBA赛季的球员数据,该数据中共有四百位球员,取得分最多的前一百位球员,将其数据拷贝到Excel中,并将林同学的数据添加在最后,删除了所属球队和排名之后我们获得了一个CSV数据文件。数据中的变量说明附后。第一步:我们先画出这些变量的相干系数图,以剔除一些冗余的变量,从 … 继续阅读“R来阐明林书豪”
:
-
作为一个开源软件,R的一个很是大的利益就是我们可以随意查察所有算法的源代码,在对这些源代码举办阐明的进程中不只可以加深对算法的认识,并且可以大步提高对R语言的把握水平。所以接下来我重点写点关于各统计要领的R语言源代码的表明。本日先对如何查察源代码做点先容。 最直接的要领虽然是直接键入函数,大部门函数源代码就可以直接显现出来 > fivenumfunction (x, na.rm = TRUE) { xna <- is.na(x)  … 继续阅读“R如何查察各函数的源代码”
:
-
#*************网页爬虫-R语言实现,函数库文件*******##****作者:oldlee11***************************************##****版本:v0.1*******************************************##****时间:2012-11-14*************************************#library(XML);#****函数:(crawler1)#****提要:网络抓取的 … 继续阅读“R语言网页爬取函数”
:
-
数据:1 3 9 8 9 80 14 2 7 88 1 22 2131 2 44 9 10 9 10利用矩阵暗示1)向量转化为矩阵c—>matrixtmp_matrix<-matrix(c(1,3,9,8,9,80,1,4,2,7,88,1,22,21,31,2,44,9,10,9,10),nrow=3,ncol=7,byrow=TRUE)tmp_matrix<-matrix(c(1,3,9,8,9,80,1,4,2,7,88,1,22,21,31,2,44,9,10,9,10 … 继续阅读“R语言-数据操纵-矩阵matrix”
:
-
RHadoop实践系列文章 RHadoop实践系列文章,包括了R语言与Hadoop团结举办海量数据阐明。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让宽大的R语言喜好者,有更强大的东西处理惩罚大数据。1G, 10G, 100G, TB,PB 由于大数据所带来的单机机能问题,大概会一去联复返了。 RHadoop实践是一套系列文章,主要包罗”Hadoop情况搭建”,”RHadoop安装与利用”,”R实现MapR … 继续阅读“RHadoop实践系列之三 R实现MapReduce的协同过滤算法”
:
-
R的包(package)凡是有两种: 1 binary package:这种包属于即得即用型(ready-to-use),可是依赖与平台,即Win和Linux平台下差异。 2 Source package: 此类包可以跨平台利用,但用之前需要处理惩罚可能编译(compiled)。 .libPaths():查察包的安装目次 library():查察已经安装的包目次 library(mypackage):载入mypackage包 getOption(“defaultPackages … 继续阅读“Linux安装R语言包(Installing R packages on Linux)”
:
-
需求描写:基于RHadoop通过rmr包实现MapReduce算法: 1. 计较邮箱域呈现了几多次 2. 按次数从大到小排序 譬喻: 163.com,14 sohu.com,2 尝试数据: [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] 370 … 继续阅读“RHadoop尝试 – 统计邮箱呈现次数”
:
-
先是从http://geolite.maxmind.com下载了有关ip信息查询的数据库,下载的csv文件,由于免费的数据库只较准确到都市,这点实在有点惋惜了,因为我们的集群实在是小范畴的利用。 wget http://geolite.maxmind.com/download/geoip/database/GeoLiteCity_CSV/GeoLiteCity-latest.zip unzip GeoLiteCity-latest.zip 这内里有两个文件,一个GeoLiteCit … 继续阅读“用R语言查询ip经纬度及google舆图标注”
: