其他教程
其他教程:包含了所有代写案例以及部分答案
-
系列以use R for fun为主题,以COS论坛上的英华帖、相关的package以及本身的一些code为素材,团结自身的一些编程体会,从而整合成文。本文是第二篇小应用建造篇。*本文素材出处均已在正文注明本文继承承接上一篇的话题(小游戏开拓篇),继承在交互操纵上做文章,差异的是这里引入了更富厚的操纵和idea,仅仅做些小游戏还远远达不到我们的胃口,因此这里不妨再把思维拓宽些,让R来我们的糊口处事(理论上),于是小应用建造篇就此降生,虽称不上游戏但同样可以给我们带来的快乐。由于面更广因此idea … 继续阅读“use R for fun系列之小应用建造篇”
:
-
ddply()函数位于plyr包,用于对data.frame举办分组统计,与tapply有些雷同 # 利用stringsAsFactors=F来防备data.frame把向量转为factor apache = data.frame(httpCode=c(200,200,200,404,404,500), time=c(100,111,210,10,10,500), api=c(‘index’,’index’,’logout’,’show’,’show’,’index’), stringsAsFa … 继续阅读“R语言利器之ddply”
:
-
1. 数据与模子 我们要利用的数据来自于“MASS”包中的geyser数据。先把数据调出来,看看它长什么样子。 > geyser waiting duration 1 80 4.0166667 2 71 2.1500000 3 & … 继续阅读“R中的极大似然预计”
:
-
在之前的一节傍边,图型名称有些杂乱,从这一节开始将做如下统一(不全面): 英文名称 中文名称 bar 条形图 line 线图 area 面积图 pie 饼图 high-low 坎坷图 pareto 帕累托图 control 节制图 boxplot 箱线图 error bar 误差条图 scatter 散点图 P-P P-P正态概率图 Q-Q Q-Q正态概率图 sequence 序列图 ROC Curve ROC分类结果曲线图 Time Series 时间序列图 好了,言归正传。那么什么又是点柱图 … 继续阅读“R画图基本(二)点柱图(dot histogram)”
:
-
R 是一种机动的编程语言,专为促进摸索性数据阐明、经典统计学测试和高级图形学而设计。R 拥有富厚的、仍在不绝扩大的数据包库,处于统计学、数据阐明和数据挖掘成长的前沿。R 已证明本身是不绝生长的大数据规模的一个有用东西,而且已集成到多个商用包中,好比 IBM SPSS® 和 InfoSphere®,以及 Mathematica。本文提供了一位统计学家Catherine Dalzell对 R 的代价的观点。为什么选择 R?R 可以执行统计。您可以将它视为 SAS Analytic … 继续阅读“做数据阐明必需学R的4个来由”
:
-
观念性的对象就不说那么多了,这次利用主身分阐明主要目标并不是降维,而是阐明城管数据中的事件种别之间是否存在干系,虽然,城管事件范例有好几百,这里就只选取从去年九月到今朝产生量前十的事件种别;如下图,排名前十的事件种别依次为,车辆乱停放,乱堆物料堆,犯科张贴小告白,店肆出店策划,自备容器外放,违规口号宣传品,灵活车乱停放,袒露垃圾,地面不洁,阶梯不洁。 确定好这十个种别后就是数据的提取了,这时候我们要留意一下数据布局,和数据样本量,为什么呢?因为在主身分阐明的时候事件种别只能是属性,也就是说事件种 … 继续阅读“手把手教你利用R语言的主身分阐明对城管事件数据阐明”
:
-
针对微博上的热点事件,你是否想本身动手做个数据阐明?为了简化阐明进程,数据化阐明建造了一个免费开源的R包【https://github.com/sjhfx/rwda】,名字叫rwda,即R Weibo Data Analysis的首字母缩写。本文通过一个案例,先容微博数据阐明的功效和实现要领。1、案例阐明以王宝强2016年8月14日发的仳离声明微博为例,选取最近的评论内容,用R举办数据阐明的功效如下: 可以看出这些评论者大大都是支持王宝强的。从下面的小提琴图来看,该微博评论的男性用户数量略多一些 … 继续阅读“用R阐明王宝强微博事件”
:
-
生物信息学是一门较量新兴学科,并且保罗万象。主要的事情会合于对DNA序列的数据,卵白质氨基酸序列信息举办阐明事情(包罗软件开拓,算法创新等)而对卵白质三维布局的信息的阐明也是个中之一。 由于卵白质的三维布局简直定需要比DNA序列测序,卵白质序列测序更为巨大的尝试完成,因此有关数据会越发稀少,而且各人也都在摸索如何通过测定个中的一些空间布局参数,可以或许实现较准确的预测程度,淘汰尝试耗损,提高方针性。 &n … 继续阅读“操作R的glm函数举办卵白质“热点”氨基酸的模子预测”
:
-
因为大量信息的存在,人们有了排序的需要,因为链接布局的存在,就有了Page Rank排序,也就有了Google。 持久以来,我一直烦恼的一个工作是:如何挑选符合的R包来为我事情。因为cran中包的数量是那么多,即即是同一个任务,也大概有差异人的差异的实现。我称这种选择无力为幸福的烦恼。然而,有时这也并非老是幸福的,因为cran中的包素来以广袤而良莠不齐而著称,假如你选中了一个不靠谱的实现,最终功效你大概倒甘愿本身从头写一个。 一直以来我都依靠着直觉来帮本身作出筛选,如最近的更新时间、更新频率、依 … 继续阅读“Package Rank,假如cran也可以有英雄榜”
:
-
以下,$RHOME都是指代你安装R地址的目次。 R的设置文件,在$RHOME/etc下 Renviron:情况变量与路径设置,多半可顾名思义,主要先容以下两个。 R_LIBS_SITE: 包搜索路径,在R呼吁行下可用.libPaths()显示,; R_LIBS_USER: 用户包目次,假如配置为”~/Rlibs/”,则每个用户在没有全局安装权限时,默认地会把包安装到~/Rlibs/下,无需添加到R_LIBS_SITE也能被搜索到,但在R呼吁行下用.libPaths()不会显示该路径,这样每个用户 … 继续阅读“编写R包C扩展的焦点指引”
: