其他教程
其他教程:包含了所有代写案例以及部分答案
-
R正则表达式常见函数 这一篇文章主要记录R语言中一些正则表达函数。 1.模式匹配查询函数 查询成果的函数主要有grep、grepl、regexpr、gregexpr、regexec,这些函数的主要区别在于其输出功效名目差异,配合点是都包括正则表达式pattern和文本text这两个参数。 1.1grep grep函数是R正则表达中最根基的函数,其参数pattern是待匹配的模式,参数text凡是是向量名目标文本。grep返回功效是一个数值向量,向量内容是pattern在text向量中的索引位置区 … 继续阅读“R正则表达式常见函数”
:
-
之前的博客《R数据阐明傍边的化整为零(Split-Apply-Combine)计策》有提到一些关于lapply, sapply, vapply的内容。对付tapply只是粗粗带过。 本日利用tapply的进程中碰着了一个很是令人狐疑的问题,于是不得不仔细研究一下这个tapply。 tapply的利用很简朴,当数据矩阵需要按个中的某一列,(可能几列,很少利用到)的内容来分组,在组内对数据需要利用指定的函数来运算时,就可以利用tapply。举个例子,有数据: a<-data.frame(nam … 继续阅读“关于R傍边的tapply”
:
-
ReporteRs包可以建设word,ppt,html文档。它可以名目化R的输出:如可编辑的矢量图,巨大的表格陈诉成果,企业模板文档的重用(.docx和.pptx)。它是一个很好的自动化陈诉东西,而且不需要你安装微软的任何产物。本文演示的是如何用它来建造PPT文档。入门建设一个pptx工具通过pptx函数建设的一个R工具可以暗示一个PPT文档。它包括两个参数:标题和模板文件。假如未指定,模板文件在包目次下是一个空文档。每当建设一个pptx工具的时候,你就可以利用一个模板文件。这个文件是从内存中复 … 继续阅读“如何用R来定制本性化PPT”
:
-
dplyr和data.table是R的两个高效数据处理惩罚包,这两个包有它们各自的利益。dplyr包的语法越发优雅,提供了更易于人类所能领略的自然语言。data.table包的语法简捷,而且只需一行代码就可以完成许多工作。进一步地,data.table在某些环境下执行效率更高(见这里)。在机能和内存受约束的环境,data.table包或者是推荐的R包。关于dplyr和data.table包之间的比拟可以参考StackOverflow和Quora。配景先容在我的数据处理惩罚任务中,我算是利用dpl … 继续阅读“R高效数据处理惩罚包dplyr和data.table,你选哪个?”
:
-
四大常用的数学软件是Matlab(数值计较)、Maple(代数)、Mathematica(代数和数值计较)和Sas(统计),它们都不是免费的。与之对应的免费软件是Scilab(数值计较)、Maxima(代数)和R(统计)。R的绘图有很好的数学公式成果,详细利用是操作text()语句中放入expression表达的数学公式。利用plot等等语句画出图形后,用text()在图形中插手文字,而expression中的语句将会被表明为数学公式。譬喻:plot(1,2) # 在(1,2)处画一个点text … 继续阅读“R语言–plotmath”
:
-
有时候我们要处理惩罚的长短布局化的数据,譬喻网页或是电邮资料,那么就需要用R来抓取所需的字符串,整理为进一步处理惩罚的数据形式。R语言中有一整套可以用来处理惩罚字符的函数,在之前的博文中已经有所涉及。但真正的要用好字符处理惩罚函数,则不得不消到正则表达式。正则表达式(Regular Expression、regexp)是指一种用来描写必然数量文本的模式。纯熟把握正则表达式能使你随心所欲的操纵文原来告竣方针。其实进批改则表达式并没有想像中的那么坚苦。较好要领是从例子开始,然后多操练,多利用。网络上 … 继续阅读“在R语言中利用正则表达式”
:
-
股票阐明中的蜡烛图和技能指标并非什么神奇的对象。指标只不外是已往汗青数据的一种函数。再巨大的函数,其输入变量都是已往已经产生的工作。而已往产生的工作,将来不必然反复。所以在学术界,对付股票价值的走势大多是以带漂移项的随机进程来建模。个中重要的因素就是随机因子对付价值的攻击。假如你用一个蒙特卡罗仿真构建一个虚拟的股票趋势,那些迷信技能阐明的人看到了或者就会跑过来问你这支股票的代码。技能指标固然没什么预测的本领,但技能指标可以汇报我们已经产生的工作,所以有时候需要绘制蜡烛图,大概还需要添加一些自界说 … 继续阅读“如何绘制蜡烛图并添加自界说指标”
:
-
在数据挖掘软件中有五大开源软件,个中weka在海内的利用率较高,而rapidminer却较少看到。就连进修资料也少之又少,只在youtube上能看到一些解说视频。以下的内容就是照葫芦画瓢弄出来的。文本挖掘(text mining)有时也被称为文字探勘、文本数据挖掘等,大抵相当于文字阐明,一般指文本处理惩罚进程中发生高质量的信息。高质量的信息凡是通过度类和预测来发生,如模式识别。文本挖掘凡是要将文本举办断字预处理惩罚,然后操作空间向量模子将文本转换为数值数据,让进修器举办进修。中文的文本挖掘天生就 … 继续阅读“操作rapidminer举办文本挖掘”
:
-
广义线性模子(generalized linear model, GLM)是简朴最小二乘回归(OLS)的扩展,在OLS的假设中,响应变量是持续数值数据且听从正态漫衍,并且响应变量期望值与预测变量之间的干系是线性干系。而广义线性模子则放宽其假设,首先响应变量可以是正整数或分类数据,其漫衍为某指数漫衍族。其次响应变量期望值的函数(毗连函数)与预测变量之间的干系为线性干系。因此在举办GLM建模时,需要指定漫衍范例和毗连函数。在R中凡是利用glm函数结构广义线性模子,个中漫衍参数包罗了binomaial … 继续阅读“再谈广义线性模子”
:
-
这年初,用这些较量冷门的语言就是贫苦呀,我找了这么久,居然没有一篇文章说明该如何用R语言来画一组数据的正态漫衍图的,许多都只是模仿一组持续数据画出图来。本日本身探索了一下,加上网上找的那些对象,整合一下,就出功效来了。 首先,假设我们有这样一组数据w=c(100,99,34,29,95,85,86,95,84,87,58,89,93,90,92,84,75,76, 65,76,87,89,83,82,81,94,95,96,87,89,75,71,71,72,73,75,89,86,89,92, … 继续阅读“用R语言画一组数据的正态漫衍图”
: