其他教程

其他教程:包含了所有代写案例以及部分答案

  • 支持向量机将向量映射到一个更高维的空间里,在这个空间里成立有一个较大隔断超平面。在分隔数据的超平面的双方建有两个相互平行的超平面,脱离超平面使两个平行超平面的间隔较大化。假定平行超平面间的间隔或差距越大,分类器的总误差越小。 –from  维基百科 支持向量机是成立在VC维理论和风险布局最小的基本之上的; VC维是由统计学理论界说的有关函数集进修机能的一个重要指标。VC维越高问题越巨大。但SVM在办理分类问题的时候,和维数无关(这部门我也有点 恍惚),这使得SVM能很好办理 … 继续阅读“R:支持向量机初探”

    :
  • R语言毗连数据库可以操作数据库的存贮本领和R的计较本领,起到取长补短的结果。之前我们也说过了如安在R中利用SQL,许多课本上也提到了毗连MySQL的要领,可是在安装上还需要留意一些细节问题。以下的办理要领也是在网上放狗加撞墙尝试得出的结论。 一、win平台假如是在windows平台上安装,推荐回收ODBC毗连方法。除了需要安装R和MySQL之外,还要安装RODBC扩展包,以及MySQL的ODBC驱动。下面是详细步调: 1、R下载RODBC包,安装好。2、在http://dev.mysql.com … 继续阅读“R毗连MySQL数据库要领备忘”

    :
  • 本年六月,Springer useR系列新出了一本,Seamless R and C++ Integration with Rcpp, 这大概是的一本Rcpp完整教程。Rcpp险些可以认为是R语言的一个里程碑,而其较大的特点就是那本书标题里的谁人词“Seamless”。R自己 自带了C语言接口,但并不是那么好用,尤其是涉及内存打点的时候,而Rcpp乐成的办理了这个问题,实现了“无缝链接”。 Rcpp作者们 既然说了Rcpp是R语言的一个里程碑,我们先看看Rcpp的作者们,这险些是现有最强大的一个 … 继续阅读“Rcpp的前世此生”

    :
  • R正则表达式常见函数 这一篇文章主要记录R语言中一些正则表达函数。 1.模式匹配查询函数 查询成果的函数主要有grep、grepl、regexpr、gregexpr、regexec,这些函数的主要区别在于其输出功效名目差异,配合点是都包括正则表达式pattern和文本text这两个参数。 1.1grep grep函数是R正则表达中最根基的函数,其参数pattern是待匹配的模式,参数text凡是是向量名目标文本。grep返回功效是一个数值向量,向量内容是pattern在text向量中的索引位置区 … 继续阅读“R正则表达式常见函数”

    :
  • 之前的博客《R数据阐明傍边的化整为零(Split-Apply-Combine)计策》有提到一些关于lapply, sapply, vapply的内容。对付tapply只是粗粗带过。 本日利用tapply的进程中碰着了一个很是令人狐疑的问题,于是不得不仔细研究一下这个tapply。 tapply的利用很简朴,当数据矩阵需要按个中的某一列,(可能几列,很少利用到)的内容来分组,在组内对数据需要利用指定的函数来运算时,就可以利用tapply。举个例子,有数据: a<-data.frame(nam … 继续阅读“关于R傍边的tapply”

    :
  • ReporteRs包可以建设word,ppt,html文档。它可以名目化R的输出:如可编辑的矢量图,巨大的表格陈诉成果,企业模板文档的重用(.docx和.pptx)。它是一个很好的自动化陈诉东西,而且不需要你安装微软的任何产物。本文演示的是如何用它来建造PPT文档。入门建设一个pptx工具通过pptx函数建设的一个R工具可以暗示一个PPT文档。它包括两个参数:标题和模板文件。假如未指定,模板文件在包目次下是一个空文档。每当建设一个pptx工具的时候,你就可以利用一个模板文件。这个文件是从内存中复 … 继续阅读“如何用R来定制本性化PPT”

    :
  • dplyr和data.table是R的两个高效数据处理惩罚包,这两个包有它们各自的利益。dplyr包的语法越发优雅,提供了更易于人类所能领略的自然语言。data.table包的语法简捷,而且只需一行代码就可以完成许多工作。进一步地,data.table在某些环境下执行效率更高(见这里)。在机能和内存受约束的环境,data.table包或者是推荐的R包。关于dplyr和data.table包之间的比拟可以参考StackOverflow和Quora。配景先容在我的数据处理惩罚任务中,我算是利用dpl … 继续阅读“R高效数据处理惩罚包dplyr和data.table,你选哪个?”

    :
  • 在前一段时间的博客中,我表明白为什么你应该把握 R 语言(即便它最终大概过期):http://sharpsightlabs.com/blog/master-r-obsolete/。我写这篇文章是为了向那些声称把握 R 语言挥霍时间的人致辞。(因为它最终会变得过期)。可是当我认为 R 语言最终会变得过期时,这好像引起了惊骇——似乎 R 语言已颠末期了。我想要消除你的惊骇:R 语言仍然很风行。R 语言是已往十年中成长最快的编程语言之一。事实上,假如你开始进修数据科学,我仍然推荐从 R 语言开始。所以 … 继续阅读“R vs Python:R是此刻最好的数据科学语言吗?”

    :
  • R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计较和统计制图的优秀东西。这里的统计计较可以是数据阐明、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。一些读者以为R语言琐屑的对象太多了,无法记着那么多函数和成果,于是就问R语言有没有一种雷同于SAS之EM或SPSS之Modeler的界面化操纵。很幸运,Graham等人特地为“偷懒”的阐明师写了rattle包,通过该包就可以实现界面化操纵的数据阐明、数据挖掘流程。下面就跟各人具体先容一些这款免费的东西: 上图 … 继续阅读“Rattle:数据挖掘的界面化操纵”

    :
  • 一、广州市氛围质量数据先容AQI指数(氛围质量指数)AQI的指数的取值范畴为0~500,个中0~50、51~100、101~200、201~300和大于300,别离对应国度氛围质量尺度中日均值的 I级、II级、III级、IV级和V级尺度的污染物浓度限定命值。I级:氛围质量评估为优,对人体康健无影响;II级:氛围质量评估为良,对人体康健无显著影响;III级:为轻度污染,康健人群呈现刺激症状;IV级:中度污染,康健人群普遍呈现刺激症状;V级:严重污染,康健人群呈现严重刺激症状。氛围质量品级主要污染物 … 继续阅读“用R语言对氛围质量举办可视化阐明”

    :