当前位置:天才代写 > tutorial > 其他教程 > 原创翻译 | 从R转战Python:这些包你必然要知道

原创翻译 | 从R转战Python:这些包你必然要知道

2017-12-03 08:00 星期日 所属: 其他教程 浏览:729

为什么要从R转换到Python?

一个我最喜欢的python的特点是,对付呆板进修来说,Python拥有雷同R社区的所有利益,而且仿效了它最有代价的处所。我十分信仰这样一种概念,就是一种语言只会因为它拥有的库而变得越发有效。因此在这篇文章中,我将会接头我事情中利用R时险些每次城市用到的一些要害包,同时尚有python中与这些要害包相对应的模块。

R包glm,knn,randomForest,e1071 —> Python模块scikit-learn
值得歌咏但也总让人忍不住谩骂的是,R中呆板进修算法被举办支解,然后以各类包的形式存放,这意味着除非具有单个(或一组)可以或许执行一些民众算法的呆板进修库,不然每个算法城市存在单独的包中。看着这些巨大、但又很清楚的算法时感受会有点不错,但当日复一日的在算法之间往返切换时,恐怕就会以为不适了,Python中的scikit-learn模块很好的处理惩罚了这个问题。详细的说,scikit-learn提供了一组常见的ML算法,所有算法都在同一个API下,这使得LogisticRegression和GradientBoostingMachines之间可以直接切换。

R包reshape/reshape2,plyr/dplyr —> Python模块 pandas
这其实是我们文章的第一个主题。Pandas担任了R中数据调动的较好部门,而且把它转酿成一个Python包。该包包罗了python中数据框的实现以及修改和重构数据框的要领。根基上它担任了reshape/reshape2和plyr/dplyr而且python化它。

R包ggplot2—> Python模块 ggplot seaborn bokeh
R今朝仍然比Python做的好的一个部门就是绘图。毫无疑问,R在细节上做的更好。即便如此,Python绘图在非持续图像绘制方面已经成熟。假如你喜欢ggplot气势气魄的语法,那就不消再看Yhat本身的ggplot了;假如你是在深入统计阐明后绘图,那么利用seaborn;假如你是要利用一些平滑、有精采视觉结果的图形,那么利用bokeh。

stringr -> nothing

“Base R”的字符串操纵本领实在是没什么创意,甚至可以说是蠢。每次我需要用R处理惩罚字符串的时候我城市按顺序做以下两件事:

向降生了Hadley Wickham的新西兰致以简短的敬意

import stringr

stringr
不胜谢谢,新西兰

stringr 实在是个神器。它写得很棒,机能也很好(至少我这么认为),并且很利便安装(不要小看这一点,假如人们无法安装你的软件,那么开拓就没有意义)。

好吧关于stringr 的自卖自夸就竣事了。好动静是Python的字符串成果很强大,你甚至不需要一个单独的字符串库!它有超棒的内置正则表达式库,re,和内置的字母串元库,叫string。你太幸运了,Python自带了全部字符串相关的成果!

R包Rstudio —> Python模块 Rodeo
对付很多用户来说,Rstudio是R的同义词。为什么不是呢?对付R中数据阐明来说,它是一款极好的集成开拓情况(IDE)。从汗青角度来讲,对付python中,还没有太多可供选择的IDE。虽然这种环境已经不复存在了。一年前,我们宣布了第一版本的Rodeo,约莫一个月前宣布了合用于Windows、OSX和Linux的2.0版本。
下载Rodeo!

R包Knitr —> Python模块 Jupyter
Knitr是一种利用R建设可重现和高度可视化阐明的好要领。它已经成为Rtudio中一种不变的成果。在Python世界中,最雷同的包是Jupyter。Jupyter条记本提供了一个用于Python编程(和其他语言)的交互式情况,专注于再现和可视化—它甚至有针对付R的插件。

R包SQLdf—> Python模块 pandasql
Sqldf是SQL用户在纯熟操纵数据的伟大的方法。当我第一次开始学R时,我本身用的就是这个包。其时,Yhat实际上建设了雷同的Python包,称为pandasql。沟通的观念:对你的数据框写入SQL查询呼吁,获取数据框!快进三年,pandasql已经在GitHub有高出256个星。对付仅有358行的代码的库来说很不错。

 

    关键字:

天才代写-代写联系方式