当前位置:天才代写 > tutorial > 其他教程 > 原创翻译 | 英国当局利用R来建造现代化官方统计陈诉

原创翻译 | 英国当局利用R来建造现代化官方统计陈诉

2017-12-03 08:00 星期日 所属: 其他教程 浏览:603

和所有当局一样,英国当局有义务对官方统计数据以陈诉的形式举办披露。凡是环境下这个进程是完全手工完成的:从当局系统获取数据,在大型机上运行阐明东西举办建模和预测,再将功效导出到办公表格软件以便举办展示,可能利用文档编辑软件将功效汇总为一个统一的最终陈诉。今朝英国当局的统计陈诉建造流程大抵如下:

Uk-old

Matt Upson 是英国当局数据处事部分的一位数据科学家, 正在寻求一种被称之为 可重现阐明管线 的东西使这个流程现代化。 新的流程将基于英国当局关于陈设IT技能的 技能处事指南,利用R这个开源的 统计阐明语言 简化整个流程 — 将数据提取阐明和文档生成自动化。

Uk-new

新的流程正处于开拓进程中,初期方针是实现 文体勾当对英国经济的影响 方面的陈诉:

2006年底我们在文化传媒体育部(DCMS)开始了这个项目,方针是DCMS的经济影响力初期陈诉 (SFR)。今朝阶段的陈诉是手工半手工方法的,我们的目标则是在维持原有的高品质前提下只管加速体例陈诉的速度。

这个流程的焦点部门是利用 Rmarkdown 使陈诉自动化,通过将对数据举办整理阐明制表以及制图的代码整合进一个协作式文档,系统可以以编程的方法生成文档。作为一门完整的语言,R原生的支持所有以上任务,而无需借助其他东西链。并且对付Aqua Book (英国当局拟定的陈诉体例指南)中的指导原则而言,R是一个抱负的统计数据阐明东西。(对任何数据科学家而言,Aqua Book在面向不确定性数据时的优秀设计指导原则,都值得一读。)

不难领略,当局陈诉对数据的揭示形式是有其非凡要求的,而基于R的事情流程也必需在最终陈诉中生成切合要求的图表。GDS 小组已经为此开拓了一个R包,叫 govstyle,可以将所有图表按拟定的设计原则举办调解,并使之更现代化。譬喻下面关于英国粹校缺课率的统计图表:

Uk-chart-old

利用R生成之后则是这个样子: 

Figure1d-1

自动化的事情流程也使得引入现代化的 devops 成为大概。R包的依赖打点则由 packrat 来完成。测试驱动开拓由 testthat 来完成,而自动化测试(包罗数据验证以及代码包围率阐明)则由 Travis CI 提供。源代码打点由 Github 提供,并且整个流程的文档也作为一个R包 eesectors 实现。

要相识更多关于英国当局在官方统计陈诉中R的应用,请参考下篇关于英国当局数字化处事的文章。

 

    关键字:

天才代写-代写联系方式