当前位置:天才代写 > tutorial > 其他教程 > 在R中利用DataMarket的果真数据源

在R中利用DataMarket的果真数据源

2017-12-04 08:00 星期一 所属: 其他教程 浏览:478

在如今的贸易世界中,各类数据和统计数字长短常重要的决定依据,但精采的数据凡是很可贵到。因为数据来历分手并且名目纷歧,世界各地的阐明人员往往耗费了无数的时间举办数据检索、复制、粘贴和清理。

DataMarket.com是2010年推出的一个数据派别网站,可以一站式会见各类民众和私营部分组织的统计数据和布局化数据。这使得用户很是利便的查找、较量、可视化和下载种种机构的果真数据,如连系国,世界银行,欧盟统计局。时间序列数据还可以与新闻事件相关联,并可以用任何选定的数据名目利用到任那里所。

我们在之前的博文中曾提到过DataMarket的数据源,本文简朴先容一下如何更利便的在R语言中挪用DataMarket数据。


首先安装rdatamarket扩展包并加载

install.packages(‘rdatamarket’)
library(rdatamarket)
然后在Datamarket网站中搜索你需要的数据,譬喻中国的CPI数据,将网址复制下来,再利用dmlist呼吁将其转化为dataframe名目,以利便进一步处理惩罚。

data=dmlist(‘http://datamarket.com/data/set/148w/inflation-consumer-prices-annual#display=line&ds=148w|ga2=v.39.4f’)
head(data)
其功效如下所示:

Country Year Value
1 China 1987 7.219986
2 China 1988 18.736427
3 China 1989 18.333044
4 China 1990 3.058311
5 China 1991 3.543575
6 China 1992 6.340345
数据中默认包括了香港和澳门地域,假如你想单独研究大陆处所也很容易

newdata=split(x=data,f=data$Country)
另一种呼吁dmseries则将原始数据转化为时间序列名目zoo,其利用要领也是雷同的

timedata=dmseries(‘http://datamarket.com/data/set/148w/inflation-consumer-prices-annual#display=line&ds=148w|ga2=v.39.4f’)
假如但愿获取元数据信息则利用dminfo呼吁

info=dminfo(‘http://datamarket.com/data/set/148w/inflation-consumer-prices-annual#display=line&ds=148w|ga2=v.39.4f’)
print(info)
从下面的功效可以看到此数据是由世界银行提供,引用的IMF数据
Title: “Inflation, consumer prices (annual %)”
Provider: “World Bank” (citing “International Monetary Fund, International Financial Statistics and data files.”)
Dimensions:
“Country” (180 values):
“Afghanistan”
“Albania”
“Algeria”
“Angola”
“Antigua and Barbuda”
[…]
 

    关键字:

天才代写-代写联系方式