![](http://img.shujuren.org/pictures/T9/59e92a28e7536.png)
让我们开始吧!
### 第一步:数据获取
数据在那边?如何获取这些数据?
我们可以回收R平台提供的内置数据集,也可以从很多开源的数据集离线下载利用可能在线会见和获取。本文选择经典的[**iris数据集**](https://en.wikipedia.org/wiki/Iris_flower_data_set)。
#### 方法一:R平台内置数据集
R代码
“`
### 内置数据集
data(iris)
iris.data <- iris
View(head(iris.data, 10))
“`
功效
![](http://img.shujuren.org/pictures/B5/59ea84bf4dcf8.png)
#### 方法二:UCI开源数据集在线获取
R代码
“`
### 开源数据集在线获取
iris.url <- "http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
iris.data <- read.csv(url(iris.url),
header = FALSE)
names(iris.data) <- c("Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width", "Species")
head(iris.data, 10)
“`
功效
![](http://img.shujuren.org/pictures/M0/59ea860515ebf.png)
### 第二步:数据领略
数据获取乐成后,就需要对数据做领略了。你需要摸索和可视化数据,而且收集更多与数据相关的**规模常识**。
#### 数据可视化
变量之间的干系,用散点图描写。
Sepal.Length与Sepal.Width的散点图
R代码
“`
library(ggvis)
iris.data %>% ggvis(~Sepal.Length, ~Sepal.Width, fill = ~Species) %>% layer_points()
“`
功效
![](http://img.shujuren.org/pictures/T1/59eab2ce39f37.png)
对付Setosa花
参考资料:
1 https://www.datacamp.com/community/tutorials/machine-learning-in-r
您在阅读中,有什么发起可能想法,请评论。
想插手圈子,请加微信。