数据分析课程设计要求
数据分析课程作业代写 独立思考,独立完成:可以每人任选一题,也可组队(最多两人一对)。2、按照课程设计的具体要求建立的数学模型,每个模型的建立要求按照如下几个内容认真完成;描述性统计与探索型数据分析对主要的研究变量进行单变量分析,了解每个变量的情况;两变量之间情况分析
一、题目: 数据分析课程作业代写
1、沿海城市经济实力问题(主成分和因子分析)
2、房价预测(回归分析)
3、植物分类问题(判别分析)
4、MNIST数据集的聚类分析
5、SP500股票数据的时间序列分析
二、要求: 数据分析课程作业代写
二、课程设计的基本要求
1、独立思考,独立完成:可以每人任选一题,也可组队(最多两人一对)。
2、按照课程设计的具体要求建立的数学模型,每个模型的建立要求按照如下几个内容认真完成;其中包括:
a)描述性统计与探索型数据分析
对主要的研究变量进行单变量分析,了解每个变量的情况;两变量之间情况分析。
b)数据收集及数据清洗
在此说明每个数据的来源,数据质量及数据清洗(缺失值、异常值、错误值,数据去重)
c)模型建立
各个模型建立的软件实现过程(可放在附录中),对每个题目要有相应的建模分析过程。
建模分析过程要按照写建模的规则来进行。要结构清晰,如果解释变量比较多的应该给出相应的主成分分析或因子分析来降维从而得到用较少的变量来分析结果变量的目的,重点部分要加上清晰的降维原因。
d)模型检验
测试数据,测试输出的结果,模型的可靠性分析,相应的系数和残差检验时存在问题的思考(问题是哪些?问题如何解决?),模型的改进设想等。
e) 模型应用
3、每人实现的结果必须进行检查和演示;数据来源和模型建立的说明文件必须上交,作为考核内容的一部分;(上交时每人交一份打印文件及电子版,电子版文件的取名规则为:“学号 姓名”,如“11207210188 张丽”,该文件夹下至少要包括全部数据分析过程和必要的相关文件,按班级统一打包上交。 数据分析课程作业代写
4、课程设计报告要对模型的特点及结构进行说明。报告格式参照(报告示例)。
5、报告提交
时间:第19周周日之前,迟交无成绩。
形式:课程设计报告(要求书写课程设计报告)
6、文字表述的规范性:论述有条理,层次清晰,文笔流畅,论证有力,图表附件格式引文合理、正确,参考文献规范。
三、提交的文档:
课程设计报告;SPSS代码;数据集;
四、部分题目功能及要求 数据分析课程作业代写
- 沿海经济实力问题(需要在地方统计局的年鉴上下载数据)
综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社会中的地位和影响力。讨论沿海城市综合经济实力受哪些因素的影响,建立模型。根据分析的结果,写一份报告,提出具体建议。城市数目自己拟定,不少于五个。
2.房价预测
显然每个住宅房屋可以有多个解释变量来描述,根据住宅的描述,做回归分析来预测住宅的价格。
可以直接在kaggle_house price 上做回归分析,下载地址是:
https://pan.baidu.com/s/1bKHt-Z2hfLnU36fWGvdiTQ?errno=0&errmsg=Auth%20Login%20Sucess&&bduss=&ssnerror=0&traceid=。
有兴趣,也可以自己收集我们国内的数据做回归分析。 数据分析课程作业代写
- 植物分类问题
数据是叶子的特征数据集,包含了99种,见下图:
下载地址(https://www.kaggle.com/c/leaf-classification/data)
可以任选两种,或多种做判别分析。给出测试集上的预测结果,错误率越低说明模型效果越好。
4. MNIST数据集的聚类分析
MNIST数据很多地方可以下载。它是手写的数字1-10的图片特征集。这里不需要你做分类,而是要求你做聚类分析。给出聚类的结果,比如当前的数字是1的,被正确聚成一类的比率。
5.SP500股票数据的时间序列分析
下载地址:https://www.kaggle.com/camnugent/sandp500
该数据集给出了最近五年S&P index上500家公司的股票交易价格,包括开盘,最低之类的数据特征,请结合你所学的时间序列分析知识,对股票的价格进行预测,揭示股价的规律。
其他代写:代写CS C++代写 java代写 matlab代写 web代写 app代写 作业代写 物理代写 数学代写 考试助攻 paper代写 数据分析代写 金融经济统计代写 python代写