当前位置:天才代写 > 商科代写,金融经济统计代写-100%原创拿高分 > 数据分析 > 留学cs代考 计算机代考 Python代写

留学cs代考 计算机代考 Python代写

2021-09-25 11:04 星期六 所属: 数据分析 浏览:549

大数据分析A take-home test II

 

留学cs代考 We consider the use of a logistic regression model to predict the probability of default   using income and balance on the Default.csv(请见附件)data set.

1:文件 samgov.csv(请见附件)是一项来自于政府网络问政平台的公众来信,包含 697 封来自不同地区的公众向地方政府的投诉。  留学cs代考

网络问政平台的公众来信是典型的文本资料,可以开展 文本挖掘。请结合“文本挖掘和情感分析”的课堂教学内容,完成下列文本分析任务 (50%)

a)利用R或Python软件对csv的文本资料进行分词、停词和词频统计  留学cs代考

b)基于词频统计结果制作词云

c)利用主题模型法(TopicModel)对csv的文本资料开展分析,分别设定10个及20个主题开展分析,对主题分析的结果进行描述

d)对以上分析结果进行解释,撰写简要的文本资料分析报告,对词频和词云分析结果进行解读,为主题模型探索出的主题命名,并描述其分布及相关关系

留学cs代考
留学cs代考

2:  We consider the use of a logistic regression model to predict the probability of default   using income and balance on the Default.csv(请见附件)data set.  留学cs代考

In particular, we will now compute estimates for the standard errors of the income and balance logistic regression coefficients in two different ways: (1) using the bootstrap, and (2) using the standard formula for computing the standard errors in the glm() function. Do not forget to set a random seed before beginning  your analysis )

a)Usingthe summary() and glm() functions, determine the estimated standard errors for thecoefficients associated with income and balance in a multiple logistic regression model that uses both predictors.

b)Writea function, fn(), that takes as input the Default data set as well as an index of the observations, and that outputs the coefficient estimates for income and balance in the multiple logistic regression model.

c)Use the boot() function together with your fn() function to estimate the standard errors of the logistic regression coefficients for income andbalance.

d)Commenton the estimated standard errors obtained using the glm() function and using your bootstrap function.

留学cs代考
留学cs代考

更多代写:理科计算机代写 金融工程Midterm代考 金融论文代写英国 理科essay代写 加拿大PAPER代写 英国留学paper范文

合作平台:essay代写 论文代写 写手招聘 英国留学生代写

 

天才代写-代写联系方式