返回顶部
友情链接

国家开放大学形考任务答案大全《大数据预处理》形考任务1-3答案

0
回复
5192
查看
[复制链接]

5万

主题

5万

帖子

17万

积分

论坛元老

Rank: 8Rank: 8

积分
175139
KevinUnaniLv.8 显示全部楼层 发表于 4 天前 |阅读模式
国家开放大学形考任务答案大全《大数据预处理》形考任务1-3答案

答案咨询:1144766066

答案咨询:1144766066
形考一(实验1、2、3,三选一,权重40%,需辅导教师评阅)实验1:缺失数据处理——实训内容及要求实验目的:1.认识数据中的缺失数据。2.认识缺失值信息,掌握缺失值信息提取的方法。3.掌握缺失值插补的方法。实验内容:1.准备数据和编程环境。2.基于波士顿房价数据集构造缺失值并进行观察3.对两个数据集的缺失值进行概览4.简单统计量补缺程序5.线性回归模型填补程序6.GBDT模型补缺程序实验要求:1.自主将实验数据读入实验环境。2.自主运行示例程序,观察实验结果。3.举一反三,自己尝试对二手车数据集中的其它变量进行缺失值填补。
形考二(实验4、5,二选一,权重30%,需辅导教师评阅)实验目的:1.认识异常值。2.掌握异常值处理方法。实验内容:1.准备数据与编程环境2.客观法(等宽分箱)3.客观法(等频分箱)4.主观法(离散化为二分类变量)5.主观法(离散化为顺序变量)6.分类变量转化为哑变量7.分类变量转化为one-hot码8.顺序变量转换为得分实验要求:1.自主将实验数据读入实验环境。2.自主运行示例程序,观察实验结果。3.举一反三,自己尝试对二手车数据集中的其它变量进行上述操作。
形考三(实验6、7,二选一,权重30%,需辅导教师评阅)实验目的:1.掌握数据特征缩放的方法。实验内容:1.使用未归约数据集训练GBDT模型2.使用未归约数据集训练GBDT模型3.使用相关系数选择变量,并观察效果4.使用方差分析F检验选择变量,并观察效果5.使用树模型选择变量,并观察效果6.使用Lasso算法选择变量,并观察效果7.样本归约,并观察效果实验要求:1.自主将实验数据读入实验环境。2.自主运行示例程序,观察实验结果。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

优好知识网 是一个聚焦知识付费的平台,包括在线教育、文档下载、作业答案、网课答案、考试资料、形考任务答案、行业资料、毕业论文、同时还包括问答平台、资料文库、课件下载等,是一个综合在线学习知识分享交流平台。
  • 官方手机版

  • 微信公众号

  • 商务合作