王老师:19139051760(微信同号)  13333709510
联大   青书学堂   文才   和学   现代兴业   安徽教育在线   超星   弘成   广东开放大学   国家开放大学   上海开放大学   含弘慕课 

教育服务

成人高校
成考录取分数线
我要提升学历
提升学历的理由:
升职加薪、积分落户、考研、公务员考试、子女入学、出国留学


成人高考报名入口

当前位置: 首页 > 国家开放大学系统 > 郑州大学> 国家开放大学大数据预处理复习题
 

输入试题:
本题添加时间:2023/7/2 16:49:00
圆梦客服:王老师  19139051760(微信同号)  19139051760(微信同号)
简述低频分类数据的特点、形成原因及影响。

答案是:低频分类数据通常呈现出类别众多,并且很多类别仅有几个甚至一个样本的情况。低频分类数据形成原因大致可以分为两种:第一,真实的分类结果中确实存在低频分类。第二,采集数据时格式不规范或错误,从而形成一些频数极小(如仅有一个样本)的类别。过多的低频分类会严重影响建模的效率。

出自 国家开放大学大数据预处理复习题  国家开放大学系统

郑州大学

更多试题>>>>
1、简述数据离散化的操作含义。
2、请简述将变量缩放至区间[-1,1]时,Max-ABS缩放与Min-Max缩放的效果是否相同。
3、请简述使用相关系数选择变量的思想和步骤。
4、简述缺失值填补的思路。
5、请简述异常值的含义。


提升学历-成人高考报名入口 提升学历-成人高考院校名单