王老师:19139051760(微信同号)  13333709510
联大   青书学堂   文才   和学   现代兴业   安徽教育在线   超星   弘成   广东开放大学   国家开放大学   上海开放大学   含弘慕课 

教育服务

成人高校
成考录取分数线
我要提升学历
提升学历的理由:
升职加薪、积分落户、考研、公务员考试、子女入学、出国留学


成人高考报名入口

当前位置: 首页 > 国家开放大学系统 > 郑州大学> 国家开放大学大数据预处理复习题
 

输入试题:
本题添加时间:2023/7/2 17:02:00
圆梦客服:王老师  19139051760(微信同号)  19139051760(微信同号)
请写出下方代码的功能
model_all = GradientBoostingClassifier(random_state=0)
model_all.fit(X=train_x, y=train_y)
feature_imp = pd.Series(model_all.feature_importances_,
index=train_x.columns)
var_tree = feature_imp.sort_values(ascending=False).head(8).index
print(feature_imp.sort_values(ascending=False))
print("\n结果为:\n%s" % var_tree.values)

答案是:使用scikit-learn库中的GradientBoostingClassifier()函数,基于训练集train_x和train_y数据,建立GBDT模型model_all,设定随机种子random_state为0。提取model_all的feature_importances属性并保存为feature_imp,它度量的是变量在GBDT模型所包含的所有决策树上的平均重要性。然后根据feature_imp的数值,提取了平均重要性得分较大的前8个变量,其变量名保存在var_tree中。第一句print输出所有变量名称及其重要性,按降序排序。第二句print输出排名前8的变量名称

出自 国家开放大学大数据预处理复习题  国家开放大学系统

郑州大学

更多试题>>>>
1、请写出下方代码的功能 pearson = pd.Series(name="pearson correlation") for i in train_x: pearson[i] = pearsonr(train_y, train
2、请写出下方代码的功能 dt_example = pd.Series("") dt_example[0] = "2020/01/20" dt_example[1] = "2020/02/20" dt_example = pd.to_d
3、请写出下方代码的功能 data_1 = copy.deepcopy(data)
4、请写出下方代码的功能 car_data = pd.read_csv(r"d:cardata.csv",header=0) v1_fill = car_data["v1"].fillna(car_data["v1"].median())
5、请写出下方代码的功能 train, test = train_test_split(data, test_size=0.3)


提升学历-成人高考报名入口 提升学历-成人高考院校名单