特牛网址导航

Spark高级数据分析_covtype数据集-CSDN博客

网友收藏
文章浏览阅读3.9k次。第一章 大数据分析1.数据科学面临的挑战1)数据分析绝大部分工作是数据预处理包括清洗,处理,融合,挖掘以及其他操作,即使模型调优阶段,特征提取和选择上花费的时间比选择和实现算法时间更多2)迭代与数据科学紧密相关,比如模型优化时采用的随机梯度下降和最大似然估计,构建模型时需要选择正确特征,挑选合适算法,运行显著性测试,找到合适超参数3)构建完表现卓越的模型不等于大功告成,模型需要定期_covtype数据集
标签:covtype数据集