- 链接地址:https://blog.csdn.net/MrGeroge/article/details/78737888
- 链接标题:Spark高级数据分析_covtype数据集-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:8051
文章浏览阅读3.9k次。第一章 大数据分析1.数据科学面临的挑战1)数据分析绝大部分工作是数据预处理包括清洗,处理,融合,挖掘以及其他操作,即使模型调优阶段,特征提取和选择上花费的时间比选择和实现算法时间更多2)迭代与数据科学紧密相关,比如模型优化时采用的随机梯度下降和最大似然估计,构建模型时需要选择正确特征,挑选合适算法,运行显著性测试,找到合适超参数3)构建完表现卓越的模型不等于大功告成,模型需要定期_covtype数据集
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:covtype数据集